Flitto翻易通是一个为机器学习提供语料库的公司,为自然语言处理提供口语及日常生活类的翻译数据,帮助机器进行学习。目前全球可以出售语料库供机器进行学习的公司大概在15家左右,在中国则只有5家。
我想下班 —— I want to work,Google翻译什么都好就是翻译不好。
Google翻译最初上线时,一句简单的错误翻译,引来了不少用户的调侃,但内行看门道,外行看热闹。这看似轻松的调侃背后隐藏的却是人工智能翻译这一门大生意。
“在中英翻译中,如果使用机器翻译,正确率最高的是高精专用语,最容易出错的反而是日常用语的翻译,例如:我想下班,在英文的语境中,并没有对应词的表达方式,所以Google翻译就会出现错误。这也反应了当机器翻译遇到亚洲日常用语翻译时,人工智能便成了人工智障。”Flitto翻易通中国区总裁黄海在接受腾讯创业采访时说到。
要改善这个问题,则要依靠人工智能中的自然语言处理技术。让机器翻译通过学习大量的日常短语翻译数据,在翻译时触及一句话中的所有词汇,再结合语境完成正确翻译。
而这种能让机器学习的翻译数据,在行业内被称为语料库。
Flitto翻易通便是一个为机器学习提供语料库的公司,其主要致力于“服务”人工智能业务线内的NLP项目,为自然语言处理提供口语及日常生活类的翻译数据,帮助机器进行学习。
目前全球可以出售语料库供机器进行学习的公司大概在15家左右,在中国则只有5家,而在2年之前,这家公司却因资金短缺而濒临退出中国市场。
醉翁之意不在酒
靠给B端翻译养活自己,打的却是收集数据的主意
Flitto翻易通于2012年在英国伦敦的TechStars孵化问世,共有4位创始人,目前融资轮次已经达到B轮,累计获得了1400万美金的融资。
在成立之初,Flitto翻易通便瞄准了机器翻译不够准确的缺陷,主打多对一的众包人工翻译,同时为了避开高精专的专业翻译,翻易通把产品定位放在了碎片化的生活语句翻译上。
除了作为翻译平台为用户链接翻译家,Flitto翻易通将平台内产生的所有数据,进行收集与校对处理。最终将积累到的用户翻译数据,变成了可供机器学习的语料库。经过5年的积累,如今翻易通可供机器学习的语料库,已达到超过1.5亿条的规模。
但在2015年时,Flitto翻易通却并不被投资人看好,一度因为资金问题而濒临解散。
2015年初入中国,Flitto翻易通的众包人工翻译模式便得到了许多同行的认可,许多创业公司纷纷开始进行模仿。
但这些模仿者不知道的是,Flitto翻易通一开始走的虽然是众包翻译、1对1专业翻译的路线。但这一切都是为了能够实时收集用户在日常生活中会遇到的翻译问题,通过收集与整理这些数据形成语料库,向人工智能企业服务才是Flitto翻易通真正的目的。
同时,在商业模式上,Flitto翻易通也并未把对接个人用户的翻译需求当做收入来源。目前,在一笔众包互助翻译的交易中,翻易通只会抽取交易金额的30%,用于支付应用市场付费分成、税金等等费用,基本不在用户身上赚取任何费用。
而能让Flitto翻易通盈利的商业模式主要有两个:1、出售语料库 2、向企业提供各类翻译服务。
在这两种商业模式中,向企业提供翻译服务时,翻易通会更像一家翻译公司,积极响应各类翻译需求。
据Flitto翻易通中国区总裁黄海介绍,目前Flitto翻易通在中国地区的企业翻译服务上,已经服务过科大讯飞、新浪微博、百度地图、联合国网络公开课、中国艺术研究院等企业,在企业服务上的收入已经可以保持公司良性运转。
而作为利润增长点的语料库生意也开始步入正轨,Flitto翻易通已经开始向微软、百度、NAVER、NTT docomo、SYSTRAN等国际公司出售语料库。
那么这样一门看似知识付费,又踩着人工智能风口的生意,是不是人人都能做呢?
时间是一道跨不过去的门槛
语料库的积累看似简单,但处理起来却特别麻烦
在Flitto翻易通中国区总裁黄海看来,语料库这门生意,门槛主要有两个:
1、需要长时间的积累数据
2、从翻译数据到能被机器使用的语言资料,中间需要大量的人力进行校对
在机器翻译中,错误率最高的便是人类生活中碎片化的语言翻译,而可供机器学习的这类语言资料又是目前市场上最为稀缺的资源。
据黄海介绍,生活类的语言翻译,因为场景不同,语言组合不同,翻译的结果便完全不同,而要拥有这种类型的语言资料,不仅需要长时间的积累,还需要不断的收集用户在不同的生活场景下遇到的翻译问题。
同时,在收集到这些信息后,从翻译结果到机器能够学习的语言资料,还需由各国的语言专家团队来进行校对。在校对确保无误后,还要将它修改为可供机器学习的标准语言对资料。才能最终成做为语料库,提供给人工智能产品进行学习。而这类语言专家不仅需要精通2~3门语言,还需要精通对应国家的风土文化。
庞大的人力资源消耗,和需要长时间的数据积累,不仅成为了人工智能公司和其他翻译公司缺少语料库的原因,也让语料库成了目前市场上的稀缺资源。
用户规模小,付费意愿不够高
语料库数据增速不够快,目前还处于亏损状态
不管是从赛道,还是从目前的经营状况来看,Flitto翻易通都算一个发展较为不错的创业公司,但就用户规模上来看,Flitto翻易通却并不像一个成立于2012年的公司。
截至2017年,Flitto翻易通全球注册用户只有800万,在产品中的兼职和全职的翻译家共有160万,在中国地区有50万。
同时,由于Flitto翻易通的语料库增长全部来自于付费用户。用户付费使用众包翻译功能,以提交文字、图片或语音的翻译需求,在采纳了翻译家的译文后,所产生的相关数据才会被语言专家团队进行收集与整理,作为新的语料收入到语料库中。
但由于Flitto翻易通的用户体量较小,付费用户较少,导致其收集语料变得较为缓慢。
在这样的情况下,2017年Flitto翻易通做出了改变,通过与全球成立时间最长的机器翻译公司SYSTRAN进行合作,引入了神经元翻译系统,用免费的机器翻译功能来吸引用户,希望扩大用户体量。通过基量的增加,来换取付费用户的增加,从而收集更多数据。
据Flitto翻易通中国区总裁黄海介绍,翻译与语料库市场上,在2014年全球已经达到370亿美元的规模。随着人工智能需求的激增,加上传统的翻译需求。预计到了2018年,全球市场将达到480亿美元的规模,其中,中国将占到90亿美元。
而目前引入神经元翻译器后,翻易通月均用户增长已经超过20%,盈利方面,韩国公司今年能赚到1,000万美金(目前已赚到600万美金,已经高于年中预期);中国公司预计今年能做到盈亏平衡(2016年赚了516万亏了30万),不排除盈利可能。
相关资讯
最新热门应用
非小号交易平台官网安卓版
其它软件292.97MB
下载币交易所地址
其它软件274.98M
下载iotx交易所app
其它软件14.54 MB
下载zt交易所安卓最新版
其它软件273.2 MB
下载币拓交易所bittok
其它软件288.1 MB
下载u币交易所平台app
其它软件292.97MB
下载热币全球交易所app官网版
其它软件287.27 MB
下载多比交易平台app
其它软件28.28MB
下载币赢交易所app官网安卓版
其它软件14.78MB
下载toncoin币交易所安卓版
其它软件48MB
下载