8 月 23 日下午,在微软第五代小冰的发布会上,有一个这样的桥段:小冰通过电信网络直接拨通了现场一位媒体观众的手机,在和他说了生日快乐,唱了几句生日歌,又寒暄了几句之后,用“你还在开会很忙吧”,结束了对话。
这种让人工智能像人类一样说话的技术,微软亚洲研究院叫它“全双工语音”,意思是 AI 不再只能在聊天软件里你来我往的交流,现在可以像真人一样,实时的在你说话之后给你一个回复。微软说,小冰的模式不仅是回应你说的话,在你沉默不说话的时候,她也知道要说什么来让话题继续下去。
微软亚洲研究院历来重视小冰发布会,这个研究项目三年半前立项,在发布之初,她被设定成一个 15 岁的少女,可以通过文字的方式和人聊天。如果从一个普通用户的角度来看,几年过去,小冰慢慢可以看懂图片,听懂你发的语音,回复语音,看懂更多的图片和视频,给你唱歌……现在终于可以和人直接聊天。
第五代发布会,小冰展示的最大亮点,是她的“创造”能力。
小冰以后可以直接拨电话给你
从小冰这段示例语音来看,她每个字直接的连读更像人,句、逗之间的语气听起来有上下文承接,和百度、科大讯飞、苹果的其他语音助手最大的区别是,它能够结合上下文把多音字读出正确的读音。
在一段“龟兔赛跑”的童话朗读语音实例中,只有小冰能没有人工干预的情况下准确识别“生长”和“伸长”中多音字的正确读法,可以认为是小冰具有对中文上下文理解的能力。过去在小冰参加的电视综艺节目里,也可以看到她对自然语言的实时反应。
总得来说,可以认为小冰现在学会了说话。
微软在发布会上宣布,从 9 月开始,小冰开始启用全新的“生成模型”来生成对话。过去,基于大数据和深度学习的模式,实际上全世界“聊天机器人”这个类型的人工智能,他说的每一句话应该都是有另外的用户曾经说过的。微软把这种模式叫“检索模型”。
但“生成模型”不一样。在这个模式下,小冰说的每一句话都有可能是完全生成的。目前,微软小冰和她的不同语言版本在中国大陆、日本、美国和印度已经上线,这个月也开始在印度尼西亚提供服务。微软说,中国、日本、美国和印度的小冰采用了混合模式,也就是大部分回应是检索出来的,小部分是全新生成的,但在印尼投入的新版本完全使用“生成模型”运转,每一句话都是新的。
小冰实时对话之前就出现过。去年,微软已经在发布会上展示了打电话的功能,但这次发布会宣布的是这项功能大规模测试的开始,以后所有普通用户都可以在周三例行更新日的时候跟小冰预约,小冰可以直接把电话打到你的手机上,移动、电信和联通都可以。
关于打电话这个能力,微软还描述了一个令人细思恐极的场景:未来用户在微博上如果对小冰出言不逊,她可能可以直接打电话给你聊一聊。
微软说,小冰以后要从事内容创作
微软在发布会上展示的读童话故事,不仅仅是语音生成能力的展示,似乎也预示着未来小冰的商业模式。
过去几个月,微软已经用小冰来生成童话朗读节目匿名发在蜻蜓 FM 和喜马拉雅电台上累计播放数量约为 30 万,而且从评论里来看,似乎很多听众没有分辨出这个朗读是人工智能生成的。微软说,一本 210 集的《格林童话》有声读物内容大概是 50 小时,人类配音演员需要 200 小时工作时间,成本大约 6 万元。相比之下,小冰只需要 24 分钟,抛开研发之外,运行成本可以忽略不计。
和印花 T 恤衫这种看起来更像是营销的项目相比,有声读物确实更像是一个可行的商业模式。在音乐和电台类应用里,有很多虚构类文艺作品的听书节目,基于听书这种形式,这些节目大部分都是用来休闲和打发时间,人工智能也许可以胜任这种“敷衍”的娱乐。
“现在的智能音箱还不算是人工智能”,微软也不做智能音箱
发布会主持人之一、小冰产品总监彭爽说,语音本身不是智能音箱产品的核心。更不应该逼迫用户去和它说话。
微软将和第三方合作,来研发内置小冰的硬件产品。目前宣布的有小米生态链企业 Yeelight,这家厂商之前做过智能台灯;合作方还有东方明珠,微软说会做一款儿童取向的智能产品,几个月内上市。
目前,小冰 FM 以微信小程序的方式上线。在实际体验里,小冰 FM 确实可以基于合作的咪咕音乐的版权内容不断播放新的节目,比如热门音乐排行榜之类。点击“录音”按钮可以语音互动,告诉她“下一首”,她可以回应“你不喜欢这一首吗?”然后切换新的歌曲。
但小冰 FM 似乎没有视频里展示的那么智能,比如说“我喜欢 XXX 歌手”,得到的回应更可能是“我也喜欢”,而不是换成这位歌手的歌曲。简单的说,小冰 FM 现在还更像那个随便聊天的小冰,而不是一个音乐主播。
还有一个问题来自小冰签约的版权曲库咪咕音乐:如果你恰好问道咪咕音乐没有版权的歌曲,小冰就会开始比较生硬的岔开话题,不幸的是,咪咕音乐缺的歌挺多。
微软想让小冰接触更多人,可似乎用力的方向不大对
微软在推广小冰这件事上做了不少事情,但看起来效果一般。
小冰在东方台《看东方》节目播了很长一段时间的天气预报和客串主持,但视觉形象只有一行字和一个麦克风图标;在北京青年广播和湖南电台音乐之声做过客串主持,但听收音机本来就是一件不再流行的事,更何况是要宣传一个看不到形象的声音。
最近在湖南卫视播出的《我是未来》看上去是小冰形象最突出的一次,节目给她设计了一个虚拟形象,节目的内容也和人工智能关系密切。
相比之下,百度做的人工智能在电视节目《最强大脑》里的表现就要突出很多,不仅给这个人工智能设计了一个实体机器人,还在比赛环节里给它拼命加戏:比如选手和人工智能比赛人脸识别的环节,百度这个机器人也假模假式地看着照片,实际上稍有了解的人就知道,这些数据是直接喂给人工智能的,根本没有所谓“看”的环节。
微软在发布会上说,接下来小冰会参与 CCTV 一档《机智过人》的综艺节目,估计以后 CCTV 的宣传效果会相对好一些。
从微软内部产品来看,它们会把 AI 慢慢加进产品序列。现在 Office 套件中已经集成了很多人工智能的组件,比如对幻灯片实时文字解说和实时翻译的工具,Skype 里面也有人工智能翻译工具等等。
微软执行副总裁沈向洋说,微软的人工智能主要两个路线,一个是围绕现有产品的人工智能化,比如 Windows 和 Office,一个是围绕政府、医疗、交通行业的行业应用,另外还有人工智能伦理方面的前瞻研究。
喜欢这篇文章?去 App 商店搜 好奇心日报 ,每天看点不一样的。
相关资讯
最新热门应用
非小号交易平台官网安卓版
其它软件292.97MB
下载币交易所地址
其它软件274.98M
下载iotx交易所app
其它软件14.54 MB
下载zt交易所安卓最新版
其它软件273.2 MB
下载币拓交易所bittok
其它软件288.1 MB
下载u币交易所平台app
其它软件292.97MB
下载热币全球交易所app官网版
其它软件287.27 MB
下载多比交易平台app
其它软件28.28MB
下载币赢交易所app官网安卓版
其它软件14.78MB
下载toncoin币交易所安卓版
其它软件48MB
下载