微软发布第五代小冰, 它都有什么亮点?

发布时间：2017-08-25 浏览数：

8 月 23 日下午，在微软第五代小冰的发布会上，有一个这样的桥段：小冰通过电信网络直接拨通了现场一位媒体观众的手机，在和他说了生日快乐，唱了几句生日歌，又寒暄了几句之后，用“你还在开会很忙吧”，结束了对话。

这种让人工智能像人类一样说话的技术，微软亚洲研究院叫它“全双工语音”，意思是 AI 不再只能在聊天软件里你来我往的交流，现在可以像真人一样，实时的在你说话之后给你一个回复。微软说，小冰的模式不仅是回应你说的话，在你沉默不说话的时候，她也知道要说什么来让话题继续下去。

微软亚洲研究院历来重视小冰发布会，这个研究项目三年半前立项，在发布之初，她被设定成一个 15 岁的少女，可以通过文字的方式和人聊天。如果从一个普通用户的角度来看，几年过去，小冰慢慢可以看懂图片，听懂你发的语音，回复语音，看懂更多的图片和视频，给你唱歌……现在终于可以和人直接聊天。

第五代发布会，小冰展示的最大亮点，是她的“创造”能力。

微软发布第五代小冰, 它都有什么亮点?(1)

小冰以后可以直接拨电话给你

从小冰这段示例语音来看，她每个字直接的连读更像人，句、逗之间的语气听起来有上下文承接，和百度、科大讯飞、苹果的其他语音助手最大的区别是，它能够结合上下文把多音字读出正确的读音。

在一段“龟兔赛跑”的童话朗读语音实例中，只有小冰能没有人工干预的情况下准确识别“生长”和“伸长”中多音字的正确读法，可以认为是小冰具有对中文上下文理解的能力。过去在小冰参加的电视综艺节目里，也可以看到她对自然语言的实时反应。

总得来说，可以认为小冰现在学会了说话。

微软在发布会上宣布，从 9 月开始，小冰开始启用全新的“生成模型”来生成对话。过去，基于大数据和深度学习的模式，实际上全世界“聊天机器人”这个类型的人工智能，他说的每一句话应该都是有另外的用户曾经说过的。微软把这种模式叫“检索模型”。

但“生成模型”不一样。在这个模式下，小冰说的每一句话都有可能是完全生成的。目前，微软小冰和她的不同语言版本在中国大陆、日本、美国和印度已经上线，这个月也开始在印度尼西亚提供服务。微软说，中国、日本、美国和印度的小冰采用了混合模式，也就是大部分回应是检索出来的，小部分是全新生成的，但在印尼投入的新版本完全使用“生成模型”运转，每一句话都是新的。

小冰实时对话之前就出现过。去年，微软已经在发布会上展示了打电话的功能，但这次发布会宣布的是这项功能大规模测试的开始，以后所有普通用户都可以在周三例行更新日的时候跟小冰预约，小冰可以直接把电话打到你的手机上，移动、电信和联通都可以。

关于打电话这个能力，微软还描述了一个令人细思恐极的场景：未来用户在微博上如果对小冰出言不逊，她可能可以直接打电话给你聊一聊。

微软说，小冰以后要从事内容创作

微软在发布会上展示的读童话故事，不仅仅是语音生成能力的展示，似乎也预示着未来小冰的商业模式。

过去几个月，微软已经用小冰来生成童话朗读节目匿名发在蜻蜓 FM 和喜马拉雅电台上累计播放数量约为 30 万，而且从评论里来看，似乎很多听众没有分辨出这个朗读是人工智能生成的。微软说，一本 210 集的《格林童话》有声读物内容大概是 50 小时，人类配音演员需要 200 小时工作时间，成本大约 6 万元。相比之下，小冰只需要 24 分钟，抛开研发之外，运行成本可以忽略不计。

和印花 T 恤衫这种看起来更像是营销的项目相比，有声读物确实更像是一个可行的商业模式。在音乐和电台类应用里，有很多虚构类文艺作品的听书节目，基于听书这种形式，这些节目大部分都是用来休闲和打发时间，人工智能也许可以胜任这种“敷衍”的娱乐。

“现在的智能音箱还不算是人工智能”，微软也不做智能音箱

发布会主持人之一、小冰产品总监彭爽说，语音本身不是智能音箱产品的核心。更不应该逼迫用户去和它说话。

微软将和第三方合作，来研发内置小冰的硬件产品。目前宣布的有小米生态链企业 Yeelight，这家厂商之前做过智能台灯；合作方还有东方明珠，微软说会做一款儿童取向的智能产品，几个月内上市。

目前，小冰 FM 以微信小程序的方式上线。在实际体验里，小冰 FM 确实可以基于合作的咪咕音乐的版权内容不断播放新的节目，比如热门音乐排行榜之类。点击“录音”按钮可以语音互动，告诉她“下一首”，她可以回应“你不喜欢这一首吗？”然后切换新的歌曲。

但小冰 FM 似乎没有视频里展示的那么智能，比如说“我喜欢 XXX 歌手”，得到的回应更可能是“我也喜欢”，而不是换成这位歌手的歌曲。简单的说，小冰 FM 现在还更像那个随便聊天的小冰，而不是一个音乐主播。

还有一个问题来自小冰签约的版权曲库咪咕音乐：如果你恰好问道咪咕音乐没有版权的歌曲，小冰就会开始比较生硬的岔开话题，不幸的是，咪咕音乐缺的歌挺多。

微软想让小冰接触更多人，可似乎用力的方向不大对

微软在推广小冰这件事上做了不少事情，但看起来效果一般。

小冰在东方台《看东方》节目播了很长一段时间的天气预报和客串主持，但视觉形象只有一行字和一个麦克风图标；在北京青年广播和湖南电台音乐之声做过客串主持，但听收音机本来就是一件不再流行的事，更何况是要宣传一个看不到形象的声音。

最近在湖南卫视播出的《我是未来》看上去是小冰形象最突出的一次，节目给她设计了一个虚拟形象，节目的内容也和人工智能关系密切。

相比之下，百度做的人工智能在电视节目《最强大脑》里的表现就要突出很多，不仅给这个人工智能设计了一个实体机器人，还在比赛环节里给它拼命加戏：比如选手和人工智能比赛人脸识别的环节，百度这个机器人也假模假式地看着照片，实际上稍有了解的人就知道，这些数据是直接喂给人工智能的，根本没有所谓“看”的环节。

微软在发布会上说，接下来小冰会参与 CCTV 一档《机智过人》的综艺节目，估计以后 CCTV 的宣传效果会相对好一些。

从微软内部产品来看，它们会把 AI 慢慢加进产品序列。现在 Office 套件中已经集成了很多人工智能的组件，比如对幻灯片实时文字解说和实时翻译的工具，Skype 里面也有人工智能翻译工具等等。

微软执行副总裁沈向洋说，微软的人工智能主要两个路线，一个是围绕现有产品的人工智能化，比如 Windows 和 Office，一个是围绕政府、医疗、交通行业的行业应用，另外还有人工智能伦理方面的前瞻研究。

喜欢这篇文章？去 App 商店搜好奇心日报，每天看点不一样的。