系统粉 > IT资讯 > 微软资讯

小娜负责人幺宝刚: 在这场“百箱大战”里, 微软迟到了么?

发布时间:2017-11-13    浏览数:

相比国内外的科技巨头,微软在这场号称“百箱大战”热潮里,姗姗来迟。一般来说,迟到的原因无非两个,一个是动作太慢没赶上,另一个是在伺机而动等待后发。如果说此前还无从判断微软的“迟”是哪种情况,那么现在则比较清晰了。

两周前,微软联合音箱制造商哈曼卡顿推出智能音箱 Invoke,Cortana 作为语音智能助手内置其中,可供唤醒,执行操作。更早前,微软与亚马逊同时宣布,打通 Cortana 与 Alexa,在 Windows 10 设备上对 Cortana 说“call Alexa”,就能够唤醒后者。

在AI竞争加剧,智能语音助手混战的背景下,在萨提亚·纳德拉“云+端”的战略下,从这两件事其实可以看出微软对 Cortana 的定位,越来越明晰了:一方面为硬件合作伙伴提供 AI 技术,另一方面和同行业伙伴结盟。

这个判断编辑在微软(亚洲)互联网工程院常务副院长、Cortana 负责人幺宝刚处也得到了确证:

Cortana 的定位是无处不在的人工智能,目前专注效率,既要作为一个应用,也要成为一个平台。

从应用角度来看,Cortana 进入了 Windows、iOS、Android 等不同的系统,连通微软生态中的 Office、Skype 等一同成为效率工具。从平台角度而言,PC、手机之后,Cortana 相继也将其 AI 能力应用在了家居、音箱、电视、车载、lOT 等场景中,未来将会随着微软的业务继续进行扩张。

整体来说,智能语音助手这条赛道似乎出现了“奇怪”的盘面,一方面是竞争的加剧,无论是巨头之间还是创业公司的涌进都能说明;另一方面则是“结盟开放”的趋势越来越明朗。

小娜负责人幺宝刚: 在这场“百箱大战”里, 微软迟到了么?(1)

以下为专访幺宝刚的Q&A;部分,在不改变原意的基础上做了增删:

关于产品

:微软和哈曼卡顿合作的音箱 Invoke 有什么亮点?

幺宝刚:产品的亮点包括几个。

第一个是优秀的产品自然会吸引最优秀的合作者,哈曼卡顿这样的高端音箱品牌与我们合作,我们也一直希望 Cortana 对外传达一种高端调性,因此最突出的一点就是声音,包括两部分,一部分是音质非常好,另一部分是 Cortana 的声音——计算机自动生成声音的自然度也是最好的,这个是第一个亮点。

第二个亮点是,用户可以通过音箱,直接跟 Skype 连通接打电话,也有一些智能音响可以打电话,但 Skype 除了能够打电话之外,还跟你的 Skype 联系人直接做对话。

第三是跨平台。用户不光可以在音箱上呼唤小娜,也可以跨平台通过 PC,手机等任何操作平台上联动使用Cortana。

作为人工智能助理, Cortana 对用户提出的知识性问题给予准确的回答,这主要依托了 Bing 的后台,除了语音识别、自然语言理解,对知识图谱的建立,都是智能音箱的亮点。其实我们非常高兴,虽然我们正式进入这个市场,来的慢一点,但是我们有明晰的定位,并且获得非常正面的用户反馈。

Cortana现在定位变的更清晰,现在更多专注在效率方面,高效生活高效工作。

在音箱设置的时候,如果用户拥有 Office365 的帐号,就可以直接连接Cortana,并且使用 Cortana 进行管理会议、日程和提醒,因为小娜的跨平台属性,用户可以轻松同步手机和 电脑 ,这样专注于高效的例子,未来将会在我们产品的特性、功能上不断加强、优化和展现。

小娜的技术正在不断的迭代过程中,现在可能越来越多的人工智能同行也都了解到,这需要很大的投入和基础力量,微软深耕人工智能领域,其技术投入和研发力量不言而喻,例如就在今年8月,我们的对话语音识别技术达到了人类专业水平,错误率由5.9%进一步降低到5.1%。虽然数字感觉很小,但到后面的提高也会越来越困难,这个就是技术的进步。

:除了赋能硬件厂商外,内容上也很重要,微软在这方面有什么进展?

幺宝刚:想要成为无处不在的人工智能助理,小娜还有很长的路要走,我们现在所专注的是以下几点:

第一点,打铁自身要硬,我个人对于微软自身的技术非常自信,特别在基础的科学研究和技术,例如语音识别,语意理解,微软多年的积累和沉淀带来相当大的优势。

第二点,除了技术之外,还要带给用户足够好的体验。我认为,用户体验分为两部分:一个是加入微软生态,与微软的生产力工具 Office、Skype 等结合;另外一个,是小娜的IQ方面的发力,她需要非常聪明,具备足够的知识储备,从 Cortana 上可以看到,当时微软在 Bing 上面做投入是有道理的,如果我们不做搜索引擎,那么现在搭建一个完备的知识图谱是很困难的事情,而幸运的是,微软目前既有高效的生产力工具,又有搜索引擎,搭建知识图谱,让人工智能拥有足够的知识。。

第三点,就是技能的开发平台。我们希望开发者、第三方用户、厂商,都可以利用这个技能平台进行开发,提供内容,加到 Cortana 里,网易云音乐就是个例子。这个平台已经在美国推出了,晚一点时间,会在中国继续大力推广,这也是我们希望与合作方构建科技生态的一部分。

:让用户觉得体验好的标准是什么?

幺宝刚:最基本的层面,是语音的识别率,我刚才也提到,目前我们的我们的对话语音识别技术达到了人类专业水平;再往上升一层,是我们希望用户的问题能获得最直接有效的帮助。对于同一个问题,有很多智能助理,哪个回答的最接近于用户希望得到的,我们是请了专业的人来评测的。但我觉得最关键的,更多用户使用所产生的大数据有足够多的用户,使用黏性、使用频度实际上证明了这个事情对他有多重要。如果他每天都会来用几次,说明这个有用,不然的话自然而然就不用了,就会选择别的了。所以我觉得我们既有技术层面的,也有应用层面的,还有用户层面的一些度量。

:未来微软有没有可能推出自己的智能音箱?

幺宝刚:小娜未来的发展自然会跟随公司战略,作为微软生态的一部分,像微软内部已有硬件,例如Xbox,小娜已经在进行整合,所以我们也将会配合公司的战略发展。

:目前对 Cortana 在营收上有什么期待吗?或者KPI。

幺宝刚:像刚才我也提到,在商业模式方面,我们第一年的专著点会是先专著于用户数量和用户体验上,所以至少在我们这个财年这不是一个目标。

关于竞争

:你觉得智能语音助手,在未来竞争中可能会胜出的因素有什么?

幺宝刚:我们也在思考这样的事情。我觉得有几点:

第一,一定要有自己专业核心的投入,人工智能这个概念已经不陌生了,历史上也经历过遇冷,因为本身就很难,核心的东西,需要长期不懈的努力,才可能有突破。我认为关键点在于公司是否愿意在基础研究方面做持续不断的投入。不然,你的核心技术将来会依赖于别人。而微软在这方面,拥有多年积累的技术、同样在人才方面,我们也投入很多。

第二,要有基础应用。人工智能助理必须有自己的内容,需要足够聪明,并且拥有足够的知识,那这个从哪里来?微软之所以有知识图谱,是因为我们投资了多年的 Bing 。同样,我们之所以能够专注在效率方面,也是因为有 Office 多年的积累,以及对用户需求的了解。

第三,足够多的数据。目前有两种人工智能的应用场景,一种是比较通用的,还有一种是在垂直领域的应用。我认为,要获得足够的数据首先要有多年的技术积累,其次要对行业非常了解,微软认知服务集合多种智能API以及知识API,目前我们已发布包括视觉,语音,还有翻译语言,语义理解等29款工具,我们也希望能和更多合作伙伴一同探索人工智能的更多应用和可能。

:微软整体的战略,是云为先移动为先,Cortana 在这个战略里扮演着什么样的角色?

幺宝刚:微软 CEO 萨提亚提出智能云+智能边缘计算的概念,也就是Cloud+AI的模式,我们认为,未来的世界是由智能云和智能端,用人工智能将所有东西连接在一起。我觉得的 Cortana 是一个非常典型的体现,原因在于,首先我们对 Cortana 的定位,是一个无处不在的智能助理,所谓无处不在是指, Cortana 既可以独立作为一个应用存在,也可以存在在微软的应用或者合作伙伴的应用、甚至存在于定制的设备里,当然做到这一点的前提是,小娜必须生活在云端,只有这样的话,才能够同时为这么多的终端服务。

另外,Cortana 后台的很多技术,其实应用的都是云服务,Cortana 可以通过智能助理的使用,把语音做的更好,做更好的语音,我们还通过微软的认知服务提供给那些暂时不需要 Cortana,但是需要微软语音服务的开发者使用。

:小冰那边会讲一些数据,比如说对话轮次达到多少轮,小娜好像不太强调这些数据。

幺宝刚:对,因为小冰是一个情感机器人,那她陪伴用户的时间长,对她来说是一个很重要的指标。我先不说小娜先说搜索引擎,那搜索引擎最理想的对话次数是多少?

:一轮。

幺宝刚:就是我马上就告诉你答案。但是对于智能助理,理想状态到底应该是多少?这个其实说实在的,我们也没有把这个问题规定下来,是一轮或者多轮。我觉得可能最后还是要看客户的问题是什么?比如用户提出一个问题,是对智能助理说,帮我定一班去上海的火车,我下午有个会,那这个智能助理就应该很聪明的知道,用户下午几点开会,用户的火车应该在下午两点就要出发,那他就给你定好了两点的火车。但如果你的问题是你给我讲一个笑话吧,或者给我唱首歌。那你是只唱一首歌就完了吗?所以这个其实还是要看场景来定的。所以我觉得根据场景会有不同测量的指标,可以分享的是,从小娜推出之后到现在,用户问过的问题已经超过了一百亿。

:在和其他硬件系统整合的时候,会不会出现权限上的差异?比如说 iOS 给 Siri 的权限大一点?

幺宝刚:每个平台其实都有限制,即使像 Siri 在 iOS 也不可能所有事情都做,因为有时候用户或者APP本身会有授权,关键是说你了解这个限制,然后看怎么样让用户获得最好的体验。

:某种程度上来说 Cortana 也算一个 OS,只是没有提这样的概念,微软如何来面对类似百度这样的厂商的竞争?

幺宝刚:一方面是微软对技术的多年投入;另外一方面就是不可能全面出击,而要找到专注点。我们的专注点在于生产效率;第三是微软还是作为一个平台的公司,我们希望变成一个开放的系统,与更多的合作伙伴进行合作。此外,因为很多人都想做开放平台,但不是所有的开放平台大家都去用的,所以我觉得微软作为一家国际性、拥有全球领先科技和具备信赖感的科技企业我为此充满信心。

上一篇:微软提高Windows 10安全标准: Surface Pro 4躺枪 下一篇:段子手云集! AI黄埔军校微软亚研院的一次“武林大会”

相关资讯

最新热门应用

电脑问答