美女与IT兽｜用微软人工智能，你到底能做啥？

发布时间：2017-09-28 浏览数：

美女与IT兽｜用微软人工智能，你到底能做啥？(1)

· 本文内容分为：语音版+图文版（了解什么是【美女与IT兽】）

· 应用场景：人工智能、物联网如何在行业中落地，产生商业价值？

· 收听/阅读时间：10分钟

· 掌握难度：★★★☆☆

美女与IT兽｜用微软人工智能，你到底能做啥？(2)

Grace Peng 微软认证云计算工程师，智慧云拓展总监兼客服兼非著名主播

Long time no see（一段时间不见都开始飚英文了）~

这段时间你们是不是在低调奢华地搞大事？

我们的主播反正搞了一件两件不大不小刚刚好的事情，待会儿让她自己告诉你们。

总之，【美女与IT兽】又回来了！

看（听）过之前11期的IT兽们都知道，我们一直说的是物联网、人工智能、大数据...的那些事儿！

今天的华丽返场，就一次把人工智能说个够！

大家晚上好！我是Grace·好久不见·终于忙完微软物联网·人工智能大会·刚喘了口气·又要开始忙上海站·Peng。

肯定有好多IT兽“肉身”或在线参加了我们第二届微软物联网大会——Empower

美女与IT兽｜用微软人工智能，你到底能做啥？(3)

今天要跟IT兽们分享的内容，就是基于“Empower”大会上Alan IP博士分享的主题而延展的：《微软人工智能都能做啥？》

Alan博士真相：

美女与IT兽｜用微软人工智能，你到底能做啥？(4)

是不是玉树临风潇洒倜傥饱读诗书气自华......?

好了，我们进入正题：

美女与IT兽｜用微软人工智能，你到底能做啥？(5)

首先，我们先理清楚微软对人工智能这件事的态度：

人工智能，微软不是第一天搞，5位图灵奖得主坐镇不是吹的。但微软一贯的调性是默默站在小伙伴们身后。

比如：马斯克的Open AI和Dota 2世界冠军打游戏，差点把世界冠军打哭。

美女与IT兽｜用微软人工智能，你到底能做啥？(6)

（看血条）

然后Open AI就火了，可你们都不知道这背后其实是Azure在支持，直到马斯克同志发了一条推文：

美女与IT兽｜用微软人工智能，你到底能做啥？(7)

再举个栗子：微软把对人工智能的通用研究都开放了出来，可以让人工智能应用开发者直接使用的（微软认知服务）API就有30项！

☞ 如果你在电脑边，赶紧收藏这个链接：https://azure.microsoft.com/zh-cn/services/cognitive-services/

接下来，我们就来开始深扒这些微软的人工智能API都在做啥！三十项我当然不可能全念一遍，你们的耳朵一次也吃不下。

那么，就按着我的爱好来划！重！点！

热度排名第一的当然是：已经在国内Azure落地的——

计算机视觉服务

微软的人脸识别、情绪识别和计算机视觉三项服务已经在国内Azure上落地。

☞ 复制以下链接至服务器，查看国内Azure上的认知服务API

https://www.azure.cn/home/features/cognitive-services/

人脸识别效果怎么看？

“LFW”都造吧？就是那个被各家厂商用来测试自家人脸识别引擎好坏的图片库。

美女与IT兽｜用微软人工智能，你到底能做啥？(8)

从95%的识别准确率到98%...99%...99.6%...99.7%！

世界纪录一再被不同时期的不同技术公司一遍遍刷新~

美女与IT兽｜用微软人工智能，你到底能做啥？(9)

以前，我觉得这个指标好牛啊——微软在2015年起就一路领先，LFW识别率一路向上，当然后来居上者也挺多，国内就好几家。

美女与IT兽｜用微软人工智能，你到底能做啥？(10)

美女与IT兽｜用微软人工智能，你到底能做啥？(11)

可是有不少小伙伴拿着世界第一99.x%识别率的微软认知服务上，放到实际项目中一看——咦，不是这么回事儿啊！

比如：在零售领域，便利店的摄像头辨别成功率不到80%，这是怎么回事儿呢？（我也很苦恼啊难道我吹的牛要破了么）

后来才知道，原来大家竞相用来刷世界纪录的LFW识别率是一组静态的成对图片，相当于老师划了重点，“来来来我们要考这些啊，你们回去自己好好准备。”

所以学霸当然就高分了。

但是就算学霸也不是出校门就直接工作的，比如实际的应用场景里可不都是静态图片，而是有黑黑的人，有模糊的人，有带着口罩的人，还有刚化了妆美过颜的......

所以在实际应用中人脸识别的LFW识别率再高，就算是100%，也需要根据场景来调整应用人脸识别的姿势。

再举个实际的例子：有时候一张照片里有很多人，想统计一下大概有多少，但如果仅用人脸识别就很苦恼…你看：

美女与IT兽｜用微软人工智能，你到底能做啥？(12)

这时候计算机视觉其实就不应该用人脸了（都是后脑勺用什么人脸啊），用人形或者头肩，才能识别：

美女与IT兽｜用微软人工智能，你到底能做啥？(13)

人脸识别目前用在哪儿？

高度敏感或者涉及安全的事儿，还是再等等吧。

现在虽然有很多辅助的方式来让刷脸识别看起来更安全可靠，但是保不齐哪儿有这样的漏洞或者技术还不完善的坑呢？

美女与IT兽｜用微软人工智能，你到底能做啥？(14)

（别的都不说了，XX那个人脸识别，让我一直眨眼睛然后一直说没识别到我眨眼睛我眨了啊！！！眨了啊！！！！！眼睛小也歧视啊！！！）

所以人脸识别目前比较尴尬的问题：核心不是技术，而是怎么变现；或者是大家能不能一起努力支撑到成为主流生产力的问题。

美女与IT兽｜用微软人工智能，你到底能做啥？(15)

在一些不是那么敏感的方向上，有一些交互的需求正在实现。

比如，今年四月微鲸发布系列新品，其智能儿童锁功能与微软人脸识别技术强强联合，通过特征识别人脸，就能判断用户的性别、年龄。

如果是儿童就会自动跳转到适合儿童观看的动画片、益智类节目；可以设定观看时长，超过了设定期限，就会自动锁屏，只有通过大人刷脸才能再次进入。

美女与IT兽｜用微软人工智能，你到底能做啥？(16)

又比如，Uber验证司机是不是同一个人，用的也是微软认知服务：

美女与IT兽｜用微软人工智能，你到底能做啥？(17)

再比如，很多做家庭存储的IT兽用计算机视觉API生成智能缩略图，无论图片怎么缩小，Azure认知服务都会自动找到这张照片的重点然后按照缩略图的形状大小来智能调整：

美女与IT兽｜用微软人工智能，你到底能做啥？(18)

美女与IT兽｜用微软人工智能，你到底能做啥？(19)

（如果你缩的都只剩条边了我也没有办法）

例子好多我们今天讲不完，反正可以看到——计算机视觉的未来很可能是计算机可以识别所有东西。

下面，是微软在今年的Build大会上放的视频截图：

美女与IT兽｜用微软人工智能，你到底能做啥？(20)

当你找不到钱包、钥匙的时候就喊一嗓子：“我的钱包呐？”很可能你的管家机器人就去找到然后给你拎过来了。

（讲到这里突然发现...我才刚开场！本来只想略略带过耳熟能详的计算机视觉服务...略了这么多，我也很绝望！）

这样吧，接下来我用一个现在很热、应用面很广的场景来挽尊：

智能客服

广不广？无论你是电商、呼叫中心、还是金融企业...都会需要智！能！客！服！

传统客服&初代智能客服

传统的客服…大家应该都很熟悉，反正就是培训礼貌用语，然后给话术，写好路径跳转，然后就开始接电话…...

后来有些企业发现：留存在系统中的数据可以用于智能客服，可以更精准地预测用户的行为模式和应答可能性，关键是可以减少人工！

于是，第一和第二代的智能客服就华丽丽地出现了。

然而，保不齐有些调皮顾客会出现：

- 银行电话：因近期盗窃信息案件频发，根据您在餐饮店的消费记录，有可能存在安全隐患，您尾号XXXX信用卡需要更换新卡以确保资金安全...

- 我：那我以后不刷卡都用微信支付好了

- 银行：......（你怎么不按脚本说话呢我思路都乱了）

对面的客人一旦开始不按写好的跳转路径来回答问题或者进行反问，智能客服的脑子就不够用了。

如：“我说大妹子啊我想知道微软Azure在人工智能这个territory四不四能meet到我客户想要智能客服的expectation啊？”

天呀！方言、中、英文夹杂还带错字的，智能客服们立马乱了阵脚，只能给出诸如：“对不起，我还不懂您的问题，请换个方式重新提问”、“提问失败，请重试”的回答。

所以，首先你得要有一个能理解对方说了什么意思的人工智能，在微软，这个服务叫LUIS。

理解对方意思的人工智能

语言理解智能服务 (LUIS) 提供了一些简单工具，可让IT兽们构建自己的语言模型（目的/实体），这可让所有应用程序或机器人，都能理解用户的命令并执行相应的行动。

#做个示范#

第一步：进入网址（https://azure.microsoft.com/zh-cn/services/cognitive-services/language-understanding-intelligent-service/）

第二步：你看这个灯是不亮的对吧？

美女与IT兽｜用微软人工智能，你到底能做啥？(21)

第三步：输入“switch all lights to green“；好了，LUIS（下图看右边）就意识到了我的Intent（意念）是要把灯都打开，并调到绿色，于是（好有趣有没有？）：

美女与IT兽｜用微软人工智能，你到底能做啥？(22)

使用 LUIS 可快速部署到一个应用的入口（或者叫End Point），它将获取你发送到这个End Point的句子，并按其传达的意图对这些句子和存在的关键实体进行解释。

如果遇到刚才那种“不讲方言和English就会die”星人呢？

在处理了几十个交互后，LUIS 就会开始主动学习，并弄清楚什么是对的，什么是不对的，以及什么是自己还弄不清，需要人工来干预的。

理解说话情绪的文本分析API

如果你还想更进一步：了解这个对面正在跟你说话的哥们是生气脸在投诉，还是很满意写表扬信，或者情绪是否正在变化...

辣么，“文本分析 API”就起作用了。

你看啊，左边输入一段话，文本分析API不仅帮你弄清楚人家是哪国，还弄清楚对方说话的情绪是否稳定。

美女与IT兽｜用微软人工智能，你到底能做啥？(23)

左：I had a wonderful experience! The room was wonderful and the staff was helpful.

右（文本分析API）：

- 语言：英语

- 关键词语：wonderful experience staff room（这是夸我们房间和员工都棒棒哒~）

- 情绪：100%（嗯，客人情绪很不错）

能不能支持中文？

hmmm…这个LUIS是支持的，不过文本分析的中文支持还在加班加点呢。当然各位IT兽们做的都是全球生意，文本分析会11国外语呢！

智能断句能力

有意思的是，LUIS也好，文本分析API也好，其实都有个智能断句的能力。

给他一段话他能弄清楚你想表达的主要意思，API 会返回一个字符串列表，指示输入文本中的关键要点，你的App或者机器人在回答对方问题的时候就可以自动去除掉一些口误。

还是刚刚那个“三语用户”提出的关于Azure服务的问题，现在拥有一定语义理解能力的智能客服就会回答：

“您好，不同的客户对云计算的服务要求也会不同，您可以在www.Azure.cn页面查看其具体介绍”。

因为你的智能客服已经识别出来对方的整体意图。不过因为没有解决客户的问题，用户仍免不了切换页面再次搜索的操作。

那要怎么让客服机器人不仅能认识到对方说什么，还要能对应上知识体系呢，这时候第三项人工智能研究成果出现了：

Microsoft Concept Graph

美女与IT兽｜用微软人工智能，你到底能做啥？(24)

微软亚洲研究院去年10月27日正式发布Microsoft Concept Graph知识图谱和 Microsoft Concept Tagging 模型，用于帮助机器更好地理解人类交流并且进行语义计算。

什么是知识图谱？

知识图谱旨在描述真实世界中存在的各种实体或概念，按照输入问题的难易程度，分为简单类和复杂类两种。

对于简单问题：只需要一个三元组就能搞定，即实体A-关系B-实体C，如夏天-适合穿的-裙子。

对于复杂问句：需要多个三元组，有时需要进一步的推理或者做一些计算，可以用“实体A-关系B-实体C；实体C-关系D-实体E”表现A与E的关系。

如用户的问题是：“微软Grace喜欢的口红色号是什么？”

用知识图谱表现就是：微软-Grace Peng-口红；Grace Peng-最喜欢的-口红色号

你肯定要问了，我的天呀，世界辣么大，知识辣么多，我怎么知道怎么归纳呀。

好了，我要说微软做了一件大大的好事儿：我们亚研院发布的知识图谱和标签模型可以为机器提供文本理解的常识性知识，其中，知识图谱包含了540万条概念。

微软亚太研究院闫博士“

理解是万事万物的基础，我们用计算机抓取过去这些不成文的开放领域的常识，能够帮助计算机更具象地了解这个世界。

”

完整地说就是：Microsoft Concept Graph是一个大型的知识图谱系统。

其包含的知识来自于数以亿计的网页和数年积累的搜索日志，可以为机器提供文本理解的常识性知识。

除了包含一些被绝大部分通用知识库包含的概念，例如“城市”、“音乐家”等；Microsoft Concept Graph还包含数百万长尾概念，例如“抗帕金森治疗”、“名人婚纱设计师”、“基础的水彩技巧”等，而这些概念在其他的数据库中很难被找到。

除了概念，Microsoft Concept Graph同样包含了大量数据空间（每条知识概念都包含一系列的实体或者子概念，例如“太阳系”底下可能就会包括“水星”、“火星”、“地球”等等）。

于是知识结构就变成这样了：

美女与IT兽｜用微软人工智能，你到底能做啥？(25)

☞ 复制以下链接至浏览器打开，就可以下载！

https://concept.research.microsoft.com/Home/Download

好了，你的客服机器人现在已经完成了：理解用户说了什么，了解TA的情绪，知道用户想要干什么...

接下来，就要去实际做事情了，比如订票，选衣服款式，开个Azure测试账号啊什么的。

这部分谁做呢？

Bot Service，Azure上的对话即服务的API。

不过，这部分我们想稍等等，有几个项目正在欢快的进行中，希望很快能更大家分享。

今天可以去探索的，有很多。

探索后请告诉我们你的感受，好的不好的...我们都欢迎！

最后总结

今天的内容主要就是：先讲人工智能应用路上我们趟过和填好的那些坑；然后再给大家挖几个新坑哈哈哈哈哈哈…

好了不闹了（正经脸）

强烈建议：对人工智能有兴趣的IT兽们，参加10月底在北京举办的微软Tech Summit，这可是微软一年中唯一一场收门票的活动，主题都是经过千挑万选的。

☟ 复制链接至浏览器打开，立即报名 ☟

https://www.microsoft.com/china/techsummit/2017/?wt.mc_id=AID642533_TechSummit_Social_WeChat_SMBMarketing

*本文转自公众号：微软商业视角