系统粉 > IT资讯 > 微软资讯

两位微软一年半新兵如何拿下KDD Cup 2017双料冠军

发布时间:2017-09-25    浏览数:

2017-09-25 14:58:32 作者:魏景芳

凌晨三点,胡可还在修正数据模型中存在的Bug,而网络的另一头,和他并肩作战的黄攀也在忙着对数据噪音进行校正。每天睡眠不超过4小时,这样的状态在KDD Cup挑战赛开始后已经持续了整整一个月。

两位微软一年半新兵如何拿下KDD Cup 2017双料冠军(1)

KDD Cup 2017双料冠军团队部分成员:胡可(图左)和黄攀(图右)

双料冠军是怎样炼成的?

每年3月的KDD Cup挑战赛被看做是大数据领域的“奥运会”,各国的“最强技术大脑”们都会报名参赛,今年报名队伍史无前例的达到了3582支,竞争异常激烈。同在微软必应广告团队的胡可、黄攀和北京航空航天大学计算机硕士在读的陈欢,以及在美团点评工作的高级技术专家燕鹏组成的“Convolution”团队正是这3582分之一。

今年的赛题分为两个任务,预测车辆从路口到收费站的平均用时和预测高速收费站车流量,虽然之前也出现过机场、公路的流量预测的赛题,但是今年赛题中路网结构的不确定性,加上车辆故障、交通管制等数据噪音的掺杂,对于参赛选手针对新问题进行快速建模的能力提出了很大考验。

四个成员很快就找到了第二个赛题的规律,一直锁定了TOP3的排名优势。但是第二赛题的经验并没能在第一赛题上取得收益,第一赛题一度排名在前一百开外。尽管不断校正数据模型,但是成绩仍是小幅波动,没有太大进展。

赛程眼看到了尾声,模型在多种验证过程中表现仍不稳定,这让胡可和黄攀非常棘手。到了周末,正是团队集中调整建模架构的时候,胡可提议,干脆放弃有过拟合风险的提高模型复杂度的方式,转向构建更多模型复杂度不那么高的子模型来解决问题。

改进后的模型让成绩迅速提升,最终,“Convolution”团队的成绩超越了KDD Cup多年的冠军队伍台湾大学,拿下了两个赛题的双料冠军。

“人才要到真正的战场上去打才能练出来”

胡可和黄攀一下就在微软乃至数据挖掘领域闯出了名头,不过在微软亚洲互联网工程院副院长张祺的眼中,这样的成绩并不意外。“人才要到真正的战场上去打才能练出来”,这是张祺也是微软的用人之道。

两位微软一年半新兵如何拿下KDD Cup 2017双料冠军(2)

微软的技术人才并没有生活在“象牙塔”里的习惯,张祺看来无论是广告创新还是AI商业化,各领域的人员都需要通过“上一线”的方式来练手,“才能真正练出来”。微软也给了技术人才在创新层面的“绝对自由”,不会因为某个课题看上去成功的希望渺茫而去叫停或否定。

虽然胡可和黄攀都是通过校招的方式加入微软,但是之前他们都已经以实习生的身份在微软摸爬滚打了一段时间。微软有明确的导师制度,虽然还是实习生的身份,但是他们都已经在导师的带领下参与过很多国际化的核心项目,在擅长的项目中甚至会扮演相当重要的角色,实际建模和架构上手能力得到快速提升。

无论是内部技术创新活动“骇客马拉松(Hackathon)”的推动,还是外部的KDD Cup一类的技术挑战赛和学术会议上的活跃表现,微软的技术创新精神和兼容并包的文化渗透到了每个员工身上,哪怕是胡可和黄攀为代表的“新兵”。微软研发会被业界冠以IT“黄埔军校”的名号,正是源于微软成熟的人才培养和成长机制所带来的持续创新力。

AI赋能开始场景化、商业化落地

随着人工智能AI的红利,越来越多的领域开始尝试使用机器学习来解决现实问题,从KDD Cup赛事命题方向的变化就可以反映这种趋势。以往的赛题多集中在推荐系统的设计,近年来开始转向机器学习技术在教育、交通等传统行业的实际应用问题。

人工智能已经从技术概念逐步开始了场景化、商业化的落地,在AI领域布局超过26年的微软身上,这样的转变趋势更加明显。长久以来人工智能技术一直作为“发展方向”和“技术理念”存在于微软研究院里。但是仅仅一年多的时间,AI就已经贯穿了微软的全部产品和服务,在各种应用场景中落地,激发新的生产力。

在微软AI产品的第一线上:必应搜索通过大数据挖掘和深度学习,构建用户画像和知识图谱,使广告业务营收尤其是RPS(revenue per search每次搜索营收)指标显著提升;智能助理Cortana(小娜),已经在Windows10平台上回答了超过120 亿条问题,拥有超过1.33 亿活跃用户;情感机器人小冰,已经被全球超过1亿用户“领养”,对话轮次超过300亿……微软AI产品的落地正在逐步改变人机交互方式。

在微软其他的产品和服务中,AI的融入也激发了全新的生产力。Office正变得越来越智能, Word和Outlook会自动找出与你正进行的工作相关的资料,PowerPoint会自动围绕特定主题来制作计划大纲,Excel则会自动绘画不同的图表。此外,微软通过Azure智慧云的认知服务将人工智能的积累变成API接口,开发者只需要采用程序接口调用,就能简单快速地给应用程序加入智能。

此外,微软还明确了AI商业化的路径,纵向比如零售、医疗、金融等领域提供行业解决方案,横向比如人力资源、客服、销售、市场营销等模块提供业务流程方案,老牌科技巨头微软希望在“数字转型”的新浪潮中抢占先机,在微软全球资深副总裁洪小文看来“数字转型是我们现在看到的,业界也是微软接下来最大的机会。”

去年9月,微软成立了“人工智能和微软研究事业部”与核心的Office事业部、Windows 和设备事业部、云计算和企业事业部,成为微软四大业务之一。微软人工智能业务的带头人沈向洋给这块业务制定了“3-5年实现100亿美元营收”的目标。如果这个目标实现,人工智能的营收规模将与现在微软最赚钱的云业务并重。

肩上扛着这份重任的重要人物之一正是张祺,他所在的微软亚洲互联网工程院正是肩负着互联网广告、大数据、人工智能商业应用的使命。从2011年成立之初的16个人,迅速扩张到如今的500人,可见微软对于AI商业化落地的重视,张祺提到“我们的重要性不可替代”。

对于100亿的商业目标,微软人工智能商业化的图景已经全面铺开。

【精彩推荐】人工智能,微软打了一场“暗战”

上一篇:金山wps衰败,微软word主宰百分之九十市场;wps对比word完胜 下一篇:微软win10应用商店升级, 不止卖软件还卖电脑了!

相关资讯

最新热门应用

电脑问答