系统粉 > IT资讯 > 微软资讯

微软数据科学家欲攻克婴儿猝死综合征预防之道

发布时间:2017-06-14    浏览数:

美国每年有一千名儿童在出生后的第一年去世,其中六分之一死因不明

婴儿猝死综合征并不是一种单一的疾病,而是一系列因素导致一些婴儿在关键的发育阶段变得更加脆弱造成的

微软数据科学家欲攻克婴儿猝死综合征预防之道(1)

约翰·卡亨(John Kahan)在他的微软公司(Microsoft Corp.)办公室里放着一张令人心痛的照片。照片中,卡亨、他的妻子以及三个女儿正在庆祝一个男婴的诞生——男婴的金红色头发被一顶帽子遮住了。卡亨在微软负责客户数据和相关分析的管理工作。

在这张照片拍摄几小时后,卡亨接到电话:他的爱子阿伦(Aaron)已经停止了呼吸。(如今他每每复述接到电话的那一刻时都会禁不住哽咽。)几天后,阿伦就那么莫名其妙地离世了,他死于婴儿猝死综合征(SIDS)。

去年,随着阿伦13周年祭日的临近,卡亨决心攀登非洲最高山峰乞力马扎罗山, 为SIDS研究募集资金并开展宣传,以此纪念他唯一的儿子。当卡亨登山归来时,他的团队给他准备了一份惊喜——他们已经开始分析与美国婴儿死亡相关的数据,并利用数据分析算法来尝试寻找新的预防方法,以降低每年死于SIDS的婴儿数量。到目前为止,这些数据科学家已经为该研究投入了大约500个小时的私人时间。作为卡亨的雇主,微软公司通过旗下慈善机构Microsoft Philanthropies为他们的这项工作免费提供了云托管和软件工具。

如今,通过动用可以识别趋势的分析和数据可视化工具,该团队已经在抗击SIDS方面发现了富有希望的线索。这种技术通常被用于生成微软首席执行官萨蒂亚·纳德拉(Satya Nadella)的日常绩效指标动态图,或者告诉Windows团队如何最好地为客户服务。而在这项研究中,这种技术帮助研究人员发现了各种相关性,例如早期产前保健与较低的婴儿死亡率相关。这项研究工作还提供了有关已知SIDS风险因素(如产妇吸烟行为)的更多信息。

“阿伦在13年前就离世了。13年来,我们并没有真正让情况改观。”卡亨称,“这基本上意味着在此期间美国大概有5.2万名儿童因为SIDS丢了性命。他们的父母就像我们这样,呆坐在那儿不知道这一切究竟是怎么回事。”卡亨还在游说美国国会维持医疗研究经费并开放医疗数据用于相关科研。

微软正与西雅图儿童医院(Seattle Children’s Hospital)旗下由神经科学家尼诺·拉米雷斯(Nino Ramirez)领导的研究团队展开合作。拉米雷斯的团队可以进入一个专用实验室进行各种试验,比如测试不同因素对鼠脑组织切片的影响等。他们正在研究哪些预防途径经得起进一步研究。前景良好的研究发现将会发表在医学和数据科学期刊上,以期影响临床实践。

微软数据科学家欲攻克婴儿猝死综合征预防之道(2)

2003年10月,约翰·卡亨及其家人与阿伦的合影。阿伦在两天后死于SIDS

“云端处理能力、可视化技术、以及大规模运用数据科学算法和以闪电般速度分析相关性的能力——放在15年前,这一切无论在哪里都是无法做到的。即便能做到,可能也需要架设数不清的IBM大型计算机,而且分析结果输出要等待很长时间。”卡亨说。

阿伦出生时,曾在IBM担任高管的卡亨刚刚在微软工作六个月。卡亨的妻子希瑟(Heather)也是IBM前高管。由于他们一家人在西雅图几乎举目无亲,时任微软首席执行官史蒂夫·鲍尔默(Steve Ballmer)和首席财务官约翰·康纳斯(John Connors)以及相关员工为葬礼事宜和医疗费用协调伸出了援手,并确保一家人得到安稳过渡。希瑟孕期并没出现任何有问题的迹象,随后的尸检也没给出阿伦的死亡原因。卡亨正在重新分析尸体解剖结果,以评估最新研究发现是否能够揭示问题到底出在哪儿。

胡安·米格尔·拉维斯塔(Juan Miguel Lavista)是卡亨手下的首席数据科学家。2013年,女儿刚出生一周的拉维斯塔走进了卡亨的办公室,并问起卡亨办公桌上的婴儿照片。在卡亨说出阿伦的事之前,拉维斯塔原以为照片中的这个婴儿是卡亨的一个女儿。现在,拉维斯塔是SIDS研究项目的带头人。该团队的成员还包括乌尔舒拉·查犹斯卡(Urszula Chajewska),其在职业生涯早期曾使用机器学习技术来筛查英特尔(Intel)芯片制造厂的故障设备。

通常情况下,像微软这样的公司一般使用这些工具来优化销售业绩,或者追踪旗下业务的表现,但这些技术在发现医疗领域的突破方面同样大有用武之地。“我们在微软的本职工作与SIDS研究工作截然不同,但从数据科学的角度来看,它们并没有两样。”拉维斯塔说。

卡亨称,美国每年有一千名儿童在出生后的第一年去世,其中六分之一死因不明。上世纪90年代初,“仰睡”(Back to Sleep)运动在美国兴起,其目标就是动员家长不要让婴儿俯卧着睡,此举使得婴儿死亡人数显著下降。但从那时起,婴儿的不明原因死亡率一直保持着稳定。

微软数据科学家欲攻克婴儿猝死综合征预防之道(3)

西雅图儿童医院的尼诺·拉米雷斯和塔蒂亚娜·安德森(Tatiana Anderson)在实验室里

拉米雷斯称,SIDS并不是一种单一的疾病,而是一系列因素导致一些婴儿在关键的发育阶段变得更加脆弱造成的。SIDS在婴儿出生后的第二个月中最为常见,但通常在婴儿满一周岁之后就不会发生了。罹患SIDS后,某种因素会导致婴儿无法吸入足够的空气,而正常的孩子一般会醒来,这些婴儿却不会。发现这些病例中的一系列共同因素或者确定出哪些婴儿风险最大将有助于医生和家长改变风险因素并更密切地监测婴儿。

传统的SIDS研究通常只涵盖数百个病例。相比之下,微软的这个研究团队能够挖掘美国疾病控制和预防中心(U.S. Centers for Disease Control)采集的海量数据集,并找出较小样本中很难发现的相关性。机器学习和人工智能专家已经在治疗癌症和其他疾病方面应用这种技术。

美国疾病控制和预防中心的数据库收集了2004年至2010年期间在美国出生的所有婴儿的信息(分为90列),共有2900万份记录。这些记录包括母亲的孕期保健情况、种族、教育程度和收入等因素。当一个婴儿死亡时,死亡信息也会被收集。微软的数据科学家们创建了一个交互式网络图,以显示与婴儿及其父母相关的每个单一变量之间的关系以及它们与SIDS的相关性。

微软数据科学家欲攻克婴儿猝死综合征预防之道(4)

查犹斯卡和卡亨在查看微软利用疾病控制和预防中心数据创建的SIDS相关性网络图

其中一个发现是,怀孕后前三个月获得产前保健服务的女性所产婴儿死于SIDS的风险低于平均水平。而若在怀孕3个月之后才开始获得产前保健服务,这种风险将提高30%至40%。查犹斯卡称,原因可能不光是保健服务。事实上,或许是医生可以说服孕妇采取戒烟或服用维生素等有益的措施。但数据依然能帮助政策制定者更精确地对免费产前保健等服务展开成本影响分析。

“你可以去跟从政者说,还有多少孩子正在因为SIDS死亡。现在一切突然变得很真切。”在西雅图儿童医院担任综合脑研究中心(Center for Integrative Brain Research)主任的拉米雷斯称,“如果你遇到一位家长,即便他们已经八十岁了,这种精神上的创伤也是永远无法忘却的,而我们正在谈论的是数以百万计的婴儿。我们怎能无视这个问题呢?”

这些数据还显示了与最低SIDS发病率相关的最佳产前保健次数。类似的,研究人员几年前就已经知道,吸烟的孕妇会产下SIDS发病率更高的婴儿。但微软团队的数据会显示每天每吸一支烟会导致风险增加多少。戒烟可能很难,但这些数据表明即便只能说服孕妇少吸烟也能产生积极作用。

最终,拉米雷斯希望为孕妇创建一个在线工作表,以便让填表的医生了解每位患者的SIDS风险因素。现在,与患者讨论的风险因素要笼统得多,并且一般都基于种族和年龄等因素,不能将许多不同的信息结合起来以得出更为丰富的概率观。

“(SIDS)研究领域并不是特别大。最初都是儿科医生在研究,但是儿科医生并没有数据科学的背景。”拉米雷斯说,“他们有自己的数据库,他们试图开展综合分析,但专业的数据分析并不存在。专业数据分析目前存在于遗传学和癌症研究领域,并且已经在这些领域带来了天翻地覆的改变。我们这里开始的工作已经给SIDS领域带来了一点点变化。”

上一篇:微软想证明 Windows 比 Chrome 有多好用, 也流露出对 Chrome 有多恐惧 下一篇:微软高通联手让Windows 10支持ARM 英特尔生气了

相关资讯

最新热门应用

电脑问答