我们都知道FPGA拥有“光速”般的处理能力以及对数据密集的人工智能工作负载的自然适应能力。但FPGA目前也有一些可用性和可编程性方面的问题,使其在IT应用中较难实现。业界普遍认为,资源丰富的领军型科技企业将会在FPGA在人工智能应用领域的实用技术方面展开竞争。
微软正使用英特尔的最新14nm Stratix 10和其他FPGA技术努力做到这一点。该公司已经启动了Brainwave项目,这是一个“实时AI”功能,可以在Azure公有云基础设施上使用。它的设计目的是处理实时数据流,例如视频、传感器或搜索查询,并快速将数据发回给用户。

微软此前曾在Hot Chips 2017大会(一个半导体研讨大会)上展示了其基于FPGA的深度学习平台。微软报告说,Stratix 10显示了39.5万亿次浮点运算的持续性能(使用微软的自定义8位浮点格式,ms-fp8),每个请求在1毫秒内运行。“在这样的性能水平上,Brainwave架构在每一个周期中持续执行超过130,000个计算操作,这是由每10个周期所发出的一个宏指令驱动的。”
微软是第一个在公共云基础设施中部署FPGA的主要云服务提供商。根据英特尔公司的说法,“今天,英特尔公司在技术上的进步使深度神经网络(DNN)得到了加速,能够以一种概念上类似于人类大脑的方式来复制‘思维’。”
英特尔(Intel)和微软(Microsoft)对比了“Stratix 10”的功能和“当今许多硅AI加速器”的功能,要求将多个请求组合在一起(称为“批处理”),以实现高性能。他们说,在一个单一的请求上,“Stratix 10”展示了超过39万亿次的持续性能,“一个新的云性能,实时人工智能计算,低延迟记录,性能记录和对人工智能请求的批处理。”

“我们利用英特尔FPGA的灵活性,快速整合创新,同时提供比许多基于ASIC的深度学习处理单元的性能,或者更大的性能,”微软研究院NExT的杰出工程师Doug Burger说。
微软指出,Brainwave项目由三个主要层组成:
首先,它利用了微软在过去几年中部署的大规模FPGA基础设施。“通过将高性能的FPGA直接连接到我们的数据中心网络,我们可以将DNN作为硬件微服务,DNN可以被映射到一个远程FPGA池,并被一个没有软件的服务器调用。”Burger说。这种架构降低了延迟,因为CPU不需要处理传入的请求,而且允许高吞吐量。
其次,Brainwave项目使用了一个“软”DNN处理单元(或DPU),以FPGA为基础,“提供了一个跨多个数据类型的设计,所需的数据类型是一个合成时间的决定。”该设计将ASIC数字信号处理模块与FPGA和合成逻辑结合在一起,提供了一个更大、更优化的功能单元数量。

Burger说,这种方法“可以很快将研究创新融入硬件平台(通常是几周),这在这个快速发展的领域中是必不可少的。”因此,除了提供我们所承诺的性能外,我们也取得了与这些硬编码的DPU芯片相当或更强的性能。
第三,Brainwave项目合并了一个软件堆栈,旨在支持广泛使用的多种深度学习框架。“我们已经支持微软的认知工具包和谷歌的Tensorflow,并计划支持更多的框架,”Burger说。“我们已经定义了一个基于图形的中间表示,我们将这些模型转换为受欢迎的框架,然后再编译到高性能的基础结构。”
“我们正致力于将这种强大的、实时的人工智能系统引入Azure用户,这样我们的客户就可以直接从Brainwave项目中获益,并通过我们的服务(如Bing)来进行间接访问。”Burger说。
相关资讯
最新热门应用
非小号交易平台官网安卓版
其它软件292.97MB
下载
币交易所地址
其它软件274.98M
下载
iotx交易所app
其它软件14.54 MB
下载
zt交易所安卓最新版
其它软件273.2 MB
下载
币拓交易所bittok
其它软件288.1 MB
下载
u币交易所平台app
其它软件292.97MB
下载
热币全球交易所app官网版
其它软件287.27 MB
下载
多比交易平台app
其它软件28.28MB
下载
币赢交易所app官网安卓版
其它软件14.78MB
下载
toncoin币交易所安卓版
其它软件48MB
下载