画家要失业了？微软的绘画机器人能够根据文本生成图像！

发布时间：2018-01-22 浏览数：

最近，微软公布了人工智能一项新的进展，可以根据用户描述来绘图，这项技术刷新了我们对人工智能的认知。

如果给你画笔和稿纸，让你画一只鸟，这只鸟有黄色的身体，黑色的翅膀和短短的鸟喙，那么你一定会从鸟的轮廓开始画起，然后不停的修改，用黄色的画笔填充鸟的身体，用黑色的画笔来画翅膀，最后完成鸟喙。如果想让画更加生动形象，你可能会画上树干，让鸟停在上面栖息。

画家要失业了？微软的绘画机器人能够根据文本生成图像！(1)

现在，微软开发出的机器人也能够做到这一点了。

微软的研究实验室开发的新型人工智能技术，能够将文本描述中截取的单个词语生成图像。这项技术被研究人员称作是“绘画机器人”（drawing bot），当你输入文字后，机器会根据文字先生成一张模糊的图片，然后再反复识别文字的意思，逐个像素地补充图片细节。

画家要失业了？微软的绘画机器人能够根据文本生成图像！(2)

“如果你通过搜索引擎来搜索，你会得到一幅鸟的图片。”但在这里，这些图片是由电脑逐个像素进行创建的，”何晓东说，他是微软位于华盛顿州雷德蒙德实验室，深度学习技术中心的首席研究员和研究主管。“这些鸟可能在现实世界中并不存在——它们只是电脑想象中的鸟类。”

画家要失业了？微软的绘画机器人能够根据文本生成图像！(3)

这个“绘画机器人”用到的核心机器学习技术是生成对抗网络（GAN），简单来说，就是有两个模型一起工作，一个根据文本生成图像，另一个则会根据文本鉴别生成图像的真实性，二者一同作用，让生成的图片更符合文本描述。

这项技术可以运用到实际应用中，比如，它可以作为画家和室内设计师的草图助手，或作为语音控制的照片美化工具。伴随更强大的计算能力，这项技术还可以生成基于电影剧本的动画电影，为电影制作人减少一些需要人工的成本。

目前这项技术还不完善，对于常见文字生成的图片速度和质量都较高，对与不太符合常规逻辑或不常见的文字生成结果则不太准确，例如，输入“一辆红色的双层巴士漂浮在湖面上”，会得到一个像是有着两层甲板的巴士飘在群山环绕的湖面上的模糊图像。此外，在对图像进行仔细检查后，几乎总能发现瑕疵，例如，在鸟的图片中，呈现的是蓝鸟喙，而不是黑色的；水果和基因突变的香蕉长在一起。这些缺陷清楚地表明，是电脑而不是人类创造了这些图像。

画家要失业了？微软的绘画机器人能够根据文本生成图像！(4)

尽管如此，这项技术与之前的文本到图像生成技术相比，产生的图像质量提高了将近三倍。此外，这也是通往增强人类自身能力的类人工智能道路上的一个里程碑。