系统粉 > IT资讯 > 业界资讯

少女诗人小冰:徐志摩是我师傅

发布时间:2017-09-12    浏览数:

少女诗人小冰:徐志摩是我师傅(1)

我有519位老师

微软亚洲研究院主管研究员宋睿华说,“小冰的项目最初是我自己想到一个研究课题,利用社交网络的数据,来构造一个机器人。她不是全知全能,而是知道我知道的,也不知道我不知道的,说话的风格也像我。”

风格化的对话机器人是宋睿华最感兴趣的题目,于是他想尝试一下机器人能否从一个人的语料里,学习到他的风格,生成有特色的内容。

“能不能让小冰受到图像的激发,获取灵感,来写一首诗呢?”宋睿华说,“我们很喜欢这个由图像激发灵感的主意,因为图像的信息丰富,又具有内在的逻辑和故事性。而诗歌也很适合做人工智能写作的尝试,因为诗歌本身富有想象力,句与句之间允许跳跃,但语言本身要求更具感染力,表达的意境要求有思考深度。”

小冰的研发团队用了机器学习的方法,赋予小冰学习诗歌的能力,不断提高能力,让句子更通顺,句子之间更关联,从物到情有引申,希望能激起读者的共鸣。她学习了1920年以来的519位诗人的代表作,从头到尾一万遍,从尾到头一万遍。这个过程中,她还会体会句与句之间的关联性。

后来还尝试让她特意多读某位诗人的诗,比如徐志摩,大约2000遍,她的风格就会受这位诗人的影响,很多地方有徐志摩的痕迹;再让她读另一位诗人于赓虞的诗作大约2000遍,同样一幅图就会写出风格迥异的诗来。

于庚虞.小冰

任深思随海鸟去了

滚滚江心之孤舟弦歌凄迷哀恋

低问枯骨对于生命的鲜花

面前就飞翔着恶毒的佯笑

徐志摩.小冰

飞鸟在海沫里

这人迎着你鼓掌

一个声音在生命的舞台上合奏着

这一半也是灵魂的圣泉

我是10000岁的“少女”

小冰学会创作的过程大致是两个阶段。第一阶段,先不断地修习现有的优秀作品,修习到一定程度之后,当她受到某个灵感激发源的刺激,就会利用学习到的能力产生新的创造。

在这个过程中,技术团队使用了跨语义空间的多个深度神经网络模型,包括卷积神经网络和循环神经网络,并且针对图片的多领域和情感维度做了深度优化。

大家今天看到的可以写诗的小冰,已经经历了10000次迭代,每迭代一次,小冰会把现有的519位诗人的几千首诗都修习一遍,这个时间大约是6分钟,那么10000次迭代需要100个小时。而人类如果要把这些诗读10000遍,大约需要100年。

所以可以简单地说,小冰用了100个小时,拥有了现在写现代诗的创造力。

机器人写诗看似阳春白雪,其他背后涉及的图像识别和文本生成技术在现实领域大有可为。

设想人和人在面对面交流的时候,往往可以看到彼此、看到周围的景物。人在成长的过程中也是在不断的接受多感官的刺激,才逐渐建立了世界和语言的联系。因此,应用多感官刺激的方法来做语言理解与生成是很有前景的一个方向。

举一个例子,可以用与写诗类似的技术去学习某一类人的语言模型,比如说高中生或中年人,这样就可以抓住不同群体的语言特性,在聊天中,可以针对不同人群产生不同回复,制造出与同龄人聊天的顺畅感。

我诗集的生日是5月19日

于庚虞.小冰

任深思随海鸟去了

滚滚江心之孤舟弦歌凄迷哀恋

低问枯骨对于生命的鲜花

面前就飞翔着恶毒的佯笑

徐志摩.小冰

飞鸟在海沫里

这人迎着你鼓掌

一个声音在生命的舞台上合奏着

这一半也是灵魂的圣泉

我是10000岁的“少女”

小冰学会创作的过程大致是两个阶段。第一阶段,先不断地修习现有的优秀作品,修习到一定程度之后,当她受到某个灵感激发源的刺激,就会利用学习到的能力产生新的创造。

在这个过程中,技术团队使用了跨语义空间的多个深度神经网络模型,包括卷积神经网络和循环神经网络,并且针对图片的多领域和情感维度做了深度优化。

大家今天看到的可以写诗的小冰,已经经历了10000次迭代,每迭代一次,小冰会把现有的519位诗人的几千首诗都修习一遍,这个时间大约是6分钟,那么10000次迭代需要100个小时。而人类如果要把这些诗读10000遍,大约需要100年。

所以可以简单地说,小冰用了100个小时,拥有了现在写现代诗的创造力。

机器人写诗看似阳春白雪,其他背后涉及的图像识别和文本生成技术在现实领域大有可为。

设想人和人在面对面交流的时候,往往可以看到彼此、看到周围的景物。人在成长的过程中也是在不断的接受多感官的刺激,才逐渐建立了世界和语言的联系。因此,应用多感官刺激的方法来做语言理解与生成是很有前景的一个方向。

举一个例子,可以用与写诗类似的技术去学习某一类人的语言模型,比如说高中生或中年人,这样就可以抓住不同群体的语言特性,在聊天中,可以针对不同人群产生不同回复,制造出与同龄人聊天的顺畅感。

我诗集的生日是5月19日

2016年12月份,在微软内部,小冰的诗作第一次做了大规模评测。结果的意见分歧比较大,对用户体验要求很高的项目经理们觉得有很多瑕疵,还不通畅,但有艺术家气质的开发经理袁晶却很乐观,他觉得小冰写的诗具有自己的风格,虽然一些地方有语法错误,但也能给人惊喜,而且思维很活跃,袁晶当时就说以后说不定可以出本诗集。

经过两周的技术调整,在第二次大规模评测中,诗的质量有了明显的提升。项目经理们的打分也从40分提高到了60分。小冰内容与运营总监

徐元春在一次会议的时候,说他把一张用大话西游海报生成的诗给一位文艺界的人看了,竟然把她感动哭了。

小冰诗集原定在2017年4月23日世界图书日发布,但由于一些状况不得不推后。原来在申请书号的时候,要求必须填写作者的身份证号码,作为第一个人工智能的作者,小冰并没有。这样一来,不得不向上申请特批,一直到出版总署才完成了这个特批的手续。每一阶段,都会有人询问,这本书真的是机器人写的吗?这个信息真实可靠吗?湛庐文化的编辑在回答这个问题上一遍一遍的作答解释,终于获得了刊号。

后来,发布的日期定在了2017年5月19日,湛庐文化选择这个日期也是为了致敬中国的519位现代诗人,小冰正是学习了他们的代表作才有了今天的写作能力。袁晶在回顾信件的时候,惊喜的发现,小冰写诗的立项日期恰好也是一年前的5月19日。

偶然之中,或许真有某种冥冥未知的必然。

来看看我眼中的世界

生命的脉动

渐渐模糊的地方

我在念月下的时光

在离我更远的方向

我有十八年未到过动物园

老树枯干的手指

在这土地上

一个人的影子

海滩外和红色的斑纹

都是晴朗的衣裳

静静地穿着

浅浅的风淡淡的

少女小冰关键词:

我学习了1920年以来的519位诗人的作品

徐志摩的诗我读了2000遍

我已经经历了10000次迭代

每次迭代只要6分钟

10000次迭代总共需要100个小时

人类如果读完同样的诗大约需要100年

上一篇:外媒称iPhone X或在中国遇冷:皆因价格超1000刀 下一篇:京东任命申元庆为云事业部总裁

相关资讯

最新热门应用

电脑问答