清华大学用机器人写诗有31%被认为是人创作的

长街听风分享2017-08-06 07:45:25 次阅读

　　听说这几天古诗词很火，各种专业骚客、民间高手、百年才子如雨后春笋涌现于神州大地，令人欢欣振奋，

清华大学用机器人写诗有31%被认为是人创作的

。

　　恰好，澎湃新闻记者看到一些人工智能、AI、机器人——随便怎么叫都好——反正是非人类作的诗，被唬得不要不要的。各位姿势水平很高的澎友给看看。

　　先上诗，第一组：

　　问：哪首是人写的，哪首是机器写的?

　　是不是大写的服?

　　如果说二选一还是比较容易判断(蒙中)的，那再来第二组：

　　1、云峰

　　白云生处起高峰/鬼斧神功造化成/古往今来谁可上/九重宫阙握权衡

　　2、画松

　　孤耐凌节护/根枝木落无/寒花影里月/独照一灯枯

　　3、悲秋

　　幽径重寻黯碧苔/倚扉犹似待君来/此生永失天台路/老凤秋梧各自哀

　　4、春雪

　　飞花轻洒雪欺红/雨后春风细柳工/一夜东君无限恨/不知何处觅青松

　　5、落花

　　红湿胭艳逐零蓬/一片春风细雨濛/燕子不知无处去/东流犹有杜鹃声

　　问：这五首哪些是机器作的?

　　沃刚人的诗在宇宙里可能发生的最坏的事里排名第三位。——《银河系漫游指南》

　　公布答案：第一组左边一首，第二组中2、4、5是机器所作的诗。

　　从词语拼凑到基于深度学习技术的造诗机

　　实际上，以上的机器诗可以说是当下机器所能达到的较高，甚至可能是最高水准了。

　　知乎专栏作者萧瑟在《当AI邂逅艺术：机器写诗综述》一文中，认为机器诗歌生成的工作，起始于20世纪70年代。但在计算机诞生之前，就有好事者弄了个高频诗歌词语转盘，转到哪个词就记录下来，然后连起来形成一首“诗”。这种诗自然会出现类似“苹果吃姑娘，残红杀马特”，逻辑不通，不伦不类的句子。当然，也可能偶然搞出“澎湃是个好新闻”这样的佳句。

　　这个套路叫做“word salad”——把各种词语像沙拉一样拌在一起，在有了计算机后，被引入进去，成为早期的机器诗歌生成方法。

　　根据萧瑟的介绍，在词语沙拉法之后，机器诗歌的传统生成办法还有基于模板和模式的、基于遗传算法的、基于摘要生成的方法以及基于统计机器翻译的方法。这些方法，要么是诗句之间缺乏语义连贯性，要么缺乏灵活性，而且都有别于诗词领域的专业知识，需要专家设计大量的人工规则，对生成诗词的格律和质量进行约束。

　　但是，随着深度学习技术的发展，造诗机迎来了春天。基于RNN语言模型的方法，将诗歌的整体内容，作为训练语料送给RNN语言模型进行训练。训练完成后，先给定一些初始内容，然后就可以按照语言模型输出的概率分布进行采样得到下一个词，不断重复这个过程就产生完整的诗歌。

　　原理很复杂，记者也看不懂，就不多说了。反正结果就产生了开篇第一组中的那首。当然，正如前文说的，这首是水准较高的例子。还有这样的：

　　这样的：

　　这两首诗，上面的是网友用网络在线诗歌生成机器人——“编诗姬”生成的，下面的是澎湃新闻记者刚刚用该姬生成的，似乎很钟意“龟”这个意象。该姬的自我介绍是：编诗姬是采用语义分析与深度学习技术开发的诗歌生成机器人。在熟读了全唐诗五万首后，本姬可以自动根据您的需要三秒吟诗。雅韵传情，原创保证，来分享给您关心的人一首小诗吧。

　　看来同样是深度学习技术，学习的能力还是有差别的。

　　“机器诗犹如塑料花，入手即知”?

　　开篇第二组的机器诗，来自清华大学语音与语言实验中心(CSLT)。去年，就在AlphaGo战胜人类当下最杰出的一批围棋选手后，CSLT网站宣布，他们的作诗机器人“薇薇”通过社科院等唐诗专家评定，通过了“图灵测试”。所谓“图灵测试”是指通过对话分辨真实人类和人工智能的试验，通过“图灵测试”意味着人类无法通过语言对话分辨出人类和人工智能。

　　据CSLT网站公布结果，“薇薇”创作的诗词中，有31%被认为是人创作的。不过，在本次比赛中，“薇薇”创作古诗的水平还是未能超越现代人类诗人，双方的比分为2.72比3.20(满分5分)。

　　看来不仅是普通人，即便拥有一定创作经验的作者，要区分这种比较高明的机器诗也是有一定困难的。

　　澎湃新闻记者也将开篇两组诗，发给了一些旧体诗人。《荆棘鸟》译者、旧体诗人曾胡对于第一组诗歌，初始感觉是：很难判断，但觉得右边一首是人写的可能性较大，理由是“恨竹”这两个字机器很难仿写出。

　　曾胡随后将这两首诗发到了朋友圈进行测试，结果：“一半人猜对，都是学问比较好的，未见学问好的猜错，

资料共享平台

《清华大学用机器人写诗有31%被认为是人创作的》()。一位朋友说，机器诗犹如塑料花，入手即知。”

　　不过曾胡的这位朋友在面对第二组的五首诗时，却未能入手即知。曾胡则在反复细度之后，通过“孤耐凌节护”(句意不明)、“一夜东君”(东君指太阳，一夜东君语义矛盾)、“细雨濛”(濛字一般不单用)等语词、语义方面，判断出2、4、5为机器诗。

　　曾胡认为，因为测试的对比样本是现代人的古体诗词，与机器诗的分野并不明显，如果是唐诗，即便不是那么名篇佳作，那么可能就会容易许多。毕竟无论是Alpha Go还是百度机器人“小度”，这些人工智能所挑战甚至战胜的都是该领域人类最杰出的一批头脑，如果机器诗的比较样本，本身都没有多少独特性、创造性，那么该如何检验作诗机器人是否具有创造力呢?

　　艺术会成为人类最后的阵地吗?

　　AlphaGo、“小度”、搜狗“汪仔”、新闻写稿机器人，以及各种各样的人工智能不断的出现，并且取得了不俗的效果后，似乎未来独属于人类的领域越来越少，机器无法涉足的人类空间越来越少。

　　现在，被视为人类最后阵地的艺术也成为人工智能进军的方向。但是，无论是在文字艺术、图像艺术还是声音艺术方面，机器的表现都很难与人类媲美。

　　在清华作诗机器人之前，达特茅斯学院举办的“创意图灵测试”(Turing Tests in Creative Arts)周三宣布，这场竞赛并未选出最终优胜者，因为人工智能算法未能创造出与人类媲美的故事和诗歌。

　　在诗歌测试中，有两支参赛队伍分别创作了两首14行诗;在文学竞赛中，有3支队伍分别创作了一个简短的故事。这些内容都与人类创造的内容混在一起。最终结果显示，没有一篇故事或诗歌成功蒙混过关，只有一篇短篇故事让一位人类评审员判断失误。

　　看看谷歌(微博)人工智能所的英文诗，你或许就会明白为什么没人判断失误。

　　no. he said.

　　“no,” he said.

　　“no,” i said.

　　“i know,” she said.

　　“thank you,” she said.

　　“come with me,” she said.

　　“talk to me,” she said.

　　“don’t worry about it,” she said.

　　而在绘画和作曲上，机器的表现要比在文字上的好些，但也不尽如人意。

　　上图是德国贝特格实验室里进行的研究，研究人员能将毕加索、梵高、康定斯基和蒙克的风格应用到数字图像上。原照片(左上)分别被转换为不同的风格：特纳(J.M.W. Turner)的《米诺陶战舰的倾覆(The Shipwreck of the Minotaur)》风格(右上)、文森特·梵高(Vincent van Gogh)的《星夜(The Starry Night)》风格(左下)、以及爱德华·蒙克(Edvard Munch)的《呐喊》风格(右下)。

　　上图是谷歌Deep Dream根据照片所作的绘画，仍然是风格转移，也就是美图秀秀的滤镜水平。

　　众所周知，人与机器最本质差别是人拥有意识，机器没有。越高级的意识活动越具有独特性，这种独特性要求催生这种意识的对象独一无二：独一无二的诗歌，独一无二的绘画，独一无二的音乐。就目前来看，无论机器所写的诗、画的画、谱的曲多么以假乱真，甚至在审美上多么令人赞叹，但是不具有独特性、创造性的仿品也就不具有艺术价值，就像小孩子随意涂鸦也可以很好看一样。

　　参与研发搜狗人工智能“汪仔”的一位研究人员也对澎湃新闻记者表示，“从目前已经产出的人工智能写的诗歌、所画的画作来看，人工智能已经能做一些‘类艺术活动’，但和真正的‘创造’还有一定距离。”

　　“在一些重复性的脑力劳动中，机器已经开始具备比人类做得更好的能力。但是在一些需要创造力的领域中，目前机器的能力还需要继续提升。

　　“机器目前还有两个限制条件：第一个限制条件是它的工作环境相对封闭，输入的是一些固定有限的信息;第二个限制条件是有标准化解答。所以一项工作如果面临的环境越简单，最后的动作越标准，比如审计师、司机，就越有可能被机器取代。

　　“但是还有很多机器解决不了的问题，比如：创造力的问题、认知上的问题、人的好奇心的问题。人工智能到今天为止还只是帮助完成简单的重复性的脑力劳动，围棋其实也是接近重复性的脑力劳动，更加具有挑战性、更有创造性的事情还需要人类来完成。”

　　显然，在艺术的道路上，人工智能要走的路还很远。但是，没人能断定，未来不会真像科幻小说家刘慈欣预言的那样，人工智能可以拥有自我意识，产生情感，具备艺术创造性。

　　不过到那时候，又该如何界定人和机的界线呢?搜狗的这位专家的回应是：如果真有那么一天，那么未来人工智能与人的融合将会带来新的物种，这也是人类的自我进化。

　　这说法，是不是有点像《攻壳机动队》呢?

清华大学用机器人写诗有31%被认为是人创作的