你订阅的微信号是机器人写的?
【静点评】曾经有位群友发出疑问说,你不认为我们的群主是外星人么?对此发出疑问其实是应该的。因为算法对世界的统治已经到了真假难辨的地步。例如,现在你可能开始分辨不出自己所阅读的信息,到底是来自于人类还是机器。这难道不是另一种意义上的图灵测试么?面对算法生成的新闻,你是信呢还是不信呢?
就算新闻本身的确是人类生成的,例如我从生物结构上看是人类。那么你又是怎么知道我大脑中的思维是怎么生成的?也许这些思维是被某种意念远程控制或影响的呢?虽然现在科学还无法证明这类假设,但人类思维也可能被某种更高级的算法所控制。
总之,如果你被一条新闻所吸引,一定要多问几个为什么?算法背后还有算法,现实背后还有现实。最终你可能会发现,一层一层的虚拟俄罗斯套娃里面,原来只是一个没有实体的算式或意念。
对微信公众号的订户,或者好奇的群友来说,福音在于,如果算法可以最终代替人类的思维,那么,他所偏好的这个公众号作者,或者他所喜爱的群主,永远不会消失。人类的形体终有尽时,但算法可以按照某种程式继续创造下去,直至永恒。
今天就给大家推荐一篇@iWeekly周末画报 转载的纽约时报中文网报道,原题:你读的新闻可能是机器人写的。
The New York Times
让我来猜猜看,你认为你所阅读的内容是由一个真实存在的人写的。你可能是对的,也可能是错的。或许你应该让我确认这种说法,就像你的电脑要求你将抽象艺术般的字母和数字输入那个令人厌烦的文本框一样。
因为,目前有相当多的阅读内容不是由人类编写的,而是由计算机算法完成的。我们可能应该会猜想,每天24小时向我们袭来的信息可能不完全是由人类俯在笔记本电脑前编写的。
这是可以理解的。人类的努力已经无法满足我们现在能够使用的各种数字渠道对内容的需求。这种需求,再加上更加成熟的技术,滋生了一个“文本自动生成”产业。
该领域中的公司旨在利用算法和自然语言生成器编写内容,使人类摆脱写作过程中的负担。将一些数据——比如金融收益数据——输入它们的平台,然后“嗖”的一声!几秒钟之内就会产生一些内容,提供人们需要的各种报道。
这些机器人写手并不只是重复数据;它们以适合目标受众的风格——从古板到活泼——写出看起来像是人类编写的报道。它们非常聪明,当你阅读这些报道时,你绝不会猜到这个作者没有心跳。
看看这两篇体育报道的开篇语句。
“周日,天使队(Angels)在第九局中落后两分时,情况看起来不妙,但凭借弗拉迪米尔·葛雷诺(Vladimir Guerrero)赢得的关键一分,洛杉矶天使队挽回败局,在芬威球场以七比六的比分击败波士顿红袜队(Boston Red Sox)。”
“周六下午(4月24日),密歇根大学棒球队在威尔彭棒球场——具有历史意义的雷·费舍尔体育场的所在地,通过赢得四分的第五局比赛,扭转局势,最终以七比五的比分赢得了与爱荷华棒球队在周末举行的三场比赛中的最后一场。”
如果你无法分辨哪一篇是由人类写的,那你不是唯一一个。瑞典卡尔斯塔得大学的克里斯特·克莱瓦尔(Christer Clerwall)开展了一项研究,并在《新闻实践》(Journalism Practice)上发表了相关论文。研究显示,当看到类似的体育报道时,调查对象无法辨别其中的区别。(顺便说一下,在我们提供的例子中,第一篇是机器写的,第二篇是人写的。)
算法和自然语言生成器已经存在了一段时间,但随着对它们的需求刺激了投资和创新,它们变得越来越好,越来越快。我们产生海量的大数据(Big Data),而且很复杂,凡人难以处理,需要人工智能,而不是人类智能,来从中获取有意义的信息。
将之应用于大量资源,特别是在金融、体育和销售规划等数据繁多的领域,这种新的软件平台就会应用先进的度量标准,去确认模式、趋势和反常数据。然后,它们会迅速产生解释性文本,成为代替人类的机器人记者。
美联社每季度利用自动化洞察力公司(Automated Insights)的Wordsmith平台撰写3000多篇金融报道。他们在苹果公司公布最新创纪录收益几分钟之后,就发表了一篇报道。福布斯利用叙述科学公司(Narrative Science)的Quill平台撰写类似报道,并称该公司是他们的合作伙伴。
然后又出现了Quakebot,《洛杉矶时报》利用这种算法分析地质数据。它是第一篇有关南加利福尼亚州去年发生的4.7级地震的新闻报道的“作者”。地震发生后,该报立即在其网站发表了这篇报道。该报还利用算法加强命案报道。
如果我们对此感到一丝不安,这也是可以理解的。这些软件程序毕竟对我们来说是一个黑盒子,它们可能偏向于一些特定的基准,或包含我们可能无法辨别的倾向性。更不用说,我们可能会错失一个好奇的、具有创造力的人类在思考相同的信息时所能产生的那种洞见。
这一切所表达的呼声,包含着常见的解放主题——机器新闻将会解放人类,使人类能够更多地进行报道,减少数据处理工作。
这不失为一件美事。但是,据叙述科学联合创始人克里斯蒂安·哈蒙德(Kristian Hammond)估计,到本世纪20年代中期,将有90%的新闻由计算机算法生成,其中大多都无需人工干预。倘若这个预测接近事实,那么我们就会处在一个滑坡之上。
目前,机器新闻已经占据主导,但它并未就此止步。随着软件悄悄取代我们成为传播者,从政府事务到梦幻足球,再到对你下一双鞋子的评价,算法生成的内容也在迅速向我们文化中的各个角落和缝隙渗透。
自动化洞察力公司指出,其软件去年一共创作了10亿个报道,许多都没有人工干预;它和叙述科学公司的主页上,展示着我们耳熟能详的客户标志:三星、康卡斯特、美联社、Edmunds.com和雅虎。所以你极有可能在没有意识的情况下消费了这种内容。
机器人还在写书。来看看法国的欧洲工商管理学院(Insead)管理科学教授菲利普·M·帕克(Philip M. Parker)的作品:他的专利算法系统已经生成了超过100万本图书,其中有10万多本在亚马逊上销售。他说,给他一个技术性或晦涩难懂的话题,他的系统就能模仿可能就此题目进行写作的人的思维过程,挖掘数据,撰写一本书或一篇报告。比如,《红斑痤疮患者官方资料》(The Official Patient’s Sourcebook on Acne Rosacea)。
叙述科学声称它可以创作“与出自人类的作品分毫不差的文本”。自动化洞察力则称它的专长是“像一个人一样”写作,但这正是让我担忧的地方。这种说法事实上已经成为一段插入语——不只是对内容创作,而且对于大多数科技都是如此。
我们的手机可以(像一个人一样)和我们说话。我们的家用电器能够(像一个人一样)接受指令。我们的汽车将能(像一个人一样)自行驾驶。那么,“人”究竟是什么意思?
在科技的帮助下,下一个革命性的进展似乎总显得顺理成章。这就是危险所在。鉴于它反复引诱我们,我们就会放弃一小部分自己。我们很少会后退一步,反思我们最后放弃的东西是否比得到的更多。
再者,当每天都有这么多信息需要吸收的时候,谁还有时间去思考这个问题?毕竟,我们只是人类。
翻译:许欣、陈柳
纽约时报中文网
转载自公众号: iWeekly周末画报
留下你的评论