2016 深度学习独领风骚

作者: CADE METZ

中文原文地址: AI100 

英文原文地址: https://www.wired.com/2016/12/2016-year-deep-learning-took-internet


在澳大利亚的西海岸,Amanda Hodgson正在向印度洋发射无人机。这些无人机是用来拍摄水面照片的。人们可以通过这些照片,定位在珀斯附近海湾栖息的儒艮,从而保护这些濒临灭绝的海洋哺乳动物。但主要的问题在于,Hodgson和她的团队没有时间来检查所有的航拍照片。这些照片数量庞大,大约有45000张。而且对于未受过训练的人来说,发现这些动物不是一项容易的事情。所以她把这项工作交给一个深度神经网络来处理。 如今的神经网络应用广泛:它们可以用来识别,推送给你的Facebook新闻图片中的面孔;可以用来理解你向自己安卓手机提出的问题;可以帮助Google搜索引擎的高效运行。神经网络模型的构建,受到了人脑神经元的网络结构的启发。这些基于数据扫描的数学模型,通过广泛分析输入端口的数字离散数据,学习得到相关模型,完成对应任务。现在,珀斯默多克大学的海洋生物学家Hodgson正在使用这种技术,从成千上万张拍摄于自然水域的照片中定位儒艮。她的神经网络在开源框架TensorFlow上运行,这一开源的深度机器学习框架,是由谷歌提出的。 如霍奇森所提到的,由于儒艮通常在海面下进食,因此检测儒艮的任务相对比较困难。 她解释道,“它们可能被误认为白色的水,或者水面上的眩光。”但是她这里使用的神经网络模型,现在已经可以正确识别大约80%的分布在海湾的儒艮。 这一项目仍处于早期阶段,但它已经表明了深度学习在过去一年的广泛影响。在2016年,这个年代久远,但却非常强大的技术,帮助了一台谷歌团队研发的机器,在一项古老的游戏(即围棋)上击败了世界顶级棋手之一。而就在几个月前,人们对于这一点,还表示深深怀疑。但这只是深度学习应用最突出的例子。随着这一年的结束,深度学习不再是晚会的戏法,不再是象牙塔里的研究。它从内到外,彻底改变了诸如谷歌,Facebook,微软和亚马逊等公司。深度学习在世界范围内的迅速传播,也在很大程度上归功于这些互联网巨头开源软件以及提供的云计算服务。

新的翻译形式

在过去几年中,Google Photos等应用,基于神经网络技术,改进了图像识别功能。同时,在Google Now和Microsoft Cortana等虚拟助理上,通过应用神经网络技术,将语音识别的准确率显著提高。而在今年,基于这项技术,Google团队实现了机器翻译性能的飞跃。这里提到的机器翻译具体是指,机器自动将语言从一种语言翻译成另一种语言的能力。9月份,Google推出了一项名为Google Neural Machine Translation(谷歌神经网络翻译)的新服务,它完全基于神经网络运行。据该公司称,这种新型翻译模型,在某些语言之间的翻译任务上,错误率降低了55%到85%。 Google在训练该神经网络时,根据自己已有的大量翻译数据进行训练。其中的部分训练数据包括旧版Google翻译应用提供的翻译数据,翻译效果相对不如人意。但训练数据中,同时包括翻译专家的翻译结果。根据这些质量参差不齐的训练数据,我们可以对训练集的质量进行评价。深度学习的一大优势就在于,它可以克服质量较差数据(即负样本)的影响。具体来说,只要输入足够的数据,即使存在负样本,它也可以基于这样的训练集,最终达到输出效果远远好于负样本的效果。 Google方面的首席工程师Mike Schuster,不介意承认这样的工作远非完美。但同时表示,目前的成果,仍然是一大突破。由于该服务完全基于深度学习框架,因此Google可以更轻松地继续改进相关服务。它可以将整个系统作为一个整体,对整体框架结构进行改进。而不是类似过去基于特征工程的方法,过多关注细枝末节。 与此同时,微软也正朝同一个方法努力。这个月(即12月),它对外发布了新版本的微软翻译应用。这一应用,可以帮助实现最多九个不同语言的人之间的即时对话。这个新系统几乎完全运行在神经网络上,微软副总裁Harry Shum,同时也是该公司的AI和研究小组负责人,认为,这个应用的推出十分重要,因为这意味着微软在机器翻译这一领域,可能会有更快的进步。

#新的聊天方式 在2016年,深度学习也在聊天机器人领域崭露头角。其中,最引人瞩目的是,在今年秋天发布的Google Allo。Google Allo,可以对用户收到的文本和图片进行分析,并即时提供关于回复的建议。它基于谷歌早期,与电子邮件功能比较类似的”Smart Reply”技术。这次提出的Google Allo的一大优点在于,它在很大程度上没有回避目前机器学习技术存在的局限性。它给出的建议回复都比较简短,而且同时返回多个结果。这样做的原因在于,目前的人工智能无法做到,保证始终给出正确的建议。 在Allo系统中,神经网络也可以帮助回答用户对Google搜索引擎提出的问题。它们帮助公司的搜索引擎了解用户需求,并帮助制定答案。根据Google Research产品经理David Orr的说法,如果没有深度学习,应用程序本身是不可能做到这一点的。 “你需要使用神经网络,或者换句话说,至少这是我们目前找到的唯一方法。”他说,“我们必须使用我们目前掌握的所有最先进的技术。“ 神经网络目前还无法进行真正的自主对话。不管CTO们在他们的展示中是如何承诺的,基于深度学习的聊天机器人在这个方向上,还需努力。但是,谷歌、Facebook和其他公司的研究人员正在深入研究深度学习技术,以实现这个终极目标。CTO们已经作出承诺,研究人员将通过努力,取得像我们现在看到的,深度学习在语音识别、图像识别和机器翻译等领域上达到的效果。我们也可以预见,人机对话将成为下一个技术前沿。

新的数据中心管理方式

今年夏天,Demis Hassabis和他的Google DeepMind实验室,在成果构建了在围棋上打败顶尖人类选手的AI(AlphaGo)后,意识到这里他们构建的AI,可以用于自动控制Google全球计算机数据中心网络。他们构建的人工智能系统,通过深度强化学习技术,强化了机器学习围棋的能力。而且深度增强学习技术,在他们早期的项目中也取得了成功。这些项目包括训练机器“玩“Atari公司过去发布的游戏等。这里他们训练好的AI,可以自主决定何时打开安装在数据中心的数千台计算机服务器中的冷却风扇,何时打开数据中心窗口以进行额外冷却,以及何时关闭昂贵的空调系统。总之,它可以控制每个数据中心内的120个相关功能。 正如彭博所报道的,这个人工智能系统十分有效,已经帮助Google节省数亿美元。换句话说,它抵消了收购DeepMind的成本。众所周知,谷歌在2014年收购DeepMind,大约花费了6.5亿美元。现在,Deepmind团队计划在数据中心的计算设施中安装额外的传感器,从而使系统可以收集额外的数据。并利用这些数据,训练目前的人工智能系统,使其达到更高的控制水平。

新的云计算服务

当各大网络巨头,将深度学习技术推广到自己的产品中的相关服务的同时,它们也正在将深度学习推广给公众。在2015年年底,谷歌开源了TensorFlow项目,在过去一年,这个一度私有的软件平台的传播远远超出了公司层面的范畴。例如像Amanda Hodgson这样的人也从中受益良多。与此同时,Google,Microsoft和Amazon已经开始通过云计算服务平台,向公众提供他们的深度学习技术支持。任何程序员或公司,都可以使用它们来构建自己的应用程序。人工智能作为一项服务项目,可能在未来成为这三个网络巨头的最大业务。 在过去的十二个月中,这个新兴的巨大市场,激发了新一轮人工智能人才争夺的热潮。斯坦福大学的李菲菲教授是目前AI研究领域最知名的专家之一。Google在今年聘请她,负责一个专门用于人工智能的新成立的云计算部门。同时,亚马逊委任卡内基梅隆大学的教授Alex Smolna,在其云服务帝国中扮演重要角色。这些巨头们正在尽可能快地抓住世界顶尖的AI人才,不给别人任何机会。对于普通人来说,在这个过程中,这些巨头挖来的人才,会努力与其他人分享一些他们开发的结果技术。 随着人工智能的演变发展,计算机科学家的角色正在改变。当然,世界仍然需要能够开发软件的人。但越来越多的实际场景,也会需要人们具备训练神经网络模型——这一独特的技能。而这一技能更多地需要“诱导“数据,而不是凭借自己的经验知识建立模型。像谷歌和Facebook这样的公司不仅雇用了这样的新型人才,而且还为他们现有的员工重新描绘了新的未来 ——在未来,人工智能将会在每个人的生活中重新定义技术。

Report Story

留下你的评论