21世纪有关计算机领域的十二个重大难题
作者:高庆狮,中科院院士
声明:本文发表在《科学》 2005年04期
自从1946年第一台电子数字计算机诞生以来,每隔3~7年,计算机的速度、性能和可靠性可提高十倍,价格和体积可下降十倍,整体性能以百亿倍的速度飞速发展。原先需要花几万年才能完成计算的数据,现在只需??小时,原本不可能实现的梦想变成了现实。计算机的应用使原先极其昂贵的计算成本变为可忽略不计的成本,令原先没有经济效益的应用项目具有巨大的经济效益,从而导致了新的产业革命和社会各领域的变革。计算机领域神速发展的基础
支撑计算机领域半个世纪辉煌的基础是器件、部件、理论、系统结构、软件技术和应用等方面的数十项根源性创新。根源性创新是指在根源部位推动新兴产业诞生或者影响产业发展的科学技术创新,例如,阴极射像管、锗半导体一硅半导体一集成电路、磁心存储器、磁盘光盘、布尔代数、指令可以被当作数据来加工等。如果没有“指令可以被当作数据来加工”这项根源性创新,高级语言及其编泽系统不可能诞生,软件不可能飞速发展,依赖于软件接口的互联网也不可能存在,计算机半个世纪的辉煌就不可能呈现。
很遗憾,数十项重大根源性创新没有一项是由中国人发明的,只有一项“磁心存储器”是由美籍华人王安发明的。然而随着中国经济的不断发展,这将成为永远的过去,中国人必将在创造未来计算机领域的辉煌中占有重要位置。
当今计算机领域繁荣的现状与特点
虽然微软公司在当今计算机软件领域独占鳌头,但是其辉煌成就的基础不是比尔盖茨创造的,而是帕洛阿尔托研究中心的四大根源性创新:图形用户界面(CU0、面向客体的编程技术(OOP)、激光打印机和以太网。图形用户界面不仅使DOS操作系统被Windows所代替,而且还导致可视化编程技术的出现,最终微软公司获得了由图形用户界面带来的数千亿美元的经济效益。
随着计算机的飞速发展,它的应用范围也迅猛扩大,从军用到民用,从大工程、大企业到中小型企业、个人等。计算机与通讯根源性创新发展的结合,造就了当代互联网的繁荣,形成了网络时代。计算机网络领域的发展是整个现实世界到网络空间的全面映射。映射的一致性产生了标准和协议,它们成为网络时代的时髦名词。当今计算机领域具有应用第一、服务第一的特点。如今,计算机应用的发展已远远超过计算机系统本身的发展,成本随之大幅下降,应用费用从原先取决于设备费用、人工费用忽略不计变成为取决于人工费用、设备费用忽略不计。随着设备费用的下降,计算机应用产业飞速发展,计算机领域的发展方向由软硬件系统第一转变成应用第一。网络的本质是服务,由最初的通讯服务、信息服务发展到综合教育服务、娱乐服务、购物服务、计算服务、金融服务、旅游服务、社会服务等,并要求一体化服务。
十二个具有重大社会效益和经济效益的难题
21世纪,计算机领域面临很多难题,其中至少有十二个是重要的,每一个都蕴含超过百亿美元的产值。
网络安全
网络安全有狭义和广义之分,狭义的网络安全指通讯过程中信息的完整性、保密性;计算机系统及其安装的应用系统不被网络上的骇客直接攻击、盗窃和破坏,不被非法入侵活体(如病毒)盗窃和破坏;系统被破坏后,具有迅速恢复的能力。广义的网络安全还包括防止网络犯罪和维护网络可靠性。网络犯罪即社会的犯罪活动在网络上的映射,例如,利用互联网进行特务、邪教、诈骗、黄黑活动等犯罪活动。维护网络可靠性的目的在于确保网络系统不中断正确地运作,使网络具备抗天灾人祸的能力。
当前,解决网络安全的方法主要依靠法律、管理、鉴别认证技术、加密技术和隔离技术等。法律的威力取决于严惩的力度,而且对众多的小公司往往难于有效。任何大型软件系统都难免有漏洞,操作系统也不例外。管理包括人事管理、网络管理和计算机系统管理。鉴别认证技术和加密技术是相对的,新的鉴别认证技术和加密技术发明后,经过一段时间,就可能出现新的冒充技术和破译技术。因此,网络安全的研究是长期的。另外,目前的安全技术产品基本为软件技术产品或软件固化,或者建立在通用机上的软件系统,如果病毒等非法人侵活体难于鉴别出来,杀病毒软件也难于制止新病毒对计算机系统的破坏和盗窃。因此,采取计算机系统结构和软件“软硬结合”来防病毒破坏和盗窃是值得关注的方法。虽然采用隔离技术是有效的,但对网络行为也需要加以适当和合理限制,彻底取消网络功能,是行不通的。大面积完全隔离的网络,也难以不被暗中快速入侵。
海量信息检索
网络上至少有四类海量信息资源,即付费开发的海量信息资源,无政府主义的互联网海量资源,巨大信息流的监控,巨量未整理的资料。1980年代初期面临的最大困惑是,在网络上常常查询不到需要的信息,相反却得到一大堆不需要的无用信息,20年之后的今天依然如此。如何解决呢?关键是利用语义进行内容检索,不仅要统一人类混乱的术语和概念,还要实现计算机对自然语言知识层次的理解,这需要与目标库大小无关的高速搜索算法和类似于主体的网络机器人。
自然语言理解就是对语义的理解。语义有三种不同的层次:语言层次、知识层次和语用层次。例如,“把这杯水倒人那缸浓硫酸里。”这句话包含“这”,“杯”,“水”,“那”,“缸”,“浓硫酸”,“把倒人里”等七个语义单元,其中,N表示名词。如果一个机器人只有语言层次的理解,它能根据“这”找到一个标有“水”的“杯”,再根据“那”找到一个标有“浓硫酸”的“缸”,然后执行把“杯”中的“水”倒人标有“浓硫酸”的“缸”里。如果它具有知识层次的理解,就不会立即执行把“杯”中的“水”倒人标有“浓硫酸”的“缸”里,而是警告主人“危险”,因为它具有的知识层次的理解能考虑到把水倒人浓硫酸里会发生爆炸。知识层次的语义本身又可以分许多层次。例如对小孩和对植物学家而言,“苹果”的知识层次的语义差别极大,在小孩看来,它是一种可口的水果,对植物学家而言,其语义的描述可成为厚厚一本书。语用层次的理解更为复杂,例如“今天是星期天”具有多种语用层次的理解:仅仅是回答今天星期几,或许是妻子劝告丈夫该休息休息,或许是小孩提醒父母该实现星期天带他到动物园玩的许诺等等。
上亿台闲置计算机的利用
全世界数亿台计算机多数时间里被闲置或利用率不高,如果它们全被利用起来,不仅是一笔巨大的财富,而且具有每秒数亿亿次的神奇计算能力,但实现计算机的全球利用难度很大,最关键的问题是双向安全,即如何确保主系统不受客户的安全干扰,同时又确保客户的计算不受主人的安全干扰。
另外,不要把上亿台闲置计算机能力的利用与计算网络及网络计算混淆起来。计算网络早在1980年代初期就已提出,其目的是让更多地区更多的人共享计算资源。当今,人们可以用更方便的方式共享网络上的计算资源,如用手机进行上网计算。网络计算即一个计算题目在网络上的分布计算。
互联网本质是一个服务系统。一体化服务的特点是使用户不需要考虑或者提供任何与服务需求无关的繁琐信息(例如,服务来源、地址、服务单位、如何服务等),就可以轻松自由地得到高质量网络服务。
一体化服务将进一步发展成包括各种资源和服务在内的一体化服务,并构成下一代互联服务网。一体化服务的关键是服务一体化和资源一体化。服务一体化的目的是提高服务质量,资源一体化则是服务一体化的必要条件,同时也是提高资源利用率的有效途径,其核心是信息资源的一体化。资源包括客户端的资源和服务端的资源,涵盖各种信息、软件和设备装置。
下一代互联服务网的关键技术是Cddn Crid在词典中不仅有“网栅”“网格”的含义,还有“电”“气”“铁路”服务网和网络”的含义。语义一体化服务网是一体化进一步发展中的一个新的生长点,它是在一体化服务中引入服务所需的不同层次的语义内容,以便有利于实现信息资源一体化及服务一体化,是实现服务一体化及信息资源一体化不可或缺的部分n
自然语言自动翻译
自然语言自动翻译的巨大经济效益和社会效益的前提要求是实用,即没有语无伦次、没有正错混杂、合乎目标语言的习惯。历史上,实用的翻译方法有整句和句型模式翻译,近代有翻译记忆,它们的缺点是语言覆盖范围和语言知识库的比例太小。基于实例的方法能有效提高上述比例,但仍为近似方法,存在语无伦次、正错混杂和夹杂不合乎目标语言习惯的成分。历史上的主流方法,至今仍然不能解决实用问题。目前比较热门的机器翻译方法是基于统计的方法,它可以迅速从很低水平快速提高到较高水平,但总有一部分不正确;它可以作为很好的工具,但难以独立使用。
自然语言自动翻译半个世纪以来没能实用的关键原因是自然语言缺乏精确描述,现有的机器翻译方法难以达到实用。由于翻译是在任何复杂的点集之间的变换,其在几何基坐标的精确描述基础上是十分简单和容易的。基于这个几何提示,建立自然语言基坐标,在语义单元(点)组成的语义语言(点集)的机器翻泽方法可能是解决问题的有效途径。
软件设计
软件的本质是设计。从本质上说,软件设计最核心的五个基本难题是可靠性、再用、时空群体工作、尽量自动和自然化,其中以可靠性为首。通常,软件维护费用远远超过开发费用,一个大型软件即使工作了许多年,仍然会有一大堆错误。在某些使用中,软件不可靠将导致灾难性的后果。软件可靠性的核心是软件的正确性,包括已经存在的软件系统错误的发现及排除、新软件系统的正确设计。软件可靠性还包括硬件故障时无负作用的恢复能力,硬件偶尔故障或操作错误时的安全、快速、自动或半自动恢复能力等。
库函数、类库和构件是常见的再用技术。如果一个待设计的大型软件,其功能与已经存在的软件大体相同,只有5%不同,且不同之处处于分散状态,那么新软件的设计工作量只是原先的5%、10%、40%,还是更多?能不能控制在15%以内成了再用的关键。
如果许多软件设计人员共同设计一个大型软件系统,其中部分人员是流动的,即分布在不同的时间段和空间,那如何有效地组织大的群体来设计大型软件系统?特别是在保持软件人员自由创造力的前提下有效地组织群体工作。“软件工:程”正在努力解决这个问题,但往往以牺牲软件设计人员的创造性为代价。
软件研究工作一开始就以尽量自动为目标,但实际上并没有完全做到,它在不断提高过程中。
自从引入图形用户界面后,非计算机专业的用户可不需要计算机专业知识,仅依靠自身的专业知识来使用计‘算机。这是自然化的第一步,现已实现。但是能否让不懂计算机或者懂得不多的各种专业人员设计自己的专业软件?这在当前似乎是天方夜谭,但并非不可能、18年前,物理学家李政道的两名物理专业的博士生设计出研究需要的巨型机,这台巨型机的开发是白然化的典范,这两位博士生并没有改行。
下一代程序语言
软件设计效率的发展十分迅速,无论是编程语言、技术、方法、工具、界面与环境,还是包括使用界面在内的软件本身质量,都有重要的发展。这几方面的发展相互关联,每一个都面临下一步问题。例如,面向客体的编程技术和可视化是否会发展成下一代程序语言?从模块化符号化编程技术、高级语言、结构程序化编程技术、面向客体的编程技术发展到面向客体的编程技术加可视化,每个飞跃都集成了解决五个基本难题的成果,极大地提高了编程效率。面向客体的编程技术的下一步将是通过编程语言来集成软件设计中五个基本难题的成果。
下一代操作系统
有人认为DOS是一维操作系统,Windows是二维操作系统,接下来应该出现三维系统,况且CAD技术、虚拟现实都需要三维技术支持,但这种猜想太过简单和幼稚。人们宁愿牺牲兼容性而采用图形用户界面的Windows,是因为它与DOS相比,在方便人们使用、思考和编程方面有本质的飞跃。下一代操作系统也是集成软件设计中五个基本难题的成果。
人类智能及其模拟和应用
智能是能自动学习知识,而且能自动有效地利用学习到的知识去解决问题的通用能力。学习分为许多类,鸟学习飞翔、人学习骑自行车都进行了识别学习和训练学习,许多动物都具备这两种学习能力。知识学习仅仅是人类及少数动物才具有的能力,人工智能的最初目标就是让计算机模仿人类智能,协助人类进行部分创造性劳动的“认知”目标。但是50年来,没有任何人造系统具有智能。严肃的人工智能学家早就已经把人工智能的目标改为:专门研究那些人类比机器做得好的领域的问题。例如,人类下棋比机器下得好,那么机器下棋就是人工智能要研究的领域。如果一个不再修改程序的下棋系统,一开始输给大师,下过几盘棋后,有输有赢,接着再下几盘,赢的比例越来越高,可以认为这个下棋系统具有智能味道,因为智能是通用能力,而下棋能力不是通用能力。
1970年代以来,有些人喜欢用“智能”表示灵巧。智能缝纫机是计算机芯片控制的灵巧缝纫机,没有智能。西方有一些学者,喜欢混淆概念,极力模糊智能的原意,这是不恰当的。
人类登月的愿望已经超过五千年,但是实现登月只有五十年。牛顿创立牛顿四大定理(1666年的万有引力和1687年力的三大定理),给登月建立了理论基础。光有理论基础,仍然不可能实现登月。直到约300年之后,控制技术和燃烧技术成熟以后,人类登月的愿望才得以实现。要实现计算机协助人类进行某些创造性劳动,首先要解决其理论基础,并考虑其技术前提。
计算科学
计算科学与理论科学、实验科学具有同等的重要性,三者并称为三大科学。当今的计算,不仅仅是一门科学,也是一个大产业。20世纪后期,计算流体力学、计算化学、计算物理学发展已经十分成熟。1970年代初期,钱学森院士提出的计算流体力学的计算要求是浮点64位以上的一万亿字存储容量,每秒一万亿次计算速度。当今的生物信息学,计算量远远超过以往的各种计算科学,且这仅仅是一个开始,因为至今还不清楚生物信息是如何具体控制细胞的发育。计算速度需求的宝座,现在似乎要让位给生物信息学了。
集成电路的下一代
1970年代就开始议论集成电路的极限,以及预测光逻辑集成器件将代替集成电路。30多年过去了,集成电路的极限还未到达,光逻辑集成器件热了十多年后现已消失得无影无踪。集成电路之后一定会出现新事物,但是现在肯定它是什么,似乎早了一些。
光纤的后继者
随着通讯能力的迅速发展,人们大多看好光纤之后是无线,至少小区接人采用无线方式。然而,未来似乎存在通讯能力过剩的问题,它可能会促使具有更大通讯能力的新应用出现。
根源性创新人员的生长土壤
人才资源与能源资源的区别在于能源资源在使用中消耗、减值;人才资源在使用中成长、增值。根源性创新人员的生长土壤由生活环境、目标环境、人员环境、实践环境、分工环境、自由创造环境、学风环境等多种环境构成。生活环境指研究人员必要的物质和生活条件。目标环境指参与前沿、重大的研究项目。人员环境是指拥有的一大批跨学科人才的研究队伍和所营造的高水平学术交流氛围。信息环境是指能提供丰富及时的国际化信息的渠道。实践环境则是包括资金、人员及物质条件的重要支撑环境。此外,分工环境也是一种重要的支撑环境。良好的“研究?开发?市场”分工环境相当于成果放大器,在这种环境下,任何重大创新成果能迅速增益,实现巨大的经济效益和社会效益。而糟糕的分工环境相当于成果衰减器,创新成果的增益效果常常等于零。自由创造环境是根源性创新的“必然基础”,即根源性创新往往源于偶然,而不是根据某些人的计划而产生。根源性创新人员以社会重大需求为动力,经过长期观察、思考,研究和探索而产生创新成果?这些是不可能事先计划的。虽然创新人员观察到的目标未必在计划或者规划中,但聪明的规划人员常常会把创新人员捕获的重大新目标灵活及时地补充纳入其规划,并且给予及时和充分的支持。学风环境则要求根源性创新人员进行独立思考,追求、服从真理,不人云亦云。
留下你的评论