深度计算、广度计算与信息网络

王行刚

1 前言

从计算技术的角度来看,计算一直在向深度和广度进军,因此可以从“深度计算”(deep computing)和“广度计算”(pervasive computing) 两个领域来观察计算技术的发展。

从计算技术与通信技术结合的角度来看,网络一直在从封闭向开放、从专用向公用、从数据传输向多媒体传输、从单纯的信息传输向“信息传输”与“信息处理”紧密结合的方向发展,即向信息网络方向发展。信息网络既支持深度计算,也支持广度计算,形成了“网络计算”的新领域。

本文拟从计算技术与网络技术结合的角度来观察分析近期出现的进展与趋势。

2 深度计算

计算向深度进军,体现在不断提高计算机系统与网络的性能,不断突破高速、高性能计算的上限;体现在计算机从数据处理迈向知识处理,从专家系统到智能机器人,不断扩展人工智能的实现领域;体现在脑科学研究与计算技术的结合等方面。与深度计算有关的技术进展可以具体地体现在下述几方面。

2. 1 高性能计算机突破万亿次/ 秒大关

高性能计算已成为许多科学和工程实践的关键技术。科学家们使用超级计算机研究复杂现象,例如可以用来预测复杂的非线性现象,在试验探索物理参数的变化规律,模拟现实世界中所发生的某些事件等。对高速计算能力的需求是永无止境的。正是这种需求推动着超级计算机系统的发展,并且带动了整个计算技术水平的提高。

·1997 年,美国能源部和Intel 公司研制的“两面神”(“军民两用”之意) 超级计算机突破1 万亿次/ 秒大关,采用9152 个处理器,每秒浮点运算的峰值速度达1. 4 万亿次。当年世界上最快的前3 台计算机均为美国造。

·1998 年10 月,IBM为美国能源部提前一年制成第2 台模拟核爆炸的超高速超级计算机“兰色太平洋”,采用5800 个处理器,浮点运算速度达到3. 88万亿次/ 秒,可存储美国会图书馆全部馆藏,造价9600 万美元。

·1998 年8 月,美国科学基金会、能源部召开“先进科学运算研讨会”,纠正“重军轻民”状况(超级计算机机时仅1/ 10 为民用) ,制定了民用超高速计算机研制计划:

2003 年:40 万亿次/ 秒

2005 年:100 万亿次/ 秒

2010 年:1000 万亿次/ 秒

·1998 年1 月,日本NEC接受科学技术厅委托,拟于2001 年完成一种并行处理计算机,其性能为:主存容量4 万亿比特,浮点运算速度32 万亿次/ 秒以上,可用于受控热核聚变、生命科学、气象工程等大规模的模拟实验和数值计算。

2. 2 高性能网络计算

尽管超级计算机的能力不断增长,但仍然有许多计算问题是世界最大的超级计算中心的计算资源也无法支持的。解决这个问题的另一途径,是通过网络实现高性能计算。

美国科学基金会在1997 年和1998 年启动了“分布式网格(grid) ”和“知识及分布智能”等研究计划,美国宇航局(NASA) 会同国防部、能源部和NSF 联合投资3. 12 亿美元,在1998 年9 月实施IPG( Information Power Grid) 计划,支持网格原型构件基础研究和测试床建设。这些计划高度重视网络计算和信息安全研究的重大科学意义和战略意义。

2. 2. 1 网格

·网格指高性能计算环境,它是高性能计算和信息服务的战略性基础设施。

网格接入多种体系结构的高性能计算机和数据存储设备,形成聚合计算能力和TB 量级的硬盘总容量,具有单一系统映象,可利用全网格资源。

·网格节点,是地理上独立的计算和信息中心,分两类:以科学计算为主的网格节点,计算能力不低于每秒100 亿次或1000 亿次浮点运算;以海量信息处理为主的网格节点,配备可扩展至TB 级容量的存储设备,以及与之匹配的信息查询和计算能力。

·网格系统软件,在于发挥各网格节点的高性能计算系统和大容量数据信息处理系统的性能和功能,为多用户远程使用网格节点的计算和数据资源提供统一管理、易于远程使用、安全的高性能计算和大容量数据处理环境。网格系统软件能同时支持远程应用程序开发和远程生产性使用两种方式。

2. 2. 2 网络计算理论与方法

信息网络支持深度计算与广度计算的发展,面临着一系列理论和实际问题,诸如:

·每一时刻有海量程序进程(或代理) 并发运行,这些进程在个体上具有确定性,在群体上呈现随机性。海量进程之间的通信,需要解决时空协同、高度并行、快速交互、灵巧适配。

·解决海量信息的合理组织、有效管理、信息安全、综合利用。

·研究解决特定问题的分布式算法等。

2. 3 知识处理

从数据处理到知识处理,是计算向深度进军的一个里程碑。在知识处理领域,有名的“人机大战”曾取得轰动效应。

在1996 年IBM“深蓝”计算机以3.5: 2.5 战胜国际象棋大师卡斯帕罗夫之前, IBM 在1994 年、1996年设计的“深思”、“深蓝”曾两次败于卡氏。1996 年改进的“深蓝”存了100 年来所有国际象棋大师的棋谱,编成灵巧程序,速度提高一倍。256 只专用处理器的RS6000/ SP 每秒可运算超出2 亿步的走棋。“深蓝”设计组请美本杰明当顾问,当比赛结束后立即根据卡氏在本局的棋路相应修改参数,弥补“深蓝”没有直觉和不能独立思考的明显缺陷。另外它具有不受疲劳、没有心理起伏、不受对手气势与冷静干扰的优点。“人机大战”的胜利,在一定意义上说明了计算机已能代替人的复杂思维,但不能取代人的创造性思维功能。

2. 4 脑科学研究

日本政府正启动的五个国家级科研计划之一“脑科学研究计划”,为期20 年,每年投入1000 亿日元,总计2 万亿日元,包括三个研究领域:了解脑,保护脑,人工创造脑;47 个课题:思维语言解析,防止脑细胞老化,开发人造神经系统,开发人脑型计算机、智能机器人等。

日本理化研究所研制成功人脑型计算机,相当于人脑100 万倍的信息处理速度,用5 分钟学到的东西人脑要用10 年才能完成。

3 广度计算

传统的计算机网络始于数据与信息的传输,可以看作是信息传输网络。由于计算技术与通信技术的结合越来越紧密,“信息传输”与“信息处理”紧密结合逐渐成为网络发展的方向,即由“信息传输网”向传输与处理相结合的“信息网络”方向发展。信息网络既支持深度计算,也支持广度计算,从而形成了“网络计算”的新领域。在信息网络支持下,实现无

论何人、何时、何地都能传递信息、进行信息处理、有效利用信息等信息服务。这是比“高性能网络计算”的应用范围更广泛的网络计算,其主要特点就在“广”,简称广度计算。

3. 1 信息网络更“广”更“密”

3. 1. 1 用户“广”

面向一国用户、全球用户,用户数的数量级为108-109 。当广度计算普及率为10%时,用户也是107-108 数量级。

3. 1. 2 地理范围“广”

支持广度计算的信息网络覆盖一个国家/ 地区,甚至全球,包括陆地、海洋、空间。

3. 1. 3 业务“广”

面向巨量用户的网络应用(广度计算业务) ,如创造面向全民终身学习环境的“远程教育”,让居民普遍分享高级医疗技术的“远程医疗”,面向全社会的“电子商务”,面向科研领域大范围协作的“虚拟实验室”等新应用。

3. 1. 4 为“广”而“密”

信息网络要能为巨量用户服务,既要有高速干线网,更要有多种多样的接入网和用户住地网,使网络分布密度越来越大。

·以“城域网”为高速干线网互连的主要“单元”。

·“局域网”深入到家庭(家庭网) 、汽车、人体周边(人体域网)。

·“微处理器”嵌入到设备、部件、零件,并实现本体互连和远程互连。

3. 2 解决服务器“瓶颈”

在信息传输速度快速提高的背景下,出现了网络信息处理速度滞后的现象,出现了“网络慢在服务器”的现象。为了解决服务器“瓶颈”现象,呼唤并行处理技术进入信息网络。

3. 2. 1 建立和运营“服务器农场”

·60-70年代,主机和小型机主宰世界。

·80年代,PC 兴起并普及,推动了信息使用的分散化进程。

·如今,Internet 使数据中心再度兴起,数据中心被称作“服务器农场(Server - farm)”,其中一排排大型机很像庄稼地里的一行行农作物。

·1999 年4 月,Intel 宣布将建立和运营“服务器农场”,作为向Internet 服务迈出的关键一步。Microsoft 则研制了“兆位服务器(Megaserver)”,使用户能够在任何时间、任何地点通过网络与大型的中央DB 相连接,接收电子邮件、个人日程表、新闻、最新的天气情况等信息。美国在线(American Online)在1999 年3 月也宣布将投资5. 2 亿美元兴建第3 个“服务器农场”。以信息服务为主体的广度计算将会有新的发展。

3. 2. 2 发展存储域网络

伴随信息网络技术的发展,一个信息应用系统的“前端网络”性能快速提升, 信息系统的“后端”——存储系统的容量也相应快速增长,例如其年增长率达到50 %-100 %。对“后端”系统更有效地进行管理和利用的方法,是使存储体系网络化、高速化。

存储结构可分为四类:

①传统以服务器为中心的存储结构

在这一模式下,多个服务器通过LAN 向客户机提供服务,各服务器有自己的外存储器。

②存储集中式结构

这一结构与前一种的主要区别在于多个服务器通过各自的专用线路共享一组集中的外存储器。因此,也可把这一模式看作以集中的存储器为中心的结构。

③网络存取存储器结构

这一模式可以看作前两种模式的变种,分散或集中的存储器作为与服务器平等的独立的网络单元上网,各服务器通过网络共享多个分散或集中的外存储器。在这一模式下,存储器与服务器连入同一LAN。

④SAN(Storage Area Networking) 结构

如上图所示,SAN 是专门连接存储外围设备和服务器的网络,即内部存储网。一种观点把服务器包括在内,由服务器、外存、服务器适配器、集线器、交换机、网络,存储管理工具等组成。另一种观点也可把它看作存储器专用网,或存储设备的后端网络,而服务器则成为连接存储设备的后端网络与传统网络间的互设备与SAN 访问设备。从这种意义上说,也许可以把SAN 称为“存储器农场(Storage - farm)”。SAN结构降低了存储管理费用,平衡了开放式系统服务器的存储能力和性能。SAN 采用光纤通道(Fiber Channel ,FC)技术实现设备间连接,当前通道速率为1Gbps ,未来4Gbps。光纤通道SAN 采用交换与共享相结合的互联方式,由服务器光纤通道适配器、连接SAN 节点的FC 集线器和交换机、连接存储子系统和SAN 的FC 通道控制器/ 桥组成。

3. 2. 3 在网络中应用高速缓存技术

高速缓存(cache) 是计算机系统提高性能的行之有效的技术。WWW 是因特网最主要的网络应用。cache 与Web 结合,即将预取(prefetching) 技术用于改善WWW服务性能:将用户以前HTTP 请求的响应缓存在靠近用户的客户机/ 浏览器或网络服务器上,以便于再次访问时就近获取,减少网络信息流量和响应时间。

缓存实现方式有:

·客户端的缓存,通常捆绑在浏览器上, cache的每个网页信息长度有限、实现的一致性策略和替换策略比较简单,但会经常给用户提供失效信息。

·服务器的缓存,与Web 服务器软件捆绑在一起,能适当降低访问延迟,但对服务器要求高。为降低延迟还可实行预取功能。

·代理缓存(proxy cache),在代理服务器上实现缓存机制, Internet缓存协议(Internet Cache Protocol ,ICP) 详细描述了这种模型的规范,是解决WWW访问速度慢、服务器负载重、网络阻塞的较好途径。

3. 2. 4 分布式层次结构的服务器群

一个大型信息应用系统,常常遇到如何合理、有效地布局其网上的服务器。有必要将网上的服务器群的配置设计作为系统设计的重要内容。例如,在视频点播服务(VoD)系统中,是采用较多的、较低性能服务器形成分布式层次结构,还是采用较少的高性能服务器呢? 这涉及到对网络性能要求、可实现的用户服务质量、成本、运营维护水平等一系列问题的综合分析,在系统一级更好地解决服务器“瓶颈”问题。

3. 3 人-网界面

人-网界面的目标是“让网络适应人”,不再是要人去适应机器。这样的目标呼唤数字化技术、多媒体技术、人工智能技术、移动计算技术等技术都汇集到信息网络之中。这是一个非常广阔的新领域,也是新一代信息网络可望创“新”的大空间。

3. 3. 1 DVB

1998 年9 月23 日,英国率先开播数字电视节目,随后美国于11 月1 日在10 个城市23 家电视台开播,11 月11 日日本也开始试播。美国计划在2006年停止使用模拟式技术。DVB 远远不在于视听质量的提高,而是电视技术的突变,是信息网络换代的引爆因素。以数字式、交互式的视频信息为基础的网络,是实现多媒体业务的基础。

3. 3. 2 移动计算

从固定计算到移动计算是一跃变。移动计算是广度计算扩展广度的必然产物,将有力地推动信息化进程。传呼机、手机,机载、船载无线通信设备,PDA、HPC、笔记本计算机,都会扩展成为移动计算“信息机”。实现移动计算涉及从网络体系结构到小型化工艺等一系列技术,是又一重要的研究、开发和应用领域。

3. 3. 3 虚拟现实

基于虚拟现实技术的网络应用,将不断推出,例如虚拟现实会议系统、虚拟实验室、虚拟商场等。

·虚拟现实会议系统

虚拟会议室中出现的人员、会议桌等景物1: 1,“真实”的音响效果。

·虚拟实验室

通过高速网络,可以使分布各地的科研人员密切协作,充分利用分布的实验环境、仪器设备,共享珍贵的大量实验数据(如卫星遥感数据),建立大范围的协同工作环境。

3. 3. 4 个性化信息服务

要扩大网络应用,就要发展个性化信息服务。就像汽车生产流水线上出来的小汽车每辆都是客户定制的那样。在这方面进行的努力,诸如远程教育、企业门户站点、数字图书馆等都取得很大进展。下面仅以远程教育为示例。

·远程教育发展经历了三个阶段:函授、电视教育和基于计算机网(因特网)的交互式多媒体教育。

·远程教育系统的三种类型:

①实时广播教育系统,基于Internet 的电视大学,基于电视会议系统,具有交互功能和组播功能。

②虚拟教室教学系统,在上述基础上增加了计算机辅助教学系统,支持教学全过程,实现了计算机技术、多媒体技术和网络技术集成。

③课程随选系统,基于VoD 系统。

实际上,各种基于VoD 的网络应用系统,都是为了实现个性化信息服务。

4 信息网络

从计算技术与通信技术结合的角度来看,计算机网络经历了从封闭向开放、从专用向公用、从数据传输向多媒体传输的发展过程;近年来又出现从单纯的信息传输向“信息传输”与“信息处理”紧密结合的动向,即向信息网络方向发展。未来的信息网络既支持深度计算,也支持广度计算,形成了“网络计算”的新领域。

4. 1 从封闭到开放

早期的研究性或商用网大都自成体系,典型的网络体系结构如IBM的SNA、DEC的DNA ,尽管有的考虑了与其他单个网络的互联问题,但都是以“一对一”的相互适应的方式进行的,即Ad hoc 的方式。直到OSI/ RM的出现提出七层网络结构,网络才有了第一个公认的开放体系结构。尽管由于种种原因OSI 协议集在实践中并未流行,而被更为简洁的以TCP/ IP 和UDP/ IP 为基础的Internet 五层结构所取代,成为既成事实的开放系统模型,但总趋势仍然是从封闭走向开放。

4. 2 从专用到共用

过去许多计算机网络都是为特定的用途组建的,如飞机定票、银行通存通兑、信用卡服务、远程教育、远程医疗等等。使计算机网络跻身公用信息网行业的推动力是Internet 的商用化。短短几年间,Internet 用户上升到数以亿计,使计算机网络空前普及。在Internet 和Intranet 大发展的基础上,电子商务、数字图书馆、电子政府等网络应用迅速进入社会,计算机网络成为真正的“公用”网络在21 世纪初叶将会实现。

计算机网络从专用到公用的发展,使网络经济、网络社会、全球信息化,从设想变成现实。要使计算机网络公用,就需要容纳各种网络信息服务,包括原本是其它通信网的业务,典型的如电话和电视业务。这样,IP 电话、IP 电视成为IP 网的研究开发热点。要“公用”,还要能保证不同网络业务的服务质量(QoS),于是在Ipv6 中为“区别服务(Diffserv)”提供了4 位“优先级别”字段, Internet 的IETF 还提出了资源预约协议(RSVP)等。要“公用”,网络安全、信息安全变成了公众关心的焦点,迫切需要发展新的网络安全协议。

Internet 的成功使“IP 网络”成为新术语。目前已经实现“IP over everything”, 即可在任何通信网上建立IP 网;下一步将向“everything over IP”发展,即任何业务都可在IP 网上实现,从而实现更大范围、更高水平的“公用”。

4. 3 从数据到多媒体,从传输、交换到与处理相结合

计算机网络中传输、交换、处理和利用的信息,相当长的时间内一直以普通文本数据为主。因此,计算机网络一开始便采取了面向非连接的分组交换技术,网络节点机一直采用“尽量服务”原则,对突发性不相关数据的传输效率极高。

计算机网络从专用到公用的应用需求变化,使计算机网络传输、交换、处理和利用多媒体信息提上议事日程。另一方面,基于光纤通信技术和卫星通信技术的传送网的带宽从窄带发展到宽带,光传输速率从兆位(Mbps)提升到吉位(Gbps),并即将进入太位(Tbps)数量级。这些进展为“多媒体通信”的发展创造了条件。

多媒体通信是一种新通信业务,其特征是在一次单一的通信会话(communication session) 其间,可以有多个参与方、多条连接,而且通信资源与用户数可以增减。多媒体业务体现出群体性、交互性、多值性等新特点。

为了实现多媒体业务,计算机网络体系结构方面近几年取得了许多新进展,提出了一系列有关的协议和标准。例如,为了适应多媒体业务,提出了实现动态多点连接的组播(multicast) 方式,研究试验了多种方法。为了保证多媒体业务的服务质量,提出了区别服务、资源预约、准入控制、动态带宽分配等QoS 控制方法。为了降低信源的数据速率,提出了许多图像与话音压缩方法,制订了JPEG、MPEG、H.261、H. 320、H. 324 等一系列国际标准。近年来,还开始了对多媒体和超媒体(hypermedia) 对象(object)的表示和编码进行标准化,提出了MHEG、Hytime 、HyperODA 与ODA 等标准。

计算机网络“从数据到多媒体”的演进引发出多媒体技术、多媒体网络、多媒体应用等许多新概念、新术语,实质上反映出各项信息技术(计算技术、通信技术、人工智能等)的大融通。而多媒体技术、多媒体网络的广泛应用必将推动世界进入一个新颖的多媒体世界。

5 结束语

信息网络支撑下的深度与广度计算的研究方兴未艾。随着新世纪信息网络高速化、综合化和智能化的发展,网络计算必将进一步沿着深度与广度方向迅速发展。

 

 

【关闭本页】