信息资源整合工作的概念模型

王安耕
 

信息资源开发利用是一个涉及多方面的复杂问题,例如,信息资源开发利用的市场化问题,信息资源库知识产权保护问题,等等。本文不打算对信息资源开发利用问题做出全面论述,主要集中在与业务系统建设和网络化信息服务相关的问题。

由于业务系统建设在初期通常是分散进行的,各单位各自建设,同一单位内不同部门也各自建各自的业务系统。经过一段时间,就发现不同系统之间对同一个对象的描述和实现不同,造成数据相同的不能共享,数据不同的搞不清其差别何在。这就产生了信息资源整合问题。同时,随着Internet广泛普及,网络化的信息服务成为一个重要的发展目标,信息资源整合的深度、广度和难度更是无比扩大了。我国从在20世纪90年初开始算起,电子政务、电子商务建设也已有了十多年历史,业务系统也建了不少,各单位各部门也积累了不少信息资源,要让这些信息资源充分发挥作用,信息资源整合问题就成为信息资源开发利用乃至整个电子政务和电子商务建设工作的重点问题,这个问题如不立即着手解决,将会对电子政务乃至整个信息化事业造成不利影响。

    信息资源整合问题非常复杂,要解决它必须分出不同层次的问题,针对性地提出相应的对策,才能逐步解决。

    为此,作者提出一个信息资源整合工作四层次概念框架模型。

全方位信息资源整合

重点业务系统信息资源整合

基本单位信息资源整合

基础信息库整合

    以下分别对此四层次说明。

    (一)基础信息库整合

对我国来说,当前主要要建设三大基础信息库:

*自然人(人口)基础信息库

*法人(单位)基础信息库

*空间地理基础信息库

任何业务系统,归根到底都要基于这三个基础信息库上。例如,税收对象不是法人就是自然人。国土资源,包括土地、矿产、河流、道路、....,无不基于空间地理基础信息库。这些业务系统都从某个侧面去描述这些对象,例如税收系统描述自然人的纳税情况,等等。但是,该自然人的基本信息,如姓名、性别、出生年月日等等,不需要也不应该每个业务系统重新定义和录入一遍。只要有一个单位负责建立并维护这些基本信息,所有其他业务系统只需去复用这些基本信息,同时,将自己所增加的信息,(例如税收情况),“叠加”到基本信息上,就组成了完整的业务信息资源。

为了信息共享的需要,最关键的是,这三个库各有其基本编码:

* 自然人基础信息库:个人身份证号

* 法人(单位)基础信息库:单位编码

空间地理基础信息库:地理编码(Giocode)

这三个库和其相应的基本编码的建设和维护,是很复杂的问题,这里限于篇幅不能更多地讨论。但是,为了能发挥这三个库的作用,最重要的是所有信息系统,只要涉及到这三种对象(自然人、法人、地理位置),都要自觉(加上必要的法律强制)维护和使用其基本编码。这是信息系统建设统一标准规范中最主要一项需要统一的内容。

(二)基本单位信息资源整合

所谓基本单位,主要满足两项条件:边界清晰;在边界内,管理强度足够,它可以是一个具体企业也可以是一个垂直管理的部门。对于基本单位的信息资源整合,总的来说,是一项成熟技术。发达国家80年代是基本单位信息资源整合的高潮,国内也有部分单位进行了很好的探索,取得了很好的经验。基本单位信息资源整合的技术,可称之为“紧耦合”技术。其要点是:

* 对该基本单位进行全面的信息资源调查,既包括已建立了计算机信息系统的,也包括手工操作的业务系统的信息资源。

* 将所有信息资源的定义和描述集中存入数据库,即建立“元数据库”。通俗地讲,即是建立了数据目录。

* 进行信息资源规划工作,即统一所有涉及到的信息的标准编码,对已有的和未来的数据结构进行合理化(例如,数据库的规范式化等等),对所有涉及的信息的共享问题进行规范化设计,最后,但并不是不重要,对可能需要的业务重组做出原则性安排。之所以称之为“紧耦合”技术,是指需要利用足够强度的管理力量,统一地进行信息资源整合,不能各行其是,你搞我不搞。

(三)重点业务系统信息资源整合

在超出一个基本单位范围的重点业务系统建设时,例如,电子政务建设中的基建项目审批系统,可能要涉及多个政府部门,各部门面对同一个项目申请,必须要有某种信息资源整合安排,否则基建项目审批系统很难提高工作质量和工作效率。

由于业务系统的多样性,重点业务系统信息资源整合非常复杂多样,难以提出一个统一的方法(技术),只能个案处理(Case by Case),但是以下几条原则还是会有所帮助的:

* 涉及到上述三个基础数据库的,一定要坚持规范化地实现信息共享。

* 应按照上述三个基础信息库的建设思路,建设本业务系统的“基础信息库”并在本业务系统内实现共享安排。例如,在我国机动车普及率还很低,机动车信息库还不能上升为国家的基础信息库。但对于城市交通管理业务系统,机动车信息库肯定是一个基础信息库。

* 在可能和需要的情况下,可以使用基本单位信息资源整合所使用的方法和工具(即紧耦合技术)。当然,这不是指所涉及单位的全面信息整合,而是仅指该业务系统所涉及的重要信息的整合。

(四)全方位信息资源整合

对于一个国家,甚至一个地区的全方位信息资源整合问题,由于信息资源种类繁多,信息量庞大,而且,很多信息资源与不同的业务活动相联系,是不可能用上述“紧耦合”技术来进行整合的。只能采用“松耦合”方式来进行。

当前,国际上正在快速发展的Web Services技术,正逐渐得到公认,是一项进行“松耦合”方式信息资源整合和共享的“标准”技术。其基本思路可图示如下:


 

即各单位按照“紧耦合”方式,整合了各自的信息资源,并建立了相应的“元数据库”,即关于信息资源的描述和定义的“数据目录”,就将“元数据库”上报给专门设立的“注册中心”。大多数情况下,信息资源本身仍存放在各单位,并不集中到注册中心,但可能有少数共享需求很大的,可以集中存放到注册中心以加快检索速度。当有居民或企业有某项信息检索的需求,可向注册中心请求,注册中心按其需求,找到(根据元数数据库内的描述和定义信息)信息所在地,由信息所在地(可能是注册中心,但多数是某个拥有该项信息的单位)直接通过网络向用户提供。

在Web services技术中,所有的访问请求都按标准接口“封装”好了的,在封装中,可以包括如信息使用授权,身份确认,是否(需要)付费等等各项管理信息,从而保证信息访问和使用的安全合理。

Web Services技术正在迅速发展之中,很多问题尚未最后解决,例如,Web Services是否会造成系统安全问题,以及如何解决等等。但可以利用它来进行信息资源整合这一点已经没有疑问。我国也已将此项任务作为电子政务的一项重点工作列入了规划和试点项目。

信息资源整合是信息资源开发工作的一个核心问题,是电子政务建设中一项重要任务,也是我国信息化建设中急待解决和突破的一项挑战。这既有技术挑战,更多地是从管理上提出了挑战。我们必须踏踏实实地工作,边探索,边发展,为实现我国信息化建设的跨越式发展作出贡献。

 (作者单位:  中国国际信托投资公司)

来源《中国信息年鉴-2002》

 

 

【关闭本页】