书城社会科学档案信息检索
17943500000056

第56章 档案信息资源网络建设

将档案信息资源网与互联网相连,可以实现档案信息资源最大限度共享。档案信息资源网络是档案机构实体网与档案信息互联网结合起来共同构成的。实体网主要是指档案行政管理体系下档案管理机构形成的网络化格局。互联网对信息的传递和传播是集中、高效、方便的,正是互联网的这些特点,使得将互联网与档案信息资源相结合后,可以更好地实现档案机构实体网之间的信息联结,业务合作以及馆藏的互补、传送与共享,因此将互联网技术引入档案工作,实现档案信息资源的网络化,实际上赋予了档案机构实体网新的意义。档案信息实体机构之间具有协作、层次、组织、共享和互补的关系,这些关系通过数字化的形式出现,以网络链接的方式体现出来,使各档案实体机构成为因特网上的一个个节点,这样就突破了传统的面对面的服务模式。由于互联网技术基于现代化的数字通信技术,这就使得信息用户可以通过上网的方式访问档案馆(室)的网站或网页,访问数字档案馆,通过浏览器查询各种档案信息资源,从而实现档案信息的网络共享。

一、我国档案网站建设概况

档案信息资源网站的建设,离不开技术支持与政策支持。近年来,我国信息化程度正快速提高,一批省市地方政府大力建设信息高速公路,铺设城市高速宽带网络,大中城市的光纤覆盖率达70%以上,其中上海地区已达90%以上。许多省市已初步具备搭建信息网络平台,开展档案网上服务等必要的外部环境。与此同时,各级政府积极推动上网工程,继政府上网、高校上网、企业上网之后,家庭上网工程已成为发展最迅猛的领域。档案信息网络化进程加快,档案信息网站建设也初具规模。档案网站是档案机构在互联网络上建立的站点,是发布各类档案信息并提供档案利用服务,构成信息网络的一个节点。自1999年以来,随着电子政务的实施,我国的档案网站从无到有,在数量上呈现逐步上升的趋势。

通过基于超文本传输协议HTTP的INTERNET信息检索和浏览,对网上档案信息资源进行搜索,在各大型搜索引擎上获得相应的检索结果为:国内(主要是大陆地区)可以直接通过中国通用计算机互联网查询到的各门户网站档案馆网站的平均数量是19.7个,比1999年增长了64.2%。据权威的官方统计,到2005年底我国开通的档案网站数已达到150多个。另外,我国档案网站主要有以下类型:国家档案局网站、地方综合性档案馆建立的网站、大学档案馆的网站、专业档案馆的网站、档案刊物建立的网站、档案专业教育机构的网站、少数个人档案网站。总体来看,各级综合档案馆网站和各类大学档案馆网站的数量居多。除此之外,还有对大量存在于局域网中发布档案信息的档案网站无法进行了解与统计,但互联网中的档案网站在一定程度上反映了我国档案网站建设的水平。

综观各档案信息网站的实际情况,目前我国档案信息网站建设的状况是:

(一)网站建设初具规模,但网站数量与档案信息资源量相对较少,档案信息资源更新慢

通过搜索调查,我国一些档案馆网站已经形成了自己的规模,许多省级和直辖市档案馆的网站服务系统相当完备,如北京档案馆网站、上海档案馆网站。然而,我国的档案网站的数量还相对较少。我国已开通和即将开通的档案网站的总数有100余个,而截至2008年底,全国共有各级各类档案馆3987个,其中国家综合档案馆3161个,国家专门档案馆245个,部门档案馆146个,企业档案馆215个,文化事业单位档案馆126个,科技事业单位档案馆94个。① 开通网站的档案机构所占的比率明显过低,这导致总体上网络档案信息量的不足。

与此同时,每个网站内的档案信息内容少。我国档案馆网站的主要档案信息内容大致包括以下几类:本馆介绍、政策法规、档案检索、服务信息、全宗指南、馆藏精选。其中每一类下面提供了一些文字介绍,但向下最多只能深入达到三个层次,所有信息就显示完毕,内容还比较单薄。网上档案信息资源内容单一、陈旧,甚至有遗漏和失真的现象。例如,有些网站除了馆藏简介和目录外,几乎没有别的信息;提供的相关链接经常是无法连接到相应的目的地;档案网站内容更新周期较长。许多档案网站没有固定的、周期性的更新时间,更新随意性较大,导致有些档案网站更新周期较长。一些档案网站目前的水平还称不上“网站”,仅是一个“主页”而已。目前我国档案网站中关于馆藏档案的信息多是二次、三次信息,缺乏一次档案信息,二次、三次信息反映的只是馆藏的一小部分而非全部,档案全文信息更是罕见,缺乏全面的、具体的馆藏档案信息。档案信息上网的目的是提供利用,动态地满足利用需求。但目前我国网络中的馆藏档案信息达不到这个层次,缺乏实用性。

(二)档案网站缺乏整体性和层次感

在欧美等一些技术、经济领先的发达国家,几乎每一个州(或省)的州(省)立档案馆、市级档案馆、企业档案馆、大学档案馆,甚至私人档案馆,都在互联网中有自己的主页,建立了自己的网站,用于发布各类档案信息,档案行业组织和学术团体也是如此。其中最有代表性、建设水平最高的都是中央级档案馆的网站。相对而言,我国网络档案信息主要集中在各省、市级的档案局与档案馆网站,以及中国教育与科研网上的一些大学档案馆的网站中。2002年12月国家档案局网站的开通,在一定程度上弥补了这方面的缺陷。但国家档案局网站发布的多是档案行政管理方面的信息,中央档案馆没有自己的网站和主页,其馆藏信息只在国家档案局主页上的一些栏目中有所反应映但数量少,信息量小,缺乏系统性。相比之下,同属中央级的第一历史档案馆与第二历史档案馆的网站内容丰富,制作美观,建设水平高。这些中央级档案机构的网站,应该在我国档案行业网站中起到龙头作用,带动整个行业网络档案信息质量的提升。此外,除了一些城建档案馆在网络中发布的少量信息外,网络档案信息中科技档案信息和专门档案信息还很少。我国网络中档案信息来源机构多数是综合性档案馆,而其发布的所谓的“综合性档案信息”中其实缺乏对实际工作更有指导意义的科技档案信息与专门档案信息。网络中有关中国档案学术组织和学术团体的档案信息也比较少,《档案学通讯》(网络版)(HTTP:∥WWW。DAXTX。CN/)是这类网站中少有的代表,而很多档案学者和从事档案教育的工作者往往是以个人博客站点的形式通过互联网发布一些档案学相关信息、理论研究与自己的心得体会等。

完整而全面的网络档案信息应该是集综合性档案馆信息、专业档案馆信息、中央级档案馆信息、地方级档案馆信息、档案学术组织的档案信息等多层次为一体的。而目前我国的网络档案信息还存在整体上、综合性的残缺,缺少某些方面相关领域的档案信息。

(三)档案信息网站(页)建设水平不足

网站页面的美观程度是网站能否吸引访问者的首要问题。在当前商业型网站以各种形式和手段参与激烈竞争的事实面前,档案信息网站作为服务性网站,设计单调、页面结构简陋,难以吸引访问者,虽然档案馆网站由于其特殊性没有在商业运作中被淘汰的危险,但也应该特别注重其外观形象设计和制作,以求吸引更多的访问者,实现网站建设的目标和自身的社会价值。另外,许多档案馆都还没有自己独立的域名,即仍然附属于其他网站,没有自己独立的服务器和管理系统,这也是档案网站建设中存在的问题。

档案信息网站应该特别注意其外观的新颖独特,而要实现这一点需要有多种信息传输方式的支撑。网络传输信息的方式很多,包括文字、图形、符号、声频、视频等,主要涉及视觉和听觉,但目前网络档案信息媒体形式单一,大部分是文本信息和一定数量的照片。至于图表形式、三维动画、音频文件、视频文件等形式的档案信息数量就更少,几乎没有。随着我国网络化进程的加快,电子计算机的普及,全国范围内网络基础设施建设的进一步完善,传输图文声并茂的多媒体信息不再是技术上不可解决的难题,采用多种方式传输档案信息,在满足用户利用档案信息资源的同时提升访问者的心理情绪和访问兴趣,是我们需要关注的问题。

(四)档案信息网站技术支持薄弱,服务形式单一

档案信息网站的技术支持和服务特点是相互制约的,服务以技术为基础条件,技术以服务为根本目的。没有过硬的技术作后盾,高质量的服务是不可能实现的,而只有通过实施多种形式的服务,并通过利用者的信息反馈及时调整服务策略,才能促进技术的改进和革新。目前,各档案信息网站一般只提供信息浏览服务(WWW)、电子邮件服务(E-MAIL)和少量的信息咨询服务。很少有网站提供远程登录(TELNET)、文件传输(FTP)、电子公告牌(BBS)等服务,而且大多数档案信息网站的IP地址都集中在B类、C类地址中,档案网站缺乏信息组织与交流手段。站内地图、站内搜索引擎、链接、信息反馈等应是档案网站不可或缺的组成部分,这些手段有利于组织档案信息,及时与利用者交流,目前我国档案网站在这几个方面的建设还不完善。档案信息网站的访问量还比较小,除了当前人们的档案利用意识不高外,网络技术的落后和服务形式的单一,是造成档案信息利用率低的重要原因之一。

(五)网络检索工具数量少,性能有待提高

网站检索服务是公共档案馆网站对传统档案检索服务模式的延伸和扩展,是信息服务是否完善的重要标志,目前我国公共档案馆网上档案信息资源检索服务模式集中在档案目录检索、站内检索和网上预约调卷几个方面。无论网络档案信息数量是多还是少,完善易用的检索工具都是必不可少的。在对全国33个公共档案馆网站调查后发现,72%的网站开展档案目录检索,用户可以通过该项检索功能迅速查询到相关档案目录信息。63%的网站开展网上预约调卷,档案馆管理人员通过该项功能得知用户所需档案并做好相应的前期准备工作,提高档案利用效率。18%的网站提供站内检索,方便用户检索网站信息与所需档案信息。从以上数据可以看出,我国公共档案馆网站开始逐步突破传统检索服务模式,随着网络环境的改变有相应的调整措施,所实施的馆藏档案在线检索已达到一定的水平,一定程度上满足了馆藏档案用户需求。

当然,与国外档案馆网站建设相比较,目前我国公共档案馆网站检索性服务仍存在着较大的问题:从检索工具的数量上看,我国提供检索功能的档案网站还比较少,许多网站甚至没有检索工具;从检索功能上看,馆藏档案主要通过单一检索来实现;从检索深度看,主要是以一次信息为主,二次信息为辅;从检索数据类型看,都为文本信息,多媒体信息尚未实现。在所调查的档案网站中只有3家提供部分档案全文阅读,约占本级别网站的9%,即北京档案信息网、内蒙古档案信息网和云南档案信息网提供部分内容全文阅读。对于异地查档的利用者而言,在线检索所能获得的档案信息达不到文件级。有些档案馆的网站甚至连可以浏览的检索目录都不具备,更不必提具体的档案全文内容了。同时,一些检索工具还有使用不方便、速度相对较慢、数据覆盖率低、界面不友好、帮助系统不完善等缺点。当然,网络检索工具的开发水平与档案机构的级别不协调,地区发展不平衡有一定关系。如北京市档案馆、上海市档案馆建立有档案信息检索工具,而其余的档案馆,省级以下的市级、区县级档案馆网站开设检索工具的情况不容乐观;临沂市档案局(馆)网站和绍兴市档案局(馆)网站的检索系统研发水平较高,与许多省级档案馆提供的检索工具相比功能强、内容丰富、效果良好。因此,有些市级、区县级档案网站访问量甚至超过部分省级档案网站。

二、我国档案网站的特色服务

我国各级各类档案机构,在信息化建设过程中,在如何通过网络吸引利用者方面也采取了一些措施,进行了一些尝试,推出了一系列特色服务,一方面为公众检索档案信息提供了更多便利,同时也进一步提升了档案信息网络化服务水平。

(一)开展特色馆藏展示服务

特色馆藏展示是基于各类型档案馆特有馆藏所建立的具有地域优势、能取得显著成效的特色资源服务,即对本馆特色馆藏档案资源的开发利用。特色馆藏展示能有效发挥本馆特色馆藏资源优势,提高档案馆档案利用率,是档案馆信息服务水平的重要标志。目前国内很多的档案馆网站都设有特色资源展示,如上海市档案信息网的“珍档荟萃”中详细介绍了上海市档案馆馆藏的“十九路军将领致严庆祥的感谢状”。青岛市档案信息网中“老青岛特藏室”栏目中的“胶州路1号———普济医院”详细介绍了本市普济医院的建立、发展等一系列档案馆藏。

(二)大学档案馆提供学籍档案查询

各大学档案馆将学生学籍查询作为服务学生和社会的重要内容,不仅为在校学生的就业、人才流动等提供学籍查询,也为已毕业的学生提供相关学籍历史的查询,如南京大学档案馆的档案查询中,提供了本校学生的学籍档案,可查询本校所有本科生、专科生的姓名、学号、系别、在校时间、籍贯、案卷号等情况,方便用人单位了解相关信息。北京大学推出毕业生认证,可以对本科生和研究生的学位和学历予以认证。各大学的大学档案馆已陆续在网络上推出这项服务。

(三)档案网站开通政府信息公开查询功能,允许用户在档案网站上查阅、检索法律法规允许公开的政府信息、现行文件

从全球政府信息管理的现状看,全世界范围都将政府文件的开放与利用纳入国家档案信息资源建设之中,政府文件的开放与获取已经成为衡量一个国家档案事业发展、档案信息化建设的重要指标。如国家档案局网站首页设立政府信息公开专栏;上海市档案局(馆)网站提供了现行文件目录检索;浙江省档案馆网站提供了数量丰富的现行文件在线阅览和现行文件目录在线检索;北京市档案馆网站按文件责任者进行分类,链接到各文件形成机构在线阅读现行文件。这些文件是档案的前身,既有时效性,又与广大群众的利益密切相关,因此吸引了更多的利用者。随着2008年5月《中华人民共和国政府信息公开条例》的实施,政府信息公开查询将会逐步成为档案网站服务模式的重要组成部分。

三、国外档案网站建设概况

美国是世界上第一个实现档案信息网络一体化的国家。20世纪90年代中期,在美国国家档案与文件署(NARA)的领导与组织下,建成了档案信息导航系统(NAIL)。该系统拥有全国各种档案馆藏信息的联网可检索数据库,将国内所有已数字化的档案资源,按地区、来源和利用对象分别纳入统一的档案管理网络中,实现了全国数字化档案资源的网上集成化查询、检索和利用。现在,通过美国NARA档案信息总网站,可以检索到包括10个总统图书馆在内的200多个档案馆的数字化档案。另外,美国制定了规范化的档案数字化网络化标准,比如基于《通用档案著录国际标准》(ISAD(G))之上制定的美国编码档案著录文献类型定义(EADDTD),是当今美国数字档案馆的核心技术,EAD是第一部档案著录交流标准,它是以标准通用标记语言(SGML)和扩展标记语言(XML)文献类型定义(DTD)的形式存在的。

加拿大是北美地区第二个实现国内所有档案信息网站联网,提供用户网上查询利用的国家。1996年5月,加拿大档案委员会在渥太华召开了“档案信息高速公路”圆桌会议,提出了电子传递档案信息的共享问题,提出要建立和发展“加拿大档案信息网络”(CAIN),要以加拿大国家档案馆网站为依托,创立自动化联机检索工具,通过它可以检索到加拿大国家档案馆所创建的一系列数据库及自动系统中的大量信息。

欧洲国家的代表英国,于2001年发布过一个档案指南计划,目的是让公共档案馆实现其利用者能够以电子形式利用它的文件和各项服务。该计划完成后,英国公共档案馆将向它的利用者提供电子邮件、讨论组和有关网址服务,全天24小时向利用者提供世界各地的有关信息,利用者可以在线利用馆藏档案原来纸质检索工具中的信息,并可以通过这些信息在世界上任何一个地方按主题分层次进行检索,通过互联网订购某些重要信息,通过电子邮件订购馆藏出版物、图片和其他一些服务。

四、档案网站建设中需要注意的问题

(一)档案网站信息的提供方式要与网络信息服务相适应

网络化的信息服务在服务对象、服务过程、服务内容、服务范围、服务质量方面分别呈现出个人化、一体化、集成化、社会化、精品化的特点与发展趋势。服务个人化是指现代化信息技术已经具备满足个人化信息需求的能力,根据不同用户的需求提供给用户不同的信息,如一些网络运营商推出的个人化网络新闻,网络传递的快捷使信息服务的针对性更高。利用信息网络的协作共建共享,用户可以直接在网上查询档案信息目录、进行全文浏览、下载档案信息数据文件,实现服务过程的一体化,克服了传统信息服务咨询、检索、提供利用的时间空间限制。集成化服务指在网络条件下,可以通过多媒体技术满足用户对信息需求多样化的要求,并保证网络信息资源的全面性、整体性。服务社会化不仅指服务范围是整个社会人群,服务的内容涉及社会生活的方方面面,还表明网络环境下的信息服务具备规模化、产业化的特点,信息服务业已经成为信息产业的重要组成部分。在质量上,网络信息服务体现出精品化趋势,网络运营商越来越意识到规模效应已不再是吸引利用者上网的最主要原因,用户更关心的是如何能直接、迅速、准确地找到所需信息,并保障有效利用。因此,高质量的网络信息服务应该着眼于如何提高信息的可获取率及获取信息量的大小,将二者作为提高服务质量水平的关键。

对利用者而言,档案网站建设的质量有两个评价指标:信息的可获知能力和信息的可获得能力。信息的可获知能力是指用户对信息的存在与否、信息存在地点的知晓能力。具体到档案信息,即指它的检索体系、检索途径、目录开发程度与二次文献网络化的水平。档案信息的可获知能力取决于获知途径的多少与网络化水平的高低。信息的可获得能力是指提供可利用信息的整体水平。它专指用户可直接利用信息内容的程度,因此,其水平高低既取决于档案收藏的整体保障能力(馆藏数量、质量、结构),又取决于实际获得信息的途径。

从以上两点的分析可以看出,档案信息网络提供的利用服务,不仅要满足信息可获知性的要求,而且要提高信息的可获得性。目前,档案信息在公共网络上的服务方式主要以馆藏介绍、目录查询为主。在国内的档案馆网站上很难见到馆藏档案全文上网,真正实现档案信息的网络利用。相比之下,作为保存有大量珍贵档案历史文献的美国国会图书馆,就利用网络技术,把馆藏的有丰富历史意义和价值的材料转换成了容易下载的记录、图像、文本,供用户使用。这说明我国目前档案信息网络服务还停留在可获知性的服务阶段,只起到通过揭示档案信息的外部特征为档案信息内容与利用者之间搭起沟通桥梁的作用,这与网络信息服务的总体特征及利用者利用网络的“便捷、省力”获取信息的原则还存在明显差距。因此,档案网站建设和利用的重点是普及信息可获得性,尽快实现档案信息全文上网和提供下载,充分为利用者共享。

(二)档案网站建设工作要依赖计算机网络管理

档案部门通过网站建设实施档案资源共建共享时,不能单凭一个馆的力量,要有相关单位协作协调,依靠群体的人、财、物优势才能顺利进行。我国档案网络化管理的推行已经有从中央到地方完整的档案馆体系作为实体基础,在此基础上进行网络管理,可以克服目前档案部门现代化工作中各自为政、自成体系的局面。为解决因追求收藏档案全宗的完整齐全而引起的各馆间档案原件的归属权纠纷,各馆多采取利用副本或档案复制件的做法,在网络档案信息共建过程中,将通过各档案部门间的协作,建立网上共享档案信息形式的“数字档案馆”,实现网上档案信息体系的齐全完整。

在档案网络建设中,标准化是共建共享的技术前提。档案信息资源共享的系列标准包括信息加工标准、信息记录标准、信息检索标准、信息处理和控制标准等。档案资源共建将在这些标准的制约下,以统一、规范的形式实现网上信息交流。档案信息网络管理的数据库建立,要在统一的标准模式下进行。在档案管理中,数据库管理系统主要应具有数据操作、数据库操作、检索、打印、统计功能及其他方便用户的功能。档案机读目录数据库的标准化和规范化是档案信息共享的“瓶颈”问题。美国档案界研制成功并使用的 MARCAMC(机读目录档案和手稿控制)系统,为档案目录的标准化问题提供了解决的方案。在档案信息资源共享的数据库建设中,发展我国自己机读目录标准是十分必要的。

(三)档案网站建设的安全问题

INTERNET是一个开放的平台,这对档案信息的安全、可靠性构成了威胁。当前网络环境下,影响档案信息安全的最主要因素有三:硬件设备因素、操作系统因素、网络黑客因素。

(1)硬件设备对档案信息安全的影响主要来自其核心CPU芯片的安全性。由于美国在计算机领域的强大地位,使得世界各国使用的计算机硬件核心技术大都为美国所拥有,对于其他没有掌握计算机核心技术自主知识产权的计算机使用国来说,硬件的安全性往往受制于人。例如,我国使用的计算机CPU芯片主要由英特尔公司生产。1999年1月,英特尔公司宣布,为了增强网上电子商务的安全,将在奔腾Ⅲ处理器中设置用以识别用户身份的序列码。但是,序列码却给别人提供了窥探自己机内信息的可乘之机,对含有保密性质的档案信息的安全性影响极大。当时的信息产业部就英特尔公司奔腾处理器序列码问题提出的意见之一就是,“安装了奔腾Ⅲ处理器的电脑,政府不得直接将其连入互联网。各级政府机关,包括关键部门和行业如电信、银行、军事和其他要害部门,购买装有奔腾Ⅲ处理器的计算机时,必须把序列号关闭”。

2001年,中国科学院计算所自主开发出了我国自己的通用CPU,命名为“龙芯”,“龙芯”最为独特的优势,不是性能,也不是价格,而是它的安全性。军队、政府、国有企业和科研机构等直接关系到国家信息安全的部门使用的信息技术设备采用“龙芯”CPU,将有助于消除我国在电子政务、国防等方面的安全困惑,避免重要信息泄露,改变在信息安全领域的被动局面。

(2)操作系统是操作计算机运行最基本的要求。档案信息全文上网的实现,首先要解决操作系统的安全性问题,所以开发具有我国自主知识产权的操作系统已是当务之急,势在必行。

(3)网络黑客是指那些编写恶意、有害程序(病毒),并利用互联网传播这些程序和攻击特定网站的人。由于他们的破坏行为是借助网络进行传播,所以对档案信息资源的安全危害范围很大。一方面,各种电脑病毒的大规模破坏已是时有发生,存储在互联网计算机中的重要档案信息会因病毒的侵袭而严重损毁,有的甚至就无法恢复;另一方面,黑客的行为会让档案部门对档案信息网络化建设心存顾虑,畏缩不前,阻碍档案网络信息资源的建设。

网络环境对档案信息安全的威胁的确存在,但是档案工作者不能因噎废食。网络环境下,档案保护工作要从信息、网络的特点着手,与计算机工作人员共同探索保护网上信息资源安全、可靠的问题。同时也必须出台相关法律来规范档案网络信息的使用,比如,美国国家档案馆的电子文件中心已在INTERNET上开通主页,用户可从网上检索到电子文件中心的电子文件。但是检索电子文件信息要受到美国信息自由法案的约束,对有违信息自由法案的检索,在检索过程中就会被检索机扣留,以维护国家安全和公民的隐私权。