书城社会科学现代图书馆人丛书-图书馆的管理
15793100000025

第25章 数字图书馆的管理(1)

(第一节)数字图书馆概述

一、缘起与概念

数字图书馆的研究开发,是伴随国际互联网的发展和普及而兴起的,大致发端于20世纪90年代初,起初并不是由图书情报界的人士首倡,由于图书馆是社会信息资源无可替代的集散地,最终必然地应用到了图书馆领域。

数字图书馆有一个非常宽泛的定义:数字图书馆是全球信息高速公路上信息资源的基本组织形式,这一形式满足了分布式面向对象的信息查询需要。这个定义中可能有两个概念需要解释,“分布式”和“面向对象”。简而言之,前者指跨图书馆(跨地域)和跨物理形态的查询,后者指不仅要查到线索(在哪个图书馆),还要直接获得要查的东西(对象)。这个定义类似于目前的图书馆“是社会信息资源的一种主要组织形式,满足了人们借阅书刊等基本信息需要。

二、数字图书馆基本要素

(一)数字化资源

大量的数字化资源是数字图书馆的“物质”基础。对于传统图书馆来说,是否能发挥其资源优势关键在于数字化工作,而数字化面临的第一个问题,就是做什么和怎么做。“做什么”是一个领导决策的问题,需考虑馆藏特色,社会要求以至于市场需求等等。“怎么做”是一个技术问题,需要在一套较为完整的数字图书馆规划方案指导下,建立类似于目前图书馆运作的“采编流”机制,依照规范标准进行数字化,使数字图书馆这一馆中馆的运作正常化,形成一套人马、两个馆的格局。数字图书馆对数字化资源并无偏好,虽然它的目的是直接提供读者所需的最终信息,而不只是二次文献(获得文献的线索),然而二次文献也可能是使某些读者的最终信息需求,因而书目数据,索引文摘等也是数字图书馆的组成部分。万千世界统一于数字图书馆中的0和1,书籍、期刊、录音、录像带乃至古籍善本、稀世字画甚至X光片,都消失了原本的物理形态,只要有相同的属性,就能被同时获取。

(二)网络化存取

高速的数字通信网络是数字图书馆的存在基础,数字图书馆依附于网络而存在,其对内的业务组织和对外的服务都是以网络为载体,得益于网络也受制于网络,只有利用网络至极限,才能发挥数字图书馆作用至极限。数字图书馆内部本身由局域网构成,一般是高速主干联接数台服务器及工作站,外部通过数台广域网服务器面向浩瀚的Internet。

(三)分布式管理

分布式管理是数字图书馆发展的高级阶段,它意味着全球数字图书馆遵循统一的访问协议之后,数字图书馆可以实现“联邦检索”,全球数字图书馆将像现在的Internet联接网站一样,把全球的数字化资源联为一体,联接成为一个巨大的图书馆。分布式管理之所以是数字图书馆的基本要素,在于它强调标准协议的重要性,只有全球共同遵循TCP/IP协议,才有Internet的今天,数字图书馆技术还没有这样一个公认的标准协议,因此技术标准的选择和参与制订,对每一个数字图书馆先驱者来说都是至关重要的。

三、建立数字图书馆的意义

传统图书馆担负着信息采集、存储、传播及版权控制的重任,DL也同样要完成这些任务,只是各项任务的内容、采取的手段及服务方式发生变化。建立数字图书馆的主要意义:由于数字图书馆是虚拟与现实相结合,大量的数字化信息存贮在无数个磁盘存储器中,通过计算机网络联接形成的一个联机系统。因此,与传统图书馆相比,它占用的物理空间相对很小。

数字图书馆收藏数字形式的信息,除了纸介质的书刊资料外,还收录其他一切可以数字化的信息,如视频、音频资料、计算机程序等等,可以满足读者的多种需求。

数字图书馆建设对于我们最重要的一点是建立以中文信息为主的各种信息资源,这将迅速扭转互联网上中文信息缺乏的状况,形成中华文化在互联网上的整体优势。数字图书馆还是保存和延续发展民族文献遗产的最佳手段,所有的珍贵资料都可以经数字化处理后,将原件保存在更适宜的环境中,而数字化的资料由于实现原件的复制,并不影响一般意义上的查阅。

利用数字化图书馆的用户可以不同图书馆的工作人员直接见面,而只通过网络与图书馆联系,图书馆专业人员通过电子邮件及电子咨询台与用户联系。图书馆的服务质量取决于软件设计、图书馆专业人员对用户回应的速度和质量、数字化信息的制作、网络的传播速度及人性化界面的设计等;用户也可以直接通过电脑登录至数字图书馆的主页,随意浏览、查询、下载、打印有用的信息。

数字图书馆扩大了读者的范围,普通图书馆因为读者对象与地理位置的限制只能为少数人服务,数字图书馆则允许人们在任何地方、任何身份进入图书馆自由查询。

四、数字图书馆的基本模块

数字图书馆是一个开放式的硬件和软件的集成平台,通过对技术和产品的集成,把大量的各种文献载体数字化,将它们组织起来在网上服务。它由五大模块组成:各种载体数字化,数据储存和管理,组成有效的访问和查询,数字化资料的传递和接收,权限管理和版权保护。

(一)各种载体的数字化

将书刊、古籍、善本等各种文字、图像(包括地图),缩微制品包括缩微胶卷和缩微平片等,利用计算机和相关设备,将这些资料数字化。

关于录音、录像、电影胶卷、唱片等可采用各个公司提供的产品,将音频、视频信息资料数字化,各公司往往提供压缩技术的先进工具来处理。

(二)数据的存储和管理

数字图书馆大多数采用客户机/服务器的模式。客户、图书馆服务器和对象服务器构成信息传递的核心结构。图书馆服务器主要管理数据的目录、索引和查询,而对象服务器用于管理数字化的对象(即各种类型载体的原文献),当对象数据直接到达客户的时候,就实现了图书馆对象数据的传送。它存储和管理的数据量是巨大的。

(三)组织有效的访问和查询

文本类型的文件检索,实现在网上的快速全文检索软件。如何为多媒体信息建立索引,让用户进行有效的查询,也是当前研究的热点之一。直接针对图像建立索引,可以按照颜色、图案来索引纺织品的图案;用边缘轮廓结合其他图像处理技术索引人脸照片等;用同样的方法,对数字化的视频和音频信息内容进行查找,这是访问DL的关键技术。

(四)数字化资料的传递

综合业务数字网(ISDN),目前已成为多媒体通讯的基本传输网络。ISDN分为窄带(N-IDFN)和宽带(B-ISDN),前者美国、欧洲、日本已投入使用,它可以传输声音等连续媒体和低质量的视频信号。有线电视(CATV)广播网络,可以说是DL最有前途的传输环境。美国一些专家称之为“信息高速公路的最后一公里”。我国只要对目前的有线电视网络作适当改造,使其具有正反向传输功能之后,就可以用它实现高品质的计算机联网、信息终端和交互式电视等功能,就可以作为DL的传输环境。

(五)权限管理和版权保护

数字图书馆的安全性显得很重要,它要有一般计算机网络系统的管理功能,要重视各种类型用户的权限管理。更重要的是,必须用适当的技术确保版权人的资源不被滥用。

五、数字图书馆研究

数字图书馆是采用现代高新技术所支持的数字信息资源系统,是下一代因特网网上信息资源的管理模式,将从根本上改变目前因特网上信息分散不便使用的现状。通俗地说,数字图书馆是没有时空限制的、便于使用的、超大规模的知识中心。

作为知识经济的重要载体,数字图书馆是国家信息基础设施重要组成部分,目前已成为评价一个国家信息基础水平的重要标志和本世纪各国文化科技竞争的焦点之一。对于我国来说,数字图书馆的研发起步较晚,因此,建设数字图书馆更加具有必要性和紧迫性。其重要意义在于:首先,数字图书馆将改变以往信息存储、加工、管理、使用的传统方式,借助网络环境和高性能计算机等实现信息资源的有效利用和共享。它的建设将使我国在综合国力的竞争中抢占先机,掌握发展的主动权,实现跨越式发展。

其次,数字图书馆建设的核心是以中文信息为主的各种信息资源,它将迅速扭转互联网上中文信息匮乏的状况,形成中华文化在互联网上的整体优势。我们要通过数字图书馆的建设,将我国悠久的历史、灿烂的文化,特别是当代建设的成就通过互联网向全世界展示,让世界了解中国,让中国走向世界。

第三,数字图书馆的建设将促进我国信息技术的发展,同时带动与之相关的计算机技术、网络技术、通讯技术和多媒体技术等各项高新技术的迅速发展。这些高新技术迅速转化为现实生产力,将对我国知识创新体系的建立起到极大的促进作用。

第四,数字图书馆建设是“科教兴国”战略的源泉和动力,也是实现公民终身教育的大课堂。数字图书馆以其对信息资源的整理加工和有序组织,为“科教兴国”战略提供了最为便捷、有效的发展环境。同时,数字图书馆可以最大限度地突破时空限制,营造出进行全民终身教育的良好环境,对于我国国民素质教育将起到巨大的提升作用。

第五,数字图书馆将改变目前图书馆的工作方式和服务模式。数字图书馆可以更好地履行图书馆在倡导、组织和服务全民读书中的重要职能。图书馆馆员将成为捕捉和整理信息的专家,读者可以在世界各地通过网络阅览数字图书馆中的丰富信息。图书馆的发展将进入一个前所未有的新阶段,发生根本性的变化。

(第二节)数字图书馆信息资料的来源与管理

一、数字图书馆信息资料的来源

数字图书馆要建设数字信息平台,需要海量的知识积累,这些知识或信息的来源是多方面的。由于图书馆是人类知识的宝库,也将是信息高速公路上最大的信息源,因而图书馆的数字化就成为数字图书馆积累资源的首选目标。所谓数字化即利用现代信息技术对传统介质的图像、文字、声音和影像进行压缩处理,使其转化为数字信息,然后,通过计算机技术进行贮存,通过网络通讯技术进行传播、接收。数字化不仅同光导纤维和计算机一起成为二十世纪以来信息技术革命的三大支柱之一,而且也同网络化一起构成21世纪高科技经济时代的基本特征。网络和数据库建设,是新时代各国信息产业必须进行的基本建设。

此外,数据库、多媒体信息、网页、讨论组等也是重要的信息源。资源建设者会根据实际需要、运用网络手段,检索获得更多更新的资料。作为继报纸、广播、电视之后的第四大媒体。网络所提供的信息更为自由,更新更及时,获取和数字化加工更为方便。学校对信息需求,有一定的规律。一方面是人文与科技的普及知识和最新信息;另一方面教学科研的最新理论,最新动态是学校教育对网络信息的长期需求。但从何渠道用何种方法去获得还需探讨和实践。

(一)现有学校图书馆自动化管理中的书目数据库首先可以通过Z39.50和联机查询系统把一个地区主要的书目数据形成联合目录,有条件的地区以一个图书中心为主,幅射多个图书馆,实行流动借阅或馆际互查互借。

(二)购买加合作,重组资源库

通过购买或联合著录,建立适合学校教育教学的期刊题录索引和文摘库,进而到全文库建立的原则是,在制作规范的前题下,首选商品化数据库;其次是由区域教育行政部门或学校图书馆协作组织来联合制作除本校使用的教学资源以外的共享资源,切忌各校各自为战,虎头蛇尾。更不能单兵作战,以免因学习调研少,缺少规范,致使制作出的数据难以资源共享。

(三)现有电子资料的数字化

一个地区的若干主要学校或一个规模较大的骨干学校自购的声像资料、磁带、光盘及资源库,尽量都转成数字信息,装进校园网或图书馆的专用服务器,实现资源共享。

(四)通过互联网链接和检索相关有偿或无偿的信息资源库如超星、中国期刊网、万方数据资源系统、书生之家、中图书苑、四库全书数据库,人大复印报刊资料全文数据库,中文社会科学引文数据库,中国重要报纸引文数据库等。

(五)全国部分重点中学名校的教科研或多媒体教学网站如北京四中、北京景山学校、人大附中的网站,也有无偿和有偿地供检索和下载。

(六)自建数字资源库

像华南师大附中图书馆,除另有馆员负责传统图书馆的计算机自动化管理外,还有一个由馆长领导的有四名专职馆员组成的信息资源整合组。一方面从网上各相关资源库搜集资讯并整理、标引为本校资源库的基础积累。另一方面负责对全校各学科教师网络教学课件的审核辅导,完成后再加入本校的资源库中去。但是,像有该校图书馆这样人力资源的学校,全国为数极少,如果华南师大附中能像北京市、北京景山学校等一批学校一样,组成教学科研课件共享联网,进行分工合作,并对资源加以规范标引,然后加以公司化运作(像北京四中本身就有规模不小的公司),就能让全国更多学校实现资源共享。

二、数字图书馆信息资源的组织管理

(一)规划所要开发的资源内容

从其他国家的数字图书馆的开发情况来看,选题内容大多注重科研教育、注重历史遗产的挖掘。我国有着五千年的文明史,数字图书馆要传播中华文明和进行国民素质教育,使之成为互联网时代的知识中心、文化中心和教育中心。所以资源库的内容应涉及政治、经济、军事、历史、地理、民族、文学、艺术、宗教、自然科学、农业、医学、对外交流等各方面。要按照学校教育需求选题,统一规划、分步实施,先易后难的建设数字图书馆资源库。

(二)筛选据有价值资源进行资源库建设

建设者要首先确定资源对象,然后将之进行数字化,在收集资源时要注意兼顾多种媒体形式。要对资源内容进行很好的编辑,这是数字图书馆资源库区别于目前网上资源的重要特点之一。优先采取学校用户易于接受的超媒体表现形式,对素材进行去伪存真、去粗取精的工作,编写解说词,认真比较筛选图片、影像等。

(三)信息资源的元数据标引