书城社会科学新信息环境下图书馆合作与资源共享
15769700000012

第12章 国内外比较典型的图书馆合作与资源共享项目(2)

CASHL目前已拥有160多家成员单位,包括高校图书馆和其他人文社会科学研究机构。个人用户12000多个。接受检索请求达千万次,原文传递请求14万多篇。

CASHL的资源和服务体系由2个全国中心、5个区域中心和10个学科中心构成,其职责是收藏资源、提供服务。全国中心主要负责资源整体规划建设和服务,协调各区域中心和重点学科中心, 设在北京大学、复旦大学。区域中心设在南京大学、武汉大学、四川大学、吉林大学、中山大学等几所大学,是在统一规划下,负责本区域的资源建设和全国范围内开展文献服务。学科重点中心负责某些学科或领域的重点收藏和建设。CASHL的服务支持由CALIS管理中心承担,负责建设“文献数据库”和提供文献传递系统。

目前,CASHL文献传递的服务对象暂定为全国高等院校的教师、学生、科研人员以及其他工作人员。

五、全国文化信息资源共享工程

全国文化信息资源共享工程由财政部拨款、文化部组织并实施,于2002年4月正式启动。其目的是利用先进科技手段传播、建设先进文化的大型公益性文化网络工程,旨在整合全国文化信息资源,通过互联网、卫星宽带传输和光盘将数字化文化信息资源传输到群众身边,实现优秀文化信息资源在全国范围内的共建共享,满足广大人民群众日益增长的文化需求,整体提高文化资源的利用率。

共享工程的实施,开辟了一个不受地域、时空限制的崭新文化传播渠道,对迅速扭转我国广大中西部地区(特别是贫困地区)的信息匮乏和经济、文化落后的局面将起到极大的作用,对继承和发扬中华民族优秀文化,实施“科教兴国”、“以德治国”的战略将产生深远的影响。

总体目标:第一,实现网络联网“135”计划,即实现1个国家中心、30个省级分中心、5000个以上的县、乡、街道和社区基层网点的联网;第二,完成以百万册(件)文献共建和“‘四个一’优秀作品”为核心的数字资源建设,即完成100万册文献、1000台优秀地方剧目、1000部优秀美术作品、1000部优秀音乐作品、1000件珍贵文物的数字化,并提供网上服务;第三,通过文化信息资源联合目录,建立网上文化信息导航系统,利用国家中心、省级分中心以及基层中心组成的网络开展服务。

组织机构:共享工程受全国文化信息资源共享工程领导小组领导,设有全国文化信息资源共享工程国家咨询委员会、全国文化信息资源共享工程国家中心以及各省分中心和基层中心。

服务对象:共享工程的服务对象是最广泛的公众群体,包括城市的社区、边远山区、边防哨所的基层文化单位。

服务方式:共享工程利用计算机、网络、通讯、多媒体等最新技术成果,建立一个基于网络的、分布的、贴近最终用户的组织模式,有组织、有系统地为基层群众服务。

除了以上全国性的图书馆合作与资源共享工程外,各重点省市也组建了区域性的合作与共享工程,如北京高校网络图书馆、上海市文献资源共建共享协作网、天津高校数字化图书馆、广东省高校电子图书馆、河北省高等学校数字图书馆联盟等,项目具体建设情况将在第五章详细介绍。

(第三节)国际合作项目

一、“中美百万册数字图书馆”合作计划

中美百万册数字图书馆项目(China-America Digital Academic Library,CADAL)是中美两国计算机科学家共同发起的一项国际合作计划,随后印度和埃及也相继参与其中,其目标是建设面向教育和科研的百万册图书规模的数字化文献资源,为高等学校教学科研提供强有力的数字资源支持,推动图书数字化资源的共享。

中美百万册数字图书馆全称为“中国教育科技数字图书馆”(China Education and Research Digital Library,简称CERDLIB)。这一合作项目是2001年由美国卡内基·梅隆大学教授Dr. Raj Reddy博士和西蒙学院陈刘钦智博士、中国科学院研究生院常务副院长高文博士共同发起的,旨在建设面向教育和科研的包含100万册图书的数字图书馆,其中中英文书籍各50万册。截至目前,图书馆的馆藏电子书籍已拥有超过20种语言,占到全世界所有书籍总数的1%,在这其中,电子版的中文和英文书本占到了绝大多数。项目中国部分(CADAL)由教育部“211”工程建设办公室归口管理,由浙江大学和中国科学院研究生院牵头,与北京大学、清华大学等14个单位(其余高校为吉林大学、武汉大学、西安交通大学、中国科学院研究生院、浙江大学、复旦大学、南京大学、中山大学、四川大学、上海交通大学)共同承担建设任务和运行管理。中国部分的项目是进展最快的。截至2007年底,已完成了107万册图书的数字化,占全球数字图书馆的70%以上。CADAL网站收录的中文图书包括珍贵古籍、民国时期出版图书、现代学术着作文库、博士硕士学位论文及其他特色文献资源,英文图书则包括美国大学图书馆核心馆藏、技术报告等进入公共领域的图书资料。CADAL与中国高等教育文献保障系统(CALIS)一起,共同构成中国高等教育数字图书馆的框架。CADAL通过国际合作方式进行数字图书馆建设与研究,利用外资额度将达到千万美元。该计划的实施对推进我国高校教学和科研信息环境建设、快速提升我国高等教育水平、加快高校与国际接轨、建设一流大学具有重要意义。该合作计划的直接效益是100万册中英文数字化图书资源和一流水平的技术平台,其间接效益是为全社会提供一个开放的知识库,为数字图书馆研究提供一个实在的研究对象,促进数字图书馆研究,促进知识传播和东西方文化交流,推动我国教育、科研和国民经济的发展。

CADAL项目建设内容主要有:数字资源建设,技术支撑环境建设,数字图书馆技术中心建设以及数字资源中心建设。其中数字资源建设包括中文图书资源和英文图书资源各50万册,并建成若干个多媒体资源库。技术支撑环境建设包括数字对象制作系统,数字对象管理系统,数字图书馆门户,数字资源的多媒体内容分析与检索。数字图书馆技术中心建设包括南方技术中心和北方技术中心,数字资源中心建设包括14个重点高校图书馆数字资源中心的建设。陈海英、竺海康:《中美百万册数字图书馆项目综述》,载《大学图书馆学报》,2005(1),3~6页、13页。

二、中文数学数字图书馆项目——EMANI计划

随着信息技术的迅速发展,传统的数学文献利用手段以及数学知识的传播方式已远不能满足当今数学界以及科学技术领域发展的需要。利用信息技术与因特网等先进手段,实现数学文献的长期保存和高效利用,已成为数学界和图书情报领域急需研究的课题。

近几年来,国际范围内对数学文献的数字化加工和网络化利用的呼声很高。2002年8月,北京举办国际数学家大会(ICM 2002)期间,清华大学数学系受中国数学学会的委托组织承办了主题为“通过Web展示和使用数学资源”的卫星会议。欧美等国家以及中国的50多位数学家和数学出版物方面的专家出席了会议,围绕“信息时代数学文献数字化的标准和技术”、“全球数学数字图书馆的构建”等问题进行了大会报告。数学专家们一致呼吁在全球范围内建立一个基于Web的数学文献利用环境,这对推动数学学科的发展至关重要。

从20世纪90年代末开始,欧美等发达国家陆续启动了若干“数学数字图书馆”项目。清华大学图书馆受邀参加的EMANI (Electronic Mathematics Archiving Network Initiative)计划是一个针对“数学文献电子文档网络”研发的国际合作项目,由美、德、法、中诸国的图书馆及联盟(美国Cornell大学图书馆、德国哥廷根大学图书馆、法国MathDoc联盟、中国清华大学图书馆)参加。EMANI于2002年2月正式启动,宗旨是推动逐步将世界范围内从古至今在数学领域的出版物数字化,在长期稳定保存的同时,以数字图书馆方式向全球的用户提供快捷的检索和全文浏览等服务。

为配合“EMANI”计划的推进,清华大学图书馆与学校数学系、信息学院合作,在2002年共同申请了学校的基础研究课题 ——“数学文献电子文档网络的若干关键问题研究”,该课题获得清华大学2002年基础研究基金的重点资助。以该课题的研究为基础,清华图书馆启动建设“中文数学数字图书馆(CMDL)”。2004年,校内三家单位继续合作,联合申请并获得自然科学基金的专项基金项目 ——“数学天元基金”的资助,进一步开发完善了CMDL的平台,补充增加了CMDL的资源。

近几年来,数字图书馆相关技术的发展为数学资源的数字化利用奠定了良好的基础。数学文献及史料经过数字化加工和处理,提供给使用者的内容不仅包括原有的文献,也包括知识的组织和体现。通过数字图书馆的方式,包括数学资源在内的各门类的文献资源和学科知识将更便于交流和利用、更有助于学习和研究。

CMDL目标定位:其一,采用先进的信息技术,将中国古代的数学遗产和近现代最有代表性的数学家的学术研究成果数字化,初步建成一个数学文化与知识的传播平台,通过因特网使用户能够方便地检索和获取数学信息和知识。其二,以CMDL作为基础,参与到全球数学数字图书馆构建的计划和活动中,使中国的数学家和学者能够与国际上的数学家和学者一起共享人类数学的研究成果和文献信息。

CMDL进展包括:

第一,数学史料的调查整理。清华大学图书馆下属机构——科技史暨古文献研究所调研了现存大陆的中国数学史料的情况:世代相传下来的有代表性的中国算学典籍300余种,清华大学图书馆收藏其中近200种,确定对100多种馆藏典籍数字化并在CMDL平台发布。

第二,数学文献保存元数据标准规范的制定。基于对数学类古籍文献的调研和对国际上元数据发展趋势的分析,制定了清华大学数字图书馆保存元数据框架方案。该框架参考了METS(Metadata Encoding and Transmission Standard)定义的数字对象分析模型,将元数据分为两大部分:描述元数据dmdSec和管理元数据amdSec。依照保存元数据的框架并参照我国《数字图书馆标准与规范建设》项目的相关文件起草了《中文数学数字图书馆元数据规范草案》,确定了描述元数据的元素集和管理元数据4个子类的元素集。CMDL采用METS作为编码方案来封装数字对象的整体结构和完整内容。

第三,数学古籍文献的数字化工作。图书馆对100余种约5万页的数学古籍进行了扫描,并对其中一些重要古籍进行了文本的录入。建立了三个辅助工具数据库(数学古籍联合书目库、数学史研究论文索引库、清华大学馆藏数学古籍细目库)。设计完成了20余个古代算法的动画(勾股定理证明,筹算加、减、乘、除法,筹算开平方术、开立方术,增乘开方法,方程、球体积算法等),针对古代算法的动画表现方式进行了探索。

第四,CMDL系统体系结构的设计与功能模块的开发。计算机系选用美国Cornell大学和Virginia大学合作开发的Fedora(开放源代码系统)作为CMDL系统的框架,实现对多种数字资源的底层管理,自行开发了外建索引机制和检索服务模块;图书馆开发了e-Catalogue模块,具有对各类元数据信息(如描述元数据,管理元数据等)、资源结构信息以及关联信息的着录和修改功能,并可针对着录数据生成METS格式的XML文档保存所有信息。CMDL平台的合作开发实现了从元数据着录、资源管理、Web发布的完整解决方案,不仅可以作为数学文化与知识传播和服务的支撑平台,还可以拓展用于管理更宽范围内的、更多媒体种类的数学资源。