书城社会科学现代图书馆人丛书-图书馆自动化与现代化
15796700000027

第27章 计算机和互联网的前沿技术在数字图书馆的应用(3)

那么MARC是否会被DC取而代之呢?实际上,这种担心是没有必要的。虽说MARC在我国推广才十几年,但我国迄今为止的各类图书馆文献的70%都已按MARC进行了著录,并且大多数都通过一定方式已经或逐步实现资源共享。且MARC著录详细、检索点多和检索角度广,这是一个暂时尚无别的方法可完全替代的重要信息资源。其实,传统的MARC也是一种元数据,一旦MARC的SCHEMA(或DTD)定义完成后也可纳入此系统,那么,数据量大、质量高的MARC数据源可从由传统的图书馆专业人员使用而变成大众信息资源,从而使一体化的虚拟资源检索平台的建立成为可能。同时MARC也在进一步适应新的发展环境,比如MARC为适应网络发展的需要,已经在该格式中增加了538字段(系统需求和存取注释)、516字段(计算机文件类型或数据注释)、256字段(计算机文件特征)以及856字段(电子地址和存取)。同时,为了促进MARC在网络环境中得到进一步的应用,美国国会图书馆正在研究制定MARC的DTD(文献类型定义),使得基于国际标准ISO2709格式的数据能自动转换到基于ISO8879的SGML格式上,适用于各类网络软件和浏览器。由此可见,21世界中叶前,在文献和信息著录中,必定是MARC和元数据并存的时代。只不过MARC侧重于传统文献,元数据侧重于网络信息,而且会出现二者共同发展的一个时期。

五、元数据在自动化图书馆和数字图书馆中的具体作用

(一)信息资源的共享

目前大多数学校图书馆、公共图书馆的资源共享都是通过MARC标准(ISO2709的方式)来实现的。由于MARC是计算机可读及处理的数据,对人来讲,这样的数据可读性比较差。再说,MARC数据处理方法的原因,使得其对硬件与软件平台的依赖性很强。所以对如今网络发达的现在来说,已不是唯一的使用方法。而元数据是直接利用标记性语言进行制作的,所以能更好的保证数据的结构化,易于被计算机处理和交流,对人来说有很好的可读性。从软硬件方面来说,由于标记语言采用了最简单的文本格式,使得它具有很强的兼容性和不依赖软硬件的独立性。另外,因为元数据描述与被描述的对象整合在一起,所以大大提高了内容管理与交换中元数据的可用性。加上元数据可以跟Z39.50结合在一起使用,使得它信息资源的共享方面显得得心应手。

(二)易于普及

由于MARC著录的复杂性,对于一般的图书馆编目管理人员来说,学习它是一件很困难的事。

而元数据,由于它的著录项目相对MARC来要少的很多,也比较容易弄懂,所以只要一般的培训,就可以上岗工作。在国外和港台,有关专家又把它称做“著者著录”,即凡在网络上产生和输出信息的人,都可以用元数据的格式来著录他自己的作品和数字信息。对于学校图书馆来说,将来一是可以将原来的回溯书目数据转成元数据,二是对新文献信息用元数据来进行著录,这样不但节约了成本,而且可以更好地发挥各类文献信息,特别是新兴的网络资源在学校教育教学中的作用。

(第三节)J2EE是数字图书馆系统软件开发的首选平台

本书在前一章详细介绍了数字图书馆的诸多特点,其主要特点就是通过互联网,把散落在全世界各地各计算机存贮设备上的不同软件管理的各种信息资源,经过数字图书馆系统的综合检索平台来进行互操作搜索利用。而这种系统软件应有二个必备条件,一是互操作的标准和规范,二是支持这种互操作标准和规范的软件开发平台。在我国,由于各类图书馆数量众多,规模也有很大区别,各图书馆受技术力量及资金支持等方面因素的影响,其系统的平台很难取得一致。因此,从长远的观点看,为了使开发出来的图书馆系统能适应不同图书馆的需求,就应考虑将系统建立在支持统一规范的平台上。因此,具有这方面条件的J2EE就成为业界逐渐青睐的目标。

一、J2EE的由来

J2EE是美国Sun公司开发的企业级应用程序开发平台,即“Java2 SDK Enterprise Edition”,J2EE扎根于组件技术,以Java2平台的标准版为基础,同时解决了对XML等技术的全面支持。

J2EE的基本组件的开发模式使用应用程序重新部属,而且还可以根据各图书馆的不同工作流程重新发布系统。

用J2EE作为数字图书馆软件开发平台,其最大优势是可以充分利用成熟的商业化标准,暂时绕开数字图书馆建设中许多繁杂的标准问题,不必在众多的数字图书馆模式中作非此即彼的挑选,可以针对我国的具体情况广泛实践。只要所开发的组件能有效提供必需的服务,将来一定可以纳入新的数字图书馆系统中。即使将来有完全统一的标准,原系统仍可保留成熟部分,而通过重新配置、增删组件甚至仅修改部分组件的接口等方法适应新标准。

同时,J2EE平台还有其他技术方面的优势。

二、J2EE适应数字图书馆的发展趋势

因为J2EE本身就是针对分布式应用而提出的,其层次化结构和纳入异构系统的能力正是分布式数字图书馆系统所需要的,其用户界面可利用现有的各种全球信息网技术,也必然能适应将来发展起来的新技术。

三、J2EE对数据库的选择具有很大的灵活性数据库是数字图书馆资源最基本的保存形式。目前的数字图书馆已经有多种类型的数据库,随着技术的推进,新形式的数据库将会不断出现,J2EE系统对于底层数据库的选择具有很大的灵活性。便于利用已有的各种资源。如果将来需要扩充、更换数据库,也很容易实现。

四、J2EE有成功范例可资借鉴

在J2EE实际使用中已总结出很多成功的模式,可供开发者参考例如网络的安全性,用户权限管理等问题是所有的数字图书馆实用系统都必须处理的,但也是其他J2EE应用程序开发时反复研究过,实践过的问题,所以容易找到可供参考的模式,必要时还可以通过购买现成的组件来解决。

在应用软件装上运行之后的相当长时间内,还有很多问题需要开发或销售单位解决。存在上述问题的原因,也在于应用软件涉及面宽,未经充分调试。如果以J2EE组件形式开发软件,则与其他应用程序有共性的部分可选用成熟的技术方案或组件,开发者可以专注于图书馆特有的业务逻辑部分,减轻开发负担,提高可靠性。而且对这部分组件可以在调试和应用过程中逐步积累经验,不断改进。

五、J2EE易于与互联网上资源的整合

由传统的图书馆资源转化而来的信息资源只是未来数字图书馆信息资源的一个组成部分,来自数字资源供应商的信息将是另一重要组成部分。这些资源必然有很大一部分建立在J2EE平台上。采用J2EE平台的系统自然可以与之无缝衔接。例如以客户端的形式查询、获取有关系统的有关信息,与其他信息一起作综合处理后,再用适当的形式提交给用户。从软件的角度看,这种过程与本系统内的查询过程无本质差别。未来的数字图书馆将拥有更多形式的信息资源,提供更多更复杂的服务。例如,个性化、智能化的信息报务,尽管目前处于起步阶段,将来必定随着相关技术的进步而逐渐发展。建立在J2EE平台上的应用系统可以通过添加组件等方式将新功能纳入其中,而不必对原系统作大的改动。

六、J2EE便于软件开发时的分工合作

在图书馆自动化软件的初期,不少软件只是一二个人单兵作战。而到了自动化集成系统及数字图书馆系统时期,需要有一个开发团队的协同作战。J2EE平台上的角色分离和组件复用为软件开发的分工合作与竞争提供了良好环境。

七、J2EE便于开发三层/多层分布式应用程序由于数字图书馆系统软件利用互操作来管理和检索,信息资源的浓度和广度不断拓展,因此会更迫切地需要三层/多层结构和新一代分布式计算机模型的Web服务。开发分布应用程序是J2EE的一大优势,利用J2EE平台可以很轻松的实现数据库的分布式处理和业务逻辑的分布式处理。这对中小学图书馆利用网络实现资源共享,提供了一项技术支持。例如,在一个县教育系统图书馆中心,在开发系统的时候并不需要知道学校图书馆室的数据库的位置,而只需要预先分配一个JNDI名字,程序根据这个名字找到相应的数据库;然后在发布应用程序的时候根据数据库的位置在J2EE服务器中配置数据源Data Source,并把这个数据源对应到JNDI名字即可实现对数据库的访问。另外,利用J2EE的JTA事务支持,就可以很容易地在各分布的数据库间实现分布事务管理。

用J2EE平台来开发一个图书馆系统,它与传统的C/S结构的图书馆系统最大的区别是:MVC(模型、视图控制器)分层结构清晰,分布式和可移植性更强。这个系统的客户端可以是基于浏览器的,它可以是基于用各种编程语言开发的应用程序。