书城社会科学教师的28个怎么办-教师如何培育信息素养
16214800000019

第19章 利用现代化技术获取信息(5)

Electric(c)Vehicle=ElectricANDVehicle

⑤(L)——Link。系统限定只在主题词字段查找,在有些文档中,两个主题词之间有一定的从属关系或分一、二级主题词的文档才可用此逻辑符。例如在第8文档中(L)前为一级主题词,(L)后为二级主题词(见下式)accidentprevention(L)ironminesandmining⑥(s)——Sentence在某些文档中,用于同一字段的同一句子或片语的查找,且两词间可夹若干词,只要两词同时出现在一个句子或片语中,即算命中。

3.使用自由词全文查找的操作方法

现仍以不锈钢坯连续铸造这个课题为例,同是那些检索词,仍然使用32号文档,改用自由词全文查找的方法来检索,分析检索结果与只用主题词进行查找的异同。

用自由词全文查找时,一个明显标志就是检索词之间一般用(w)或者其他前文查找逻辑算符连接。这时的查找步骤如下:

?b32

?ssstainless(w)steel??

115332STAINLESS(W)STEEL??

?ssslab??

22473SLAB??

?sscontinuous(w)costing

36825CONTINUOUS(W)CASTING

?c1and2and3

4191AND2AND3

由此过程可见,同一课题使用相同文档,相同检索词,用自由词全文查找所得的文献数比按主题词查找多(19比9)。这主要是因为,按自由词全文查找扩大了查找范围,放松了检索词的限定条件,故命中文献也相应增多。

两种方法的主要区别在于:按主题词查找查全率低但查准率高,按自由词全文查找查全率高而查准率低。

检索者可据自己的检索需求决定选取哪一种查找方法。

现代化信息检索技术检索策略

一、检索策略及其制定步骤

1.检索策略

所谓检索策略,就是在分析用户情报提问实质的基础上。正确地选择检索词,科学地运用逻辑算符、制定合理的检索提问式的原则和方法。检索策略的优劣,直接影响到相关文献的查全率和查准率,关系到检索服务的效果。当然,对于一定的情报提问来说,检索效果的优劣取决于许多因素:首先是书目数据库的本身的因素,如该数据库所使用的词表质量、标引质量等;其次是系统所提供的功能。但是,在一定数据库质量和系统功能的前提下,检索策略无疑是一个非常重要的因素,在同一个检索系统中对同一个书目数据库进行同一课题的检索,不同的检索策略会导致不同的检索效果。

2.检索策略的制定步骤:

(1)检索课题的分析

在制定检索策略时,必须先对检索课题进行详细的主题分析,分清主要概念和次要概念,以便考虑问题时有所侧重;检查是否需要排除某些概念,以保证情报提问的准确表达。对于一些没有什么检索意义的泛指概念(如方法、研究、作用等),一般不宜选用。在进行主题分析时,去掉隐含的概念,可取得较好的检索效果。例如,“国外教育管理现代化”中的“现代化”就是一个隐含概念,因为当今发达国家的教育管理本身就包含现代化内容,再用“现代化”这个概念去限定就显得多余了。这种隐含概念的使用,常常会影响检索效果。有人曾用“教育*管理*现代化”这种检索语句查找文献,结果一无所获。在概念选择中,应保证在能完整地表达课题内容的前提下,尽可能减少概念组合,减少限制条件。这是消除可能存在隐含概念的有效方法。

在分析课题时,应对查全率和查准率有相应的要求,以便确定合适的检索范围。各种类型的检索课题所涉及的学科范围不同,对检出文献的需求也不一样;各专业的用户因其所从事工作性质及研究的不同,对检索的查全率和查准率也有着不同的要求。对那些要研究新课题、撰写评述性文章与学术著作以及申报专利的用户而言,他们往往需要全面、系统地收集某一专题范围内的文献资料,因此对查全率要求较高。这时,应采取多选用相关概念,增加上位概念(如查微型计算机,必要时可查计算机)或下位概念(如查贵金属时,可以查具体的金属名称:金、银、铂等)的方法来扩检。另外,通过减少概念组面数,去掉部分限制条件,也可扩大检索范围,取得查全的效果。对于在研究过程中需要解决某一具体问题或正在进行技术攻关的用户来说,他们往往只需要某一主题或几个关键数据方面的情报,只要求检索的结果能解决他们的实际问题,不一定需要很多文献,因此对查准率要求较高。这时应使用专指性较强或增加限制的概念来缩小检索范围,以达到查准的目的。还可通过对字段的限定,来保证查找的准确性。

对于那些对查全率、查准率无特殊要求的用户来说,应针对不同的课题,制定相应的检索策略。对文献量较大属于成熟学科的课题,应优先考虑查准率,从众多的相关文献中选取针对性较强的文献。这样,既可以保证检索的质量,又可节省机时。对文献量较少属于新兴学科的课题,可适当放宽检索范围,来保证查全率,以免遗漏重要的参考文献。

(2)检索词的选择

通过主题分析,确定了各概念组之后,就要选择表达概念的检索词(项)。检索词的选择,一般有下面几种方式:

①优先选用主题词表。主题词能准确地表达主题概念,查准率高。主题词表的参照结构及等级关系,可提供所用主题词的上位词,下位词及相关词等,以供参考和选择。这对选全和选准有关主题词有很大帮助,有助提高查全率。

②从相应的印刷本工具中选取索引词。这种词针对性强,检索效果较好。通过手检摸底,可以了解有关专业术语及用词规律,还可估算有关文献量,以便制定相应的检索策略。

③从原始文献中选取自由词。这种词一般都是专指性较强的专业词语,只要组配得当,通常能够取得较好的检索效果。但要注意选全有关的同义词和近义词,有时还应使用反义词(如环境保护一环境污染);同时,还必须考虑英美不同拼写形式的词以及检索词的单、复数形式、缩写形式等。

④在不具备以上条件的情况下,可以从专业词典、手册及分类表等参考工具书中选词。但是,要避免选用使用频率较低的词,且一般不选用动词和形容词,也不要想当然地按平时的习惯称呼用词。必要时,可使用扩展指令,显示检索系统的索引和词表,以便选择检索词。

⑤检索专利数据库可使用分类号来限制检索的专业范围,以提高查准率。在有些文档中查找特定的化学物质时,使用化学物质登记号,可取得较好的检索效果。

(3)编制合理的检索式

检索式是检索策略的逻辑表达式。从某种意义上说,它就是检索策略的具体体现。检索式的制定是否合理,将关系到检索策略的成败。检索式的质量,主要取决于检索者对检索系统功能的了解程度以及使用检索算符的方法和技巧。一般而言,使用逻辑“与”算符越多,则限制条件就越多,专指性就越强,有利于提高查准率;使用逻辑“或”算符越多,连接的相关词越多,检索范围就越大,查全率越高。另外,使用逻辑“非”算符来去掉不相关概念,也可提高查全率。但在使用逻辑“非”时要慎重,不然会舍去一些相关文献。例如,查找“除核能以外的能源方面的文献”,这时用逻辑“非”排除“核能”这个概念时,有一篇名为“analternativetonuclearenergy”(核能的一种代用品)的文献就会被排除,而这正是我们所需的文献。

在检索式中,一般不要连续使用多个位置逻辑算符,以免限制过严而漏检文献。一般来说,如果连续使用三个以上的(W)算符,就难查到文献了。利用截词符对检索词进行适当处理,可表示检索词的单复数形式,同一词的不同拼写形式以及词干或词尾有多种变化的各种检索词。例如,查找“反射方面的文献”,采用截词形式“reflect?”,就可以包括许多相关词:reflectance,reflectedwave,reflection,reflectometers等等。这样可以减少输入的检索词数量,节省机时,同时还可提高查全率。

二、检索策略制定举例

任何一个课题的检索都不可能完全相同,以上介绍的检索策略的制定步骤与方法只是基于就一般情况而言的,而要真正地做到合理制定检索策略,则要不断实践,不断丰富经验。以下我们介绍一个检索策略制定的实例。

例课题:添加谷壳的铁矿石烧结工艺

课题说明:通过大量实验表明,将谷壳添加到铁矿石烧结料中,能大幅度提高烧结矿的产量,降低能耗,因此,可取得显著的经济效益。本课题的检索目的是想普查国外有无类似的工艺技术。以判定是否能申报发明专利。

根据课题内容,用户选择了如下检索词:

①ironore铁矿石

②sinter烧结

③additives添加物

④ricehusk谷壳

检索策略的制定:

对这个课题来说,在铁矿石烧结料中加入谷壳已经隐含了“添加物”这个概念,因此,没有必要使用这个概念了。在检索中,去掉隐含概念,也就减少了限制条件,有利于提高查全率。由于预先估计到这方面的文献可能不多,因此,为了得到所有相关文献。决定先不使用“烧结”这个概念限定,以扩大检索范围。“烧结”作为备用检索词,根据联机显示的情况决定是否使用。另外,“铁矿石”这个概念组面还应增加两个相关词:meganetite(磁铁矿)、hematite(赤铁矿)。“谷壳”这个概念组面增加了ricehull(在该课题检索中,就是因为增加了这个相关词才命中了文献)。检索提问式为:(iron(w)ore??+hematite+magnetite)*rice(2N)(hull?+husk?)。

在与我国联机的国际联机系统中,ESA系统尚无专利文档;ORBIT系统虽有世界专利文档,但由于指令颇多,检索过程复杂。占用机时较多,不太经济;而DIAL,OG系统功能强,拥有的专利文档多,目前国内的专利“查新”大都使用该系统。因此,决定使用DIALOG系统,并选择了专利文档及有关技术文档一共8个。在检索中,先使用了411文档进行预检扫描,然后再转有命中文献的文档打印有关记录,取得了较好效果。

计算机检索系统一般都采用专指性标引原则,即采用专指度最相符的主题词来标引文献。为了获得满意的检索效果,检索者也应遵守这个规则,并尽量使用相应专指度的检索词。

计算机检索是在手工检索的基础上发展起来的现代化情报检索方式。机检与手检之间并没有不可逾越的鸿沟:相反,只有两者的紧密结合,才能更好地发挥机检的优势。通过手工查找相应的书本式检索刊物,可以核对检索用词是否准确,检索范围是否恰当,以便进行适当的调整和修正。

三、检索策略的调整

在机检过程中,有时需要对检索策略进行多次反复调整才能获得最佳检索效果。检索策略的调整方式分为联机反馈调整和脱机反馈检索两种。

1.联机反馈调整

联机反馈调整的方式灵活简便,可任意扩检或缩检。检索人员可采用“人一机对话”方式,边检索边观察终端屏幕显示的结果,当场进行调节,修正,不断完善检索策略,直至获得满意结果。由于检索系统具有将已输入的检索词或检索式再限制在题名和标引词字段查找之功能,这使得联机调整有更大的灵活性,在检索中,可先输入检索词进行全文查找,然后再根据终端显示结果来决定是否要进一步缩小检索范围,以得到更为准确的结果。

例一课题:计算机在能源管理中的应用

检索ESA系统的8号文档(科学文摘)

?b8

?fenergymanagement

l495ENERGY(W)}MANAGEMENT

?fcomputerapplication

2508COMPUTER(W)APPLICATION

?C1*2

30l*2

?SComputer

4124384COHPUTER

?C1*4

51351*4

?1imit5/TI

6185/TI

?t6/6/1—18

TYPE6/6/1

TYPE6/6/2

......

±

type6/6/18

计算机在能源管理中必然是被应用,因此application是一个多余隐含概念,它使得第3步表示的能源管理和计算机应用的组配结果为零。去掉隐含概念后,在第5步命中3135篇文献,为提高查准率,在第6步再限定在题名字段检索,结果得到18篇较切题的文献。

2.脱机反馈检索

在检索中,有时由于种种原因,没有预期的检索效果,或是发现了新的检索线索,这时,需要进行再一次的反馈检索。脱机反馈检索就是通过对检索结果进行分析、研究,找出存在的问题,或补充新的检索内容,制定新的方案,然后用修改后的检索式再检索的过程。

例二课题:硅线石耐火材料

通过手检摸底之后了解到,硅线石(Sillimanite)有相应的化学物质登记号。由于登记号具有单一性,在检索中使用登记号专指性强,查全率高。因此采用了下列检索式:

RN一12141—45—6(S)refractor?

上式在“化学文摘”数据库中,命中了几百篇文献。采用第一种格式联机打印了80篇文献的文摘号。以上检索的查全率高,但查准率不太理想。一般来说,耐火材料的成分是各种各样的,我们所需要的是以硅线石(sillimanite)为主要成分的耐火材料。要判别这一点,对手检而言并不存在什么困难,但计算机没有这种随机判断能力,而只会机械地进行字面比较。因此,许多仅含少量硅体石成分的耐火材料也被命中了,这是不切题的。虽命中文献多,但在打印的80篇中,有用的很少,因此:决定进行反馈检索。通过分析检索结果,了解有关专用用词形式,将检索式修改为:

Sillmanite(2w)refractor

结果命中了45篇文献,查准率大大提高。取得了较好效果。