iv>
读者培训

第2章 文献信息检索基础知识

发布时间:2019-06-04 21:26:04 发布人:本站编辑 浏览次数:

2.1文献信息检索原理

文献信息检索包括文献信息的汇集、存储(标引)与文献信息的需求分析和检索二个过程。

1.信息的汇集、存储(标引)

2.信息的需求分析和检索

2.2文献信息检索语言

2.2.1文献信息检索语言概述

文献检索语言又称为情报检索语言、文献标引语言、索引语言。他是以文献信息的加工、存储和检索的共同需要而编制的专门语言,是表达一系列概括文献信息内容和检索课题内容的概念及其相互关系的一种概念标识系统。

2.2.2检索语言的种类

信息资源检索语言根据文献的不同特征有不同的分类方法。

1.按文献信息资源的特征划分

(1)描述信息资源外部特征的检索语言:主要是指文献的篇名(题目)、作者姓名、出版者、报告号、专利号等。

(2)描述信息资源内部特征的检索语言:主要是指依据所论述的主题、观点、见解和结论采用不同形式将其表述出来的方法。

2.按规范化程度划分

(1)人工语言:也叫规范化语言,是人为的对标引词和检索词加以规范,使每个检索词只能表达一个概念。

(2)自然语言:是直接从原始信息中抽取出自由词作为检索点的检索语言。该语言对主题概念中的同义词、多义词等不加处理,取其自然状态,因此称为自然语言。

3.按组培方式划分

(1)先组式语言:指在检索前检索词已先用固定关系组配好,并编制在词表中,检索时用户只能根据词表去查找信息资源而不能任意组配检索词,只能直接利用预先给定的组配好的检索词去检索文献。常见的分类法、标题词法就是这种检索语言。

(2)后组式语言:指在检索前,检索词在词表中没有被预先组配,检索时用户可根据不同的检索需求对某些词进行任意组配。常见的单元词法、叙词法和关键词法等属于后组式检索语言。

4.按内容性质划分

(1)分类语言:分类语言中最常见的是体系分类语言,他按照学科体系从综合到一般、从复杂到简单、从高级到低级的逻辑次序逐级展开。最著名的有中国科学院图书馆分类法(科图法)、中国图书馆图书分类法(中图法)、美国国会图书馆分类法(LC)、杜威十进制分类法(DDC)等。一部完整的分类法由分类表、辅助表和使用说明3部分组成。

(2)主题语言:是采用表达某一事物或概念的名词术语来标引、存储、检索的一种检索语言。根据选词原则、词的规范化处理、编制方法和使用规则的不同,主题语言可分为标题词语言、关键词语言、单元词语言和叙词语言。

2.2.3常用检索语言《中国图书馆分类法》简介

《中国图书馆分类法》简称《中图法》,是我国各类图书馆和情报单位普遍使用的一部综合性的分类法,被推荐为中国标准图书分类法。

《中图法》是按科学分类,结合图书的特性所编制的一套系统的体系分类法。体系共分五大部类22大类,每一大类下根据学科的具体内容层层细分为一级、二级、三级、四级……类目。这样逐级划分下去就形成等级分明的科学系统,其结构见下页表2-1。

2.3文献信息检索工具的分类

文献信息检索工具分为事实数据检索工具和线索性检索工具。用于查询数据和事实的检索工具,如字典、词典、手册、年鉴等属于事实数据检索工具。用以报道、存储和查找文献线索的属线索性检索工具,它是附有检索标识的某一范围文献条目的集合。

检索一般具备五个条件工具:

1)有明确的收录范围。

2)有完整明了的文献特征标识。

3)每条文献条目中必须包含有多个有检索意义的文献特征标识,并标明供检索用的标识。

4)全部条目科学地按照一定规则组织成为一个有机整体。

5)有索引部分,提供多种必要的检索途径。

2.3.1按文献信息的著录形式划分

1.目录

目录是对一批相关文献外部特征的提示和报道,是有序的文献清单。以“本”、“种”或“件”为报道单位。目录对文献的描述比较简单,只记录文献的外表特征。不涉及文献的具体内容。著录款目为题名(书名、文献名)、作者(著者、编者)、出版项和载体形态等。目录按载体划分有书本目录、卡片目录、机读目录MARC(MAchine Redable Cmalog)以及在网络上运行的联机公共检索目录OPAC(Online Public Access Catalog)。

2.题录

题录以内容上独立的单篇文献或书中一部分以至整个出版物作为其著录和报道单位(按“篇”报道文献),也只对文献外表特征的描述。著录项目通常有文献号(题录号)、文献篇名、作者及工作单位、原文出处(包括刊名、出版年、卷号、期次、起止页码)等,题录报道信息的深度比目录大,是用来查找最新文献的重要工具,如中国期刊网提供的中国期刊题录数据库。题录报道周期较短,收录范围广,著录较为简单,但没有内容摘要。

3.文摘

文摘也是以单篇文献作为报道单位,同时揭示文献的外部特征和内容特征。文摘的著录项目是在题录基础上增加了内容摘要项,即每条文摘都是由题录和文摘正文两部分组成。

4.索引

索引是对一组信息集合有系统的指引,一般只起索引特定信息内容及其存储地竺的作用,是一种附属性的检索工具,它不但广泛应用于各种类型的文献中,也广泛应用于各种检索工具中。索引常常附于检索工具的后部,但也有响工具本身全部是由索引构成。

索引由索引款目和参照系统两大部分构成。索引款目是索引的主要组成部分。

5.搜索引擎

搜索引擎是以网页为著录单元,在Web中自动搜索信息并将其自动索引到Web服务器。索引信息包括文档的地址,每个文档中单字出现的频率、位置等。网络搜索引擎很多,如比较著名的英文搜索引擎Yahoo!、Alta Vista、Infoseek、Lycos、Gopher等;中文的搜索引擎如Google、百度、搜狐、网易、新浪、搜狗等。

2.3.2按文献信息存储介质划分

1.手工检索工具

用人工查找文献信息的工具,大多以各种目录、题录、索引、文摘等形式出版。尽管手工检索工具内容千差万别,种类繁多,结构各异,但基本组成类似,一般由正文前部分、正文部分和正文后部分组成。

2.计算机检索工具(系统)

计算机检索系统又称现代化检索系统,是用计算机技术、电子技术、远程通信技术、光盘技术、网络技术等构成的存储和检索信息资源的检索系统。存储时,将大量的各种信息资源以一定的格式输入到系统中,加工处理成可供检索的数据库。检索时,将符合检索需求的提问式输入计算机,在选定的数据库中进行匹配运算,然后将符合检索提问的检索结果按要求的格式输出。

计算机检索包括单机检索、联机检索、光盘检索和网络检索,多为数据库检索。

对检索者来说,必须了解数据库的结构和类型,以便根据不同的检索要求选择合适的数据库和检索途径。

(1)数据库的结构:数据库是指以某一特定方式编制和存储在计算机设备上相互关联的数据资料的有序集合,是计算机信息检索的重要组成部分。

(2)数据库的类型

①书目数据库(Bibliographic Database)。是机读的目录、索引和文摘检索工具,检索结果是文献的线索而非原文。

②数值数据库(Numeric Database)。主要存储的是数值数据。

③全文数据库(FullText Database)。存储的是原始文献的全文,有的是印刷版的电子版,有的则是纯电子出版物。

④事实数据库(Fact Database)。是存储指南、名录、大事记等参考工具书的信息的集合。

⑤超文本型数据库(Hypertext Database)。是存储声音、图像和文字等多种信息的集合。

(3)计算机检索的特点

①检索速度快。能大大提高检索效率,节省人力和时间。

②检索途径多。除手工检索工具提供的分类、主题、作者等检索途径外,还能提供更多的检索途径,如题名途径等。

③更新快。尤其是国外的计算机检索工具,光盘多为月更新、周更新,网络信息甚至为日更新。

④资源共享。通过网络能提供远程检索,不受时空限制,共享服务器上的信息资源。

⑤检索更方便灵活。可以用逻辑组配符将多个检索词组配起来进行检索,也可以用通配符、截词符等进行模糊检索。

⑥检索结果可以直接输出。

2.4文献信息检索的途径、方法和步骤

2.4.1文献信息检索的途径

文献信息检索途径主要有以下几种:

1.题名检索途径。是指根据已知文献题名(篇名)来查找文献的途径,它依据的是书名目录(索引)、刊名索引、篇名索引、标准名称索引、数据库名称索引等,这些统称为题名索引。“题名索引”主要在计算机检索系统中应用较多。

2.作者检索途径。是指根据已知文献作者来查找文献的途径,它依据的是作者索引。作者索引采用文献上署名的著者、译者、编者的姓名或团体名称作为查找的依据。

3.分类检索途径。是按照文献资料所属学科(专业)类别进行检索的途径,所依据的检索工具是分类索引。如利用中图法编制的索引。

4.主题检索途径。是指通过文献信息资料的主题内容进行检索的途径。主题检索途径的最大优点是直接性,主题法直接用文字做主题,表达概念准确、灵活,易于理解、熟悉和掌握。而且它把同类主题性质的事物集中起来,突破了分类途径的严格框架限制,尤其能适应现代科学的发展。

2.4.2文献信息检索的方法

根据课题要求进行文献信息检索时,一般采用以下两种检索方法:

1.直接检索法:该法是指不通过二次文献(检索工具)而直接查找一次文献或三次文献的方法,也就是直接阅读原始文献并从中获得所需信息的方法。

2.间接检索法:间接检索法必须借助检索工具查找文献,主要包括常用法、追溯法和循环法。

(1)常用法。是直接利用检索工具来查找文献信息的方法,它以主题、分类、作者等检索点,通过检索工具获得文献线索,再由线索查得文献原文的一种方法。由于检索要求不同,常用法又可分为顺查法、逆查法和抽查法。

①顺查法。这是一种根据检索课题的时间范围,按由远及近,从过去到现在,从旧到新的顺序逐年逐卷地查找文献的一种方法。

②逆查法。逆查法与顺查法正相反,按照检索课题的时间范围,利用一定的检索工具由近到远,由现在到过去,由近期到早期逐年逐卷地回溯查找文献的一种方法。

③抽查法。它是指针对某学科的发展特点和发展阶段,抓住该学科发展较快,文献资料较多的年代,抽出这段时间进行检索的一种方法。

(2)追溯法。又称扩展法、追踪法。是指不利用一般的检索工具,而是利用已经掌握的文献末尾所列的参考文献,进行逐一地追溯查找“引文”的一种最简便的扩大情报来源的方法。它还可以从查到的“引文”中再追溯查找“引文”,像滚雪球一样,依据文献间的引用关系,获得越来越多的内容相关文献。

追溯方法有两种:一种是利用原始文献所附的参考文献进行追溯,直至检索到切题文献。另一种是利用《科学引文索引》工具书进行追溯。

(3)循环法。循环法又称为综合法,它是把上述两种方法加以综合运用的方法。循环法既要利用检索工具进行常规检索,又要利用文献后所附参考文献进行追溯检索,分期分段地交替使用这两种方法。即先利用检索工具(系统)检到一批文献,再以这些文献末尾的参考目录为线索进行查找,如此循环进行,直到满足要求时为止。综合法兼有常用法和追溯法的优点,可以查到较为全面而准确的文献,是实际检索文献采用较多的方法。

2.4.3文献信息检索的步骤

1.分析研究课题,明确检索要求

(1)确定主题概念:分析研究课题的目的,明确课题所要解决的问题,分析课题的内容实质、所涉及的学科范围及其相互关系,明确所要检索的文献内容、性质等,根据检索课题的要点抽出能准确反映课题核心内容的主题概念,明确主要概念与次要概念,确定逻辑组配关系。

(2)确定检索年限:根据研究课题的背景信息(如起始年代)和研究的高峰期等来确定。

(3)确定语种:语种的范围选择主要依据课题的检索区域范围要求。

(4)确定文献类型:在主题分析的基础上,根据检索目的和要求,明确课题的检索深度。

2.确定检索策略

就是确定检索途径与检索用词,并明确各主题词之间的逻辑关系与查找步骤。

(1)选择检索工具:选择恰当的检索工具,要根据检索题目的内容、性质来确定。主要应从以下几个方面来考虑:

①从内容上考虑检索工具报道文献的学科专业范围。

②选择检索工具时,应以专业性检索工具为主,综合型检索工具进行配合、补充。

③在技术和手段上,由于计算机检索系统适应多点检索、多属性检索,检索精度高,应首选机检工具,而且应选择合适的数据库。

④为了避免检索工具在编辑出版过程中的滞后性,必要时应补充查找若干主要相关期刊的现刊,以防漏检。

(2)确定检索途径:检索工具确定后,需要确定检索途径。一般的检索工具都根据文献的内容特征和外部特征提供多种检索途径。

(3)优选检索方法:优选检索方法的目的在于寻求一种快速、准确、全面地获得文献信息的检索效果。

(4)制定、调整检索策略:检索工具、检索途径、检索方法确定后,需要制定一种可执行的方案。计算机检索由于检索提问与文献标识之间的匹配是由计算机完成的,必须事先拟订周密的检索策略,即检索式。

检索式是检索策略的表述,它能将各检索单元之间的逻辑关系、位置关系等用检索系统规定的组配符连接起来,成为计算机可以识别和执行的命令形式,实施有效检索。

3.查找文献线索

在明确检索要求,确定检索系统,选定检索方法后,就可以应用检索工具实施检索,所获得的检索结果为文献线索。对文献线索的整理、分析、识别是检索过程中极其重要的一个环节,需要做好以下几个方面。

(1)做好检索记录:做好检索记录的目的在于必要时进行有效核对。包括记录好使用检索工具的名称、年、卷、期、文献号(索引号);文献题名(书名)、作者姓名及其工作单位、文献出处等。,

(2)文献信息类型的识别:在检索工具中,文摘、题录所著录的文献来源(文献出处)是索取原始文献的关键部分。

4.索取原始文献信息

文献信息检索的最终目的是获取原始文献。当检索到文献线索并识别文献类型以后,即可根据不同的文献类型和语种索取原始文献信息。

(1)先电子后印刷。数字化出版物一般更新快,出版快,查询输出非常方便。

(2)先近后远。可以先查所在图书馆的收藏,如果没有,可利用联合目录数据库,查看附近的图书馆和其他信息机构是否收藏。

(3)向作者索取原始文献。根据文献线索所提供的作者姓名及其工作单位等可直接与作者联系,索取原始文献。

(4)利用馆藏目录、公共查询系统、联合目录获取原始文献。查找本馆信息的可利用馆藏目录。读者需要的文献若是本馆没有收藏的,就需要借助OPAC和联合目录实施馆际互借。

(5)利用网上全文数据库获取原始文献。目前许多全文数据库可以为用户提供直接检索。提供中文期刊全文的数据库如“维普中文科技期刊数据库”、“CNKI中国学术期刊网络出版总库 ”、“万方数据知识服务平台学术期刊库”等。

(6)利用网上全文传递服务获取原始文献。为了满足日益增长的文献需求,文献传递服务应运而生。国内目前可提供这种服务的数据库有:

CALLS联合目录数据库。

国家科技图书文献中心外文期刊目次库。

(7)利用网上出版社、杂志。网上有许多提供电子期刊的网站,如著名的Springer出版社就是其中一例。

(8)利用文摘数据库的原文服务。许多文摘数据库虽然不能直接得到原始文献,但是大多著名的文摘类的检索型数据库都可以提供所收藏的文献的全文链接,向数据商提出请求即可获得原始文献。


版权所有:bobapp官方下载 2016-2020 ICP备案 :吉ICP备13000357号-1
铁东地址:bobapp官方下载 四平市铁东区长发路1299号
邮编:136001 邮箱:ngxywz@126.com

/* 图书馆- 右侧浮动菜单 */
Baidu
map