检索简介

信息:信息是物质的方式、形态或运动状态,是事物的普遍属性。一般指数据和消息中包含的意义,可以降低消息中描述的事件的不确定性。

知识:人们在改造世界的实践中所获得的知识和经验的总和,是人的大脑通过思维重新组合的系统的信息集合。

智力:为解决某一特定问题而激活和激活的特殊知识或信息。

(智力的基本属性:知识、传递和效用)

文献:所有知识的载体都有记载。(GB3792.1-83文件描述的一般规则)

文学的四个基本要素:

(1)记录知识的具体内容;

2记录知识的手段,如文字、图像、符号、音频、视频等。;

③记录知识的物质载体,如纸张、光盘、录像带等。

(4)记录知识的表现形式,如书籍、期刊、专利说明书等。

一.文件类型(按载体类型):

印刷类型:传统书籍、期刊等。

音像类:唱片、录音带、录像带等。

小型化:微缩胶片、微缩胶卷等。

数字(或电子):电子书、电子期刊、数据库等。

*零文档:未经信息加工直接记录在载体上的原始信息,如实验数据、实验记录、调查材料、设计草图、个人笔记、口头交流信息等。

原生文献:原生文献是指作者根据自己的研究成果(如实验、观察、调查等的结果)所写的原创。).

例如:专著、期刊论文、研究报告、会议文件、专利文献、学位论文、会议论文、翻译、电子期刊、电子书等。

二次文献:将大量无序、分散的一次文献收集、整理、加工、记录,按一定顺序排列,形成一种新的文献形式,可以用来检索一次文献的线索。因其具有检索功能,被称为检索工具或检索系统。

例如:标题、目录、索引、摘要等。

标题:以期刊论文为例,下划线部分为文献来源。

标题/作者//期刊名称。年份,卷(期)。–页码

三篇文献:围绕某一主题,利用对第二篇文献的检索,在吸收第一篇文献内容的基础上形成的文献。如《复习》、《复习与进步》,以及百科全书、年鉴、指南、手册等参考书。

综述(Survey,Review)是指对某一学科或专业在一定时间范围内的科学研究的发展和现状进行综合分析和描述,并对未来进行预测的一类文献。

检索的概念:

检索:使用检索工具查询问题答案的全过程。

文献检索:指以获取文献为目的,借助各种检索工具,搜索相关文献资料的过程。

信息检索:指从任意信息集中找出所需信息的活动、过程和方法,有广义和狭义之分。广义的信息检索还包括信息存储,统称为信息存储和检索。狭义的信息检索仅指信息搜索过程。

检索语言是在信息存储和检索过程中描述信息特征和表达用户信息问题的人工语言。

它根据文献的外观或内容特征,将一些具有检索意义的语言或符号加工编译成特定的语言,为文献信息检索服务。

检索语言的主要功能是多层次地描述文档的外观特征和内容特征,提供多种检索方式,方便用户从不同角度进行检索。

分类语言:

中国图书馆分类法(中国图书馆分类法)

国际十进分类法

美国国会图书馆分类法

《中国图书馆分类法》的基本类目:

一、马列主义、毛泽东思想。

哲学

社会科学概论

政治、法律

e军事

f京基

g .文化、科学、教育、体育

h语言和文学

一.文学

j艺术

历史、地理

自然科学概论

数学科学和化学

p天文学、地球科学

q生物科学

医药与健康

美国农业科学

工业技术

u运输

五.航空和航天

x环境科学、劳动保护科学(安全科学)

z综合图书

关键词:在文献的标题、摘要或全文中指出能表达文献实质性内容或可作为检索入口的关键技术术语。它是一种没有标准化的自然语言,也称为自由词。

关键词:是反映文学内容主题,经过严格规范的人工语言。即在统一了反映文献主题的各种同义词的书写形式后,确定检索语言。

数据库及其结构:

数据库是可以满足特定目的或特定数据处理系统需求的数据集合。它可以由一个或多个文档组成。

文件是数据库中一些记录的集合。

记录是数据库中基本的文档单位,一条记录往往记录了一个文档的相关信息。

字段是构成记录的基本信息单元。每个字段描述文档的某个特征,包括外观特征和内容特征,如标题、作者、出版物名称、出版年份、主题词等。描述文献的一部分特征的字段的组合成为一个记录。

布尔逻辑检索是检索系统中应用最广泛的检索技术,是最简单、最基本的匹配方式。其理论基础是集合论和布尔逻辑。

布尔逻辑检索使用布尔逻辑表达式来表达用户的检索需求。布尔逻辑表达式是指检索需求的一种表达式,由连接检索词的布尔逻辑运算符和表示操作优先级的括号组成。

例子:(肺癌或肺部肿瘤)和手术

位置检索(也称邻近检索,proximity retrieval):位置运算符(也称邻近运算符)用于指定原文档中搜索词之间的相邻位置关系。

位置运算符都隐含逻辑运算符AND的含义,即它们所链接的两个搜索词(表达式)必须出现,但位置运算符进一步限制了两个链接搜索词之间的位置关系。

位置检索通常包括三个级别的检索:

字段级检索:将搜索词限定在同一个字段,如用(Medline CD数据库);

子领域或自然句级检索:将搜索词限定在同一子领域或自然句,如near(Medline CD数据库);

词的位置检索:搜索词的相互位置限定在满足一定条件,如相互间隔多少个词(或词),是否按一定顺序出现,一个词的出现是否不允许另一个词(或词)同时出现等等,如nW和pre(ScienceDirect)。

截取检索是在检索时给检索词附加一个截断符号,表示检索词与文献数据库中的词进行比较时是完全匹配还是部分匹配。

词拦截器分为无限截断和有限截断。

无限截断:一个断字符代表多个字符,常用断字符“*”。有前截断、中截断和后截断。

有限截断:断字符只能表示一个字符,断字符“?”是常用的。(也称为通配符)。

指定领域检索是指为了达到某种检索目的,将检索范围限定在某个或某些领域的一种检索方法。

知识是人脑经过思维加工形成的信息有序集合,是信息产品,是信息的一部分;文学是人类知识的全部载体,是知识的一部分。信息是人们为解决具体问题而激活的知识,是知识的一部分。文档中也包含信息,但并不是所有的文档都是信息,所以信息、知识、文档、信息之间是有关系的。