如果要排除一个概念来缩小搜索范围,可以用什么运算符?
1.简述信息、知识和文献的概念以及它们之间的关系。
1.答:信息:是事物存在方式、运动状态及其特征的反映,是事物发出的信号和消息。
知识:是对自然界和人类社会中各种现象和规律的信息反映进行思维分析、加工提炼、系统化、理论化的结果。
文献:所有知识的载体都有记载。
从概念上来说,信息大于知识和文献,知识是信息的一部分,具有理论性和系统性,文献是记载在知识中的部分。
2.根据载体形式的不同分为哪些种类的文件,并举例说明。
2.答:根据载体形式的不同,文献可以分为:
手写文件,如甲骨文和金文。
印刷文献,如书籍和期刊。
减少微型文件,如缩微胶片、缩微胶卷
音像文献,如录像带、录音带和科技电影。
电子文献,如数据库文献和网络文献。
3.文学的层次及其关系。
3.答:文献按加工程度可分为零、一级、二级、三级四种。
其中,零时文献是指未发表的实验记录、原始录音(影像)、书信、手稿、口头交流信息或实物等。零阶文献经作者加工后公开发表,进入社会流通领域时,成为文献;根据一级文档的特点,按照一定的规则和方法进行排序、加工和浓缩,得到的文档为二级文档;利用二级文献线索,对大量一级文献内容进行综合、分析、加工、提炼而形成的文献,就是三级文献。
4.在计算机检索中,如何缩小检索范围?
4.答:在计算机检索中,缩小检索范围的方法有:
(1)添加由and连接的搜索词,或使用“二次搜索”
(2)用具体的子主题词来定义。
(3)用字段限制检索,如标题检索、主题检索、加权检索等。
(4)文献类型、语种、重要期刊、临床核心期刊、年份的有限检索。
(5)进入更具体的类别进行单词检索。
5.获取文献全文的方法有哪些?
5.答:获取全文的方法包括:
(1)在Internet上搜索全文数据库
(2)使用在线出版社和杂志
(3)利用图书馆馆藏目录(联合馆藏目录)
(4)使用“在线全文传递服务”
(5)向作者索要
6.常见的检索方式有哪些?
6.答:常用的检索方法包括:
自由词检索、主题词检索、分类检索、作者检索、机构检索、引文检索、限定检索等。
7.简述信息检索的原理。
7.答:信息检索的原理是:将描述特定用户所需信息的提问特征与信息中存储的检索标记进行比较,找出与提问特征一致或基本一致的信息。本质是将用户的信息需求与信息集中存储的信息进行比较和选择的过程,即匹配。
8.计算机检索通常包括哪些步骤?
8.答:信息检索的步骤包括:
(1)分析检索主题,明确目的和要求。
(2)选择合适的检索工具。
(3)选择检索途径,确定检索标识。
(4)寻找文献线索。
(5)浏览搜索结果,获取原始文档。
9.简述IM主题索引的排列规则。
9.答:主题索引的排列规则如下
(1)全索引按主题词排列。
(2)同一主题词下,次主题词按顺序排列。
(3)相关内容的参考书目分别收录在相应的主题词或主题词/子主题词下;一般文件直接在主题词下,具体文件在相应的子主题词下;同一文档的标题可以放在多个主题词下。
(4)同一主题或子主题下的文献目录,先排列英文文献,再排列非英文文献。非英语文档的英语翻译标题用“[]”括起来以示区别。
(5)英文文献按其缩写排列。
(6)非英文文献应按语种缩写编排,并按同一语种期刊名称缩写编排。
10.医学叙词表(MeSH)的字母顺序表有哪几种参考系?举例说明其意义。
10.答:第一组:替代参照,用来处理词与词之间的对等关系。在网状叙词表中,只有一个比较科学和常用的同义词作为规范主题词,其他词作为非主题词(即条目词)。表现为“项词见主题词”和“主题词x项词”。例如:癌症参见肿瘤肿瘤x癌症
第二组:从属指称,用于处理词与词之间的层级关系,即整体与部分的关系,以及上层概念与下层概念的关系。比如在一些类别较大的关键词下收录一些类别较小的关键词,内容范围较宽的词为关键词,而其下内容范围较窄的词不作为关键词,只作为二级关键词。它以“次主题词见主题词下”和“主题词许次主题词”为代表。比如健康优先参见卫生规划健康规划下徐健康优先从1991开始取消这种引用关系,所有次要主题词都升级为主题词。
第三组:相关引用,用于处理词与词之间的相关性,从而扩大检索,提高召回率。用“关键字见相关关键字”和“关键字XR关键字”来表示。如:人口控制参见相关计划生育计划生育xr人口控制
为了提高召回率,方便检索,在1991和1992中,网状叙词表先后增加了“也考虑”和“主题词/分主题短语带参考”。
11.根据存储内容的不同,数据库通常分为哪些类型?
11.答:书目数据库、事实数据库、数值数据库、全文数据库、图片数据库。
12.什么是主题词扩展检索,它的优势是什么?
12.答:选择主题词的扩展功能,可以同时检索主题词及其所有从属词,这样就可以检测到所有由所选主题词和更具体主题词索引的文档,可以更好地提高检索召回率。如果不进行扩展,将只检测由所选主题词索引的文档,而不会检测其从属词,即由主题词索引的那些文档。
13.什么是查全率和查准率,它们之间有什么关系?
13.答:召回率是指系统检测到的相关文档量与系统文档库中相关文档总量的比值,反映了系统文档库中相关文档的实际量被检索到了什么程度。
召回率=检测到的相关文档量/文档库中相关文档总量×100%。
查准率是指在某次检索中,系统检测到的相关文档的数量与检测到的文档总量的比值,反映了每次从系统的文献库中实际检测到的所有文档中有多少是相关的。
准确率=检测到的相关文档数量/检测到的文档总量×100%。
召回率和精确度是相互的。要完全搜索,就要逐步放宽检索的范围和限制,结果会带入很多不相关的文档,影响查准率。试图同时提高查全率和查准率并不容易。一方面强调,一方面忽视,也是不合适的。查全率和查准率要根据具体主题的要求合理调整,保证检索效果。
14.影响查全率和查准率的因素有哪些?
答:(1)影响召回率的因素。
影响召回率的因素有:文档库中包含的文档不完整;索引词汇缺乏控制性和特异性;词汇结构不完整;词与词之间的关系模糊或不正确;索引未知;索引不一致;标引人员遗漏了原文中的重要概念和不当词语。此外,从信息检索的角度来看,主要有:检索策略过于简单;选词不当,逻辑组合不当;检索途径和方法太少;检索人员对业务不熟悉,缺乏耐心;检索系统不具备分词和反馈功能,无法全面描述检索需求。
(2)影响准确率的因素
影响查准率的主要因素有:索引词不能准确描述文献主题和检索要求;组装规则不严格;词语的选择和词语之间的关系不正确;索引过于详细;装配错误;检索中使用的检索词特异性不够,检索范围宽于检索要求;检索系统不具备逻辑否定功能和反馈功能;搜索公式中允许的字数是有限的;截止位置不当,检索公式中逻辑“或”的使用不当等。
15.独立搜索引擎的工作原理是什么?
15.答:独立搜索引擎的工作原理是:
定期运行搜索软件(或手动)收集网络信息。
使用索引软件自动索引并建立数据库。
以网页的形式为用户提供相关的信息资源导航、目录索引和检索界面,用户将输入检索类型。
通过搜索软件进行搜索匹配,根据相关性对输出进行排序。
16.如何提高检索的查全率?
16.答:提高召回率的方法:
(1)降低搜索词的特异性,选择一些上位词和相关词加入到搜索公式中。
(2)调整搜索度,减少逻辑与的组合。
(3)进行民族检索,可以使用分类检索,或者使用一组同义词、近义词、关联词,在检索公式中用“或”连接。
(4)利用分词技术取消一些限制性符号。
17.如何提高检索精度?
17.a:提高精度的方法:
(1)提高搜索词的特异性,用特异性强的标准词或自由词代替。
(2)增加“和”,进一步明确主题概念。
(3)定义搜索词所在的可检测域,使用位置运算符控制搜索词的词与词之间的顺序和位置。
(4)限制导出文档的外部特征,如限定年份、语言、文档类型等。
(5)使用逻辑否定来限制与问题无关的文档的输出。
(6)用主题词搜索,不用或少用自由词。
18.根据我国专利法,专利有哪些类型,各类专利的有效期是多久?
18.答:根据专利法,保护对象有三类:发明专利、实用新型专利和外观设计专利。
发明专利是专利法的主要保护对象。发明专利权的有效期因国家而异,在中国是自申请日起20年。
实用新型专利在中国的有效期为自申请日起10年。
中国的外观设计专利有效期为自申请日起10年。
19.信息检索系统的基本要素是什么?
19.答:信息检索系统包括:
(1)检索文献,即文献检索标记的有机集合。
(2)技术设备,即能够存储信息及其标识并实现存储和检索操作的各种技术设备。
(3)作用于系统的人,如文档处理者、使用者、系统维护者和管理者。
(4)检索工具如检索语言、文献标引规则、输入输出标准等。
20.什么是内联文档,什么是数据库的内联文档?
20.答:顺序文件是以文档记录为信息存储单位,按照文档记录的存取号降序排列的目录文件。因为它存储了关于每个文档的最完整的信息,所以它通常被称为主文件,相当于印刷检索工具的文本部分。逆向文档是从记录中提取所有可检测的字段或属性值,并按一定顺序重新组织后得到的文档。倒档是从主文件中派生出来的,所以也叫辅助文件。
21.获取网络信息资源的主要工具有哪些?
21.答:获取网络信息资源的主要工具包括:
(1)电子邮件
(2)文件传输协议
(3)阿奇
(4)远程登录
(5)地鼠
(6)新闻组
(7)万维网浏览器
(8)搜索引擎
22.核心期刊的主要特点是什么?
22.少数在某一学科发表大量高质量专业论文的期刊称为核心期刊,其主要特点是:
(1)出版高密度、高信息量的专业文献;
(2)水平高,代表本学科最新发展水平;
(3)出版物相对稳定,出版的文献寿命长;
(4)利用率和被引率高。
23.试描述互联网搜索引擎的概念和类型。
23.答:搜索引擎是互联网上具有查询功能的网页的总称,即允许用户提交查询,检索与查询相关的网页结果列表,并进行排序。
按检索内容分为:综合搜索引擎和专业搜索引擎;
按检索功能分类:目录搜索引擎、全文搜索引擎、智能搜索引擎;
按搜索范围分为独立搜索引擎和元搜索引擎。
24.简述会议论文的概念和特点,国内外有哪些会议论文检索系统?
24.会议文件是指在各种科技会议上发表的论文、报告、讲话等与会议有关的文件。
会议文献的主要特点是:信息传播及时、主题集中、内容新颖、专业性强、质量高、数量大、出版类型多样,往往代表某一学科或专业领域的最新学术研究成果,基本反映该学科或专业的学术水平、研究动态和发展趋势。会议文献是科技查新的重要信息源之一。
国外会议论文检索工具包括:ISI的proceedings(ISTP+is shp);papers First(OCLC第一搜索的子库);IEEE/IEEE电子图书馆;AIP要约程序
国内可以检索会议论文的系统有:中国学术会议论文全文数据库(万芳数据);中国重要会议论文全文数据库(CNKI)
25.当周红搜索一个主题时,第一次搜索的结果是172个文档。有哪些缩小搜索范围的方法建议?
25.答:缩小搜索范围的方法包括:
(1)提高搜索词的特异性,用特异性强的标准词或自由词代替。
(2)增加“和”,进一步明确主题概念。
(3)限定搜索词所在的可检测领域。
(4)使用位置运算符控制单词之间的顺序和位置。
(5)限制导出文件的外部特征,例如限制年份、语言和文件类型。
(6)使用逻辑否定限制输出与问题无关的文档。
(7)用主题词搜索,不用或少用自由词。
26.26有什么区别。Medline和Pubmed?
26.答:Pubmed和MEDLINE的区别主要体现在:
(1)文献收集范围:Pubmed不仅包括MEDLINE数据库,还包括PREMEDLINE数据库和出版商直接提供给Pubmed的数据。
(2)数据库的更新时间:MEDLINE在线数据库每周更新,MEDLINE光盘的报告时差为1-3个月,Pubmed每日更新。
(3)检索机制:MEDLINE只有两个主题和作者,掌握Mesh表是检索的首要条件,而Pubmed具有词汇自动转换匹配和主题词自动扩展功能。
(4)链接功能:Pubmed具有与原文、相关文献、相关书籍、相关分子生物学数据库的链接功能。
(5)免费全文:Pubmed为60多种期刊提供免费全文浏览和检索功能。
(6)费用:MEDLINE CD需要每年租用数据库,Pubmed免费。
27.专利文献的概念和特点是什么?
27.答:专利文献是实施专利制度的国家和国际组织在专利审批过程中产生的正式文件和出版物的总称。专利文献具有以下特征:
(1)专利文献集技术、法律、经济信息于一体,是一个庞大的战略信息资源,内容广泛。
(2)促进最新技术信息的传播;
(3)专利文件格式规范且高度标准化,有统一的分类体系,便于检索和阅读;
(4)专利文件中对发明创造的公开完整、详细,技术内容相对可靠。
28.想查找关于“乙肝流行病学”的中外文献,可以选择哪些数据库?请选择一个数据库并简要检索策略。
28.答:可用于检索“乙型肝炎流行病学”文献的中文检索系统有:中国知网、维普、万方、CBM等。
可选的外文检索系统包括MEDLINE、Pubmed、EDSCO、springerlink、Open Access等。其中,CNKI中的检索策略是:
搜索词:文章名称;关键词:乙肝;逻辑:或
搜索词:文章名称;关键词:乙肝;逻辑:和
搜索词:主题;关键词:流行病学
CBM中的检索策略有:肝炎,B/[扩展整树]流行病学。
29.用什么检索系统可以查到济宁医学院图书馆有没有《计算机通讯》期刊?
29.答:可用的检索系统包括:图书馆在线检索系统、超星数字图书和学者数字图书馆。
30.请列出五种先进的谷歌搜索语法,并举例说明它们的用法。
你可以从下面的语法中选择五个例子。
(1)“链接”运算符:查找链接到特定页面的所有页面,在高级检索模式下也可以实现。
(2)“相关”运算符:自动查找与某个网页同级的相似网页,也可以通过高级搜索模式和搜索结果界面中的“相似网页”来实现。
(3)“info”操作符:可以在Google的库存中获取一个网页的所有信息。
(4)“站点”操作符:将搜索结果限制在某个域内,也可以使用高级搜索界面中的“域”选项。
(5)“All Intitle”操作符:要求所有的提问词都出现在网页的标题中。
(6)“Allinurl”操作符:要求所有问题都出现在url中。
(7)“inurl”运算符:要求疑问词出现在url中。
(8)“文件类型:”操作符是Google开发的一个非常强大和实用的搜索语法。其次是文档类型,可以限制访问某个文档类型的网页,然后可以以文档类型为例。
31.在CBMWin4.0版中有多少种方法可以找到某个作者发表的文献?有什么区别?
31.答:有四种。
“基本检索”中有三种作者检索方式:
首先在“检索条目”下拉色丹中选择“作者”字段,然后在检索问题框中输入作者姓名;
第二,直接在查询框输入作者姓名,然后加上“in au”;
第三,直接在搜索问题框输入“au=”,后面是作者姓名。
“作者搜索”模式:在搜索问题框中直接输入作者姓名。
32.循证医学中的证据主要有哪些类型?
32.根据质量和可靠性,大致可以分为以下五个等级(可靠性相应降低):
水平1:收集所有可靠的随机对照试验后,根据meta对具体疾病的具体治疗进行系统评价或Meta分析;
ⅱ级:有足够单样本量的随机对照试验结果;
水平3:有对照组但无随机分组的研究;
4级:无控制的连续病例观察;
第5级:基于生理学、病理生理学和基础研究的专家意见或证据。
33.列出六种可以检索引文的数据库。
33.答:可以检索引文的数据库如下(以下六个都可以写)。
(1) SCI
(2) SSCI
(3) H&ACI
(4)中国科学论文和引文数据库(CSTPC)。
(5)中国科学引文数据库
(6)《中国社会科学引文索引》
(7)中国科技期刊引文数据库
(8)中国知识基础工程中文引文数据库
(9)中国生物医学文献数据库
34.信息检索的类型和特点。
34.回答(1)个人信息来源:大量从事某一领域工作的个人信息和各种事物发展的信息汇集在一起。
(2)组织信息源:主要指组织内的内部信息源。
(3)实物信息源:以文物、产品样品、模型、雕塑等实物形式表现的信息资源。
(4)文献信息源:以文字、图片、符号等各种方式记录在各种载体上的知识和信息资源。
1)图书:图书也称书籍,是指内容比较成熟、资料比较系统、装帧形式比较完整的出版物。
2)期刊:期刊又称杂志,是指那些定期或不定期出版,汇集众多作者作品的连续出版物。
3)学位论文:是本科和研究生为取得学位资格而撰写的专业研究论文。
4)科技报告:是作为科研成果的正式报告。
5)专利文件:由专门的政府机构公布的法律文件,详细描述发明的设计和制造过程,表明发明的所有者在一定时期内有权制造、使用和销售。
6)标准文件:由权威机构批准发布的、可供人们执行的技术规范的规范性文件。
7)产品样本:制造商为介绍和推广其产品而发出的文件。
8)会议文件:指在国际、国内专业学术会议上发表的论文和报告。
9)政府出版物:由政府机构制作并由指定出版机构出版的文件。
(5)电子信息源:主要指利用电子技术可以存储和传播的信息。
35.数据库的组成。
答:数据库由文档、记录和字段组成。
(1)文档:是按照一定结构组织起来的相关记录和组合。
(2)记录:是构成文档的基本数据单位。
(3)字段:是比记录更小的单位,是构成记录的基本单位。
36.分类语言。
36.答:分类语言是根据文献的主题属性给出相应的分类号,用分类号表达文献的主题概念,并按照分类表中的顺序排列成分类索引,为检索文献提供一种分类方式。
分类语言利用逻辑分类的原理,按照文档内容的主题和专业来浓缩文档,从知识分类的角度揭示各种文档在内容上的差异和联系。
分类语言很好的体现了学科和专业的系统性。
分类语言可分为系统分类语言和汇编语言。目前国内普遍采用的是前者。
36.主题语言。
37.答:主题语言是一种用高度概括的文字说明文献主题,并以此为符号组织检索系统的语言。
话题语言分为标题词、元词、关键词和描述词。
(1)标题词:从自然语言中选取的、经过标准化处理的表达事物概念的词、短语或词组。
(2)元词(Meta-words)是指能够用来描述文献中提到的主题的最小的、最基本的词。
(3)叙述性文字:使用能表达文件主题且严格规范的文字。
(4)关键词:直接从文档的标题、文档或全文中提取能够表达文档主题的、未经规范的、具有实质意义的自然词语和短语。
38.信息检索渠道。
38.答案:1。分类文献:是根据文献内容所属的学科类别对文献进行检索的方式,通过分类号或类别进行检索。
2.主题法:是通过反映文学内容主题的文字来检索文学的一种方法。
3.关键词法:指自由标引不规范的词,直接取自能表达文档主题,在原文中起关键作用的词。
4.作者方式:指根据作者、编辑、译者姓名或机构、团体名称,按字母顺序检索文献的方式。
5.书名方式:指按书名、期刊名或文章名的顺序进行检索的一种方式。
6.编号法:是按文件编码和序号排列的一种“编号索引”方式。
39.信息检索素养的内涵。
39.答:1。信息意识:指信息在人脑中的反应,即人们对各种信息的有意识的心理反应,反映了人们在信息活动中对信息的认识、态度、价值取向和某种需求。
2.信息知识:指与信息有关的理论、知识和方法。
3.信息能力:指有效利用信息技术和信息资源获取信息、处理信息以及创造和交流新信息的能力。
4.信息伦理:指在信息获取、使用、创造和传播过程中应当遵守的一定的伦理规范。
40.信息检索策略。
40.答案:1。分析检索主题,明确目的需求。
信息检索总是根据某个主题的需要进行的,每个检索主题都有明确的目的和具体的要求。因此,在检索之前,首先要对检索主题进行认真细致的分析研究,明确检索的目的和要求。由于目的和要求不同,链具和链法的选择也不同。
2.检索系统和数据库的选择。
信息检索和数据库的选择主要考虑主题范围、保存期限、更新周期、标引质量、唯一性、所需成本、系统性能和辅助服务,同时也注重综合性和专业性数据库的配合。
3.选择检索方式并确定检索标志。
所谓检索途径,也就是数据库中的检索项(字段),指从哪个角度或方向开始检索。
检索标识是指用于准确表达文献信息内容和外观特征的符号或文字,如分类号、主题词、关键词、作者姓名、期刊名称等。,要求在检索时准确找出检索标识,避免误检。
4.编辑检索表达式,调整检索策略。
检索表达式是用于表达检索问题的逻辑检索表达式,根据检索要求将选定的检索标记与不同的操作符号组合起来,以达到理想的检索结果。
但是在实际的检索过程中,建立的检索表达式检测到的结果往往一次都不尽如人意,需要根据检索情况的分析及时调整检索策略。
5.获取原文。
(1)搜索在线全文数据库。
(2)利用网络出版社和杂志。
(3)利用图书馆馆藏目录(联合馆藏目录)。
(4)使用“在线全文传递服务”。
(5)直接问作者。
如果不是通过上述步骤搜索得到的文档全文,可以通过以下方式获得。