数据库的类型
数据库是以一定方式合理组织并存储在计算机存储设备上的相互关联的数据的集合。它是计算机技术和信息检索技术相结合的产物,是电子信息资源的主体,是信息检索系统的核心部分之一。根据提供的信息,数据库主要可以分为参考数据库和源数据库。
1.参考数据库
一种主要存储一系列描述性信息内容并引导用户到另一信息源获取完整原始信息的数据库,主要包括书目数据库和指南数据库。
(1)书目数据库是存储目录、标题、摘要等书目线索的数据库。,又称二次文献信息数据库。如各种图书馆目录数据库、书目数据库、文摘数据库等都属于这一类,其作用是为用户指明获取原始信息的线索。
图书馆目录数据库又称机读目录,数据内容详实,不仅描述了书名、作者、出版项目等书目信息,还提供了馆藏信息供用户索取原始信息。标题和摘要数据库描述的数据内容与印刷的标题和摘要相似,提供了一定的信息源如论文信息或专利信息供用户检索。
(2)指南数据库存储描述关于机构、人、产品、活动等的对象的数据库。与其他数据库相比,指南数据库不仅为用户提供相关信息,还包括各种类型的实体,并且大多数使用名称进行检索。例如,存储有关生产和业务活动信息的机构目录数据库、存储有关人员信息的传记数据库、存储有关产品或商品信息的产品指南数据库和存储有关基金信息的基金数据库都属于这一类,其功能是引导用户从其他相关信息源获取更详细的信息。
2.源数据库
主要存储全文、数值、结构式等信息。,并且可以直接提供原始信息或特定数据,因此用户不需要参考其他信息源的数据库。主要包括全文数据库和数值数据库。
(1)全文数据库存储原始信息的全文或主要部分的源数据库。如期刊全文数据库、专利全文数据库、百科全文数据库等,用户可以直接检索到包含某个词或短语原文信息的全文。
(2)数值型数据库存储一个主要表示数值信息的源数据库,还有一个与之类似的文本-数值型数据库。与书目数据库相比,数字数据库是信息深度加工的产物,可以直接提供所需的数据信息。如各种统计数据库、科技数据库等。除了一般的检索功能外,数值数据库还具有精确的数据运算、数据分析、图形处理以及对检索到的数据进行整理和重组的功能。
数据库结构
1.书目数据库的结构
书目数据库是以文档形式组织的一系列数据,这些数据称为记录,一个记录包含几个字段。
(1)记录和字段记录是作为一个单元处理的相关数据的集合,是组成文档的基本数据单元。记录中包含的几个字段是构成记录的基本数据单元。在书目数据库中,一条记录相当于一个标题或摘要,所以一条记录通常由标题字段、作者字段、来源字段、摘要字段、主题字段、分类号字段、语种字段等组成。在某些字段中,有几个子字段,子字段是字段的较低数据单元。例如,“主题”字段包含多个主题词。根据字段所代表的记录的性质,字段通常分为两类:基本字段和辅助字段。常见字段名和代码见表4-1。
表4-1字段名称和代码
基本字段
辅助场
字段名
域代码
字段名
域代码
标题
全音阶的第七音
记录号
(同down)向下的
摘要
AB型血
作者
埃
描述符
特拉华州
作者单位
特许测量员
识别字
身份证明
日志名称
john 约翰
出版年份
巴拉圭
出版国
指挥官(commanding officer)
语言种类
大音阶第六音
(2)按一定结构组织起来的相关记录的集合。文献是书目数据库中数据组织的基本形式,文献组织方式与检索系统的软硬件功能密切相关。在书目数据库中,文献结构主要分为直列文献和逆向文献。
1)内联文档记录按顺序存储,记录之间的逻辑顺序与物理顺序一致,相当于打印工具中摘要的排列顺序,是线性文档。内联文档是数据库的主要部分,但对其主题词和其他特征的识别是无序的。直接搜索时,需要从头到尾搜索完整的记录,耗时较长,不实用。
2)逆向文档提取了具有主题性质的字段(如主题字段、标题字段、描述字段等。)和没有学科性质的字段(如作者字段、机构字段、来源字段等。)中的每一条记录,并按一定的顺序重新组织它们以获得一个文档。具有主题性质的倒档称为基本索引文件,没有主题性质的倒档称为辅助索引文件。
综上所述,前向移位和后向移位的主要区别在于,前向移位是以完整记录为处理和检索单位的主文档,后向移位是以记录中的字段为处理和检索单位的索引文档。电脑搜索时,先进入倒档查找相关信息的查阅号,再进入前进档根据查阅号查找记录。
2.全文数据库的结构
一般全文数据库的结构类似于书目数据库。全文数据库的一条记录是全文文本,该记录分为几个字段。它的主文档是以正向行的形式组织的文本文档,反向文档是与记录的可检测字段相对应的索引文档。
3.数值数据库的结构
数值数据库的结构应综合考虑数据库的内容和检索目的,即在内容上,数值数据库的主要内容是数值信息,但不排除必要的描述性文本信息。在检索上,既便于单项检索,又便于综合检索,还能对检索到的数据进行精确的数据运算、数据分析、图形处理和排序重组。数字数据库的数据结构可以是单元或列表的形式。前者是原始数据的模拟,后者是统计表格的机读模拟。一个数字数据库通常有各种各样的文档,如内嵌文件、内联文件、索引文件等。前移由数值数据组成,是主文档和对应的索引文档。为了方便访问,索引文件是以基本的直接访问结构的形式组织的。倒挡也有相应的索引文档,是分层组织的。数值数据库的文档结构使得所有的文档都可供检索,所有的数据都可供计算,这就构成了数值数据库的特点。
4.指南数据库的结构
指南数据库的结构具有书目数据库、全文数据库和数字数据库的特点,包括正向文件、反向文件、索引文件和数据字典。一般来说,对于学科领域多、内容全面的大型指南数据库,主文档可以采用多个子文档的结构,而对于单一学科领域和专门内容,则宜采用单一主文档和可变长度多字段的记录格式。