Скачать презентацию 第一章 文献信息基础 第一节 信息及信息类型 一 信息 知识 文献 信息 Скачать презентацию 第一章 文献信息基础 第一节 信息及信息类型 一 信息 知识 文献 信息

790492f239497ba66c3bd006c1dcc0e7.ppt

  • Количество слайдов: 45

第一章 文献信息基础 第一章 文献信息基础

第一节 信息及信息类型 一、信息、知识、文献 § 信息 信息是用文字、数据或信号等形式通过一定的传 递和处理来表现各种相互联系客观事物在运动变化中 所具有特征内容的总称。 信息的基本属性: Ø普遍性和客观性。 Ø传递性。 Ø依附性和转换性。 Ø共享性。 第一节 信息及信息类型 一、信息、知识、文献 § 信息 信息是用文字、数据或信号等形式通过一定的传 递和处理来表现各种相互联系客观事物在运动变化中 所具有特征内容的总称。 信息的基本属性: Ø普遍性和客观性。 Ø传递性。 Ø依附性和转换性。 Ø共享性。

§ 知识: 知识是人类在认识和改造世界的社会实践中获得 的对事物本质认识的成果和结晶。 § 文献: 文献是记录有知识的一切载体。 § 信息、知识、文献三者关系 信息是生产知识的原料。 知识是被人类系统化后的信息。 文献是存储、传递知识信息的载体。 § 知识: 知识是人类在认识和改造世界的社会实践中获得 的对事物本质认识的成果和结晶。 § 文献: 文献是记录有知识的一切载体。 § 信息、知识、文献三者关系 信息是生产知识的原料。 知识是被人类系统化后的信息。 文献是存储、传递知识信息的载体。

二、信息的类型 § 按信息的加 深度划分 信息 类型 定义 例子 零次 信息 记录在非正规物理载体上未经 书信、论文手稿、笔记、实验记录、 任何加 处理的源信息。 二、信息的类型 § 按信息的加 深度划分 信息 类型 定义 例子 零次 信息 记录在非正规物理载体上未经 书信、论文手稿、笔记、实验记录、 任何加 处理的源信息。 会议记录 、口头交流的信息、电子 论坛、各种单位在网上发布的信息 一次 信息 直接将理论、设计、试验、生 期刊论文、研究报告、会议论文、 产、研究等成果记录在正规物 专利说明书、学位论文、技术标准 等 理载体上的信息。 二次 信息 通过科学的方法,将分散无序 题录、书目、文摘、索引等 的一次信息进行加 、整理, 使之成为系统有序的信息。 三次 信息 对零次、一次、二次信息进行 三次信息的载体形式称为三次文献, 综合分析而编写出来的成果。 如综述,参考 具书等

§ 按信息的载体形式划分 信息 类型 定义 特点 纸介 以传统的纸张形式存 使用方便、易于阅读、但需要占 质文 在的信息。 用大量空间,不便于整理和保存。 献 通过编码和程序设计 § 按信息的载体形式划分 信息 类型 定义 特点 纸介 以传统的纸张形式存 使用方便、易于阅读、但需要占 质文 在的信息。 用大量空间,不便于整理和保存。 献 通过编码和程序设计 方法,将信息转换成 电子 机读语言,存储到软 文献 盘、硬盘、光盘或网 络中,需要时由计算 机将其读出。 信息存取多媒体化、信息组织有 序化、操作电脑化、传输远程网 络化、资源共享化、原记录更改、 删除、更新方便快捷

§ 按信息的出版类型划分 Ø Ø Ø 图书 期刊 会议文献 科技报告 专利文献 学位论文 技术标准 政府出版物 产品样本和说明书 § 按信息的出版类型划分 Ø Ø Ø 图书 期刊 会议文献 科技报告 专利文献 学位论文 技术标准 政府出版物 产品样本和说明书 技术档案 报纸 预印本

1. 图书 图书一般分为两大类: Ø 阅览类图书(reading book):包括教科书(textbook), 专著(monograph)和论文集(anthology)。 Ø 参考类图书(reference book):包括辞典(dictionary)、 手册(handbook)和百科全书(encyclopedia)、年鉴( year book)等。 图书的内容较成熟、全面、系统、可靠。是通过对大量一 1. 图书 图书一般分为两大类: Ø 阅览类图书(reading book):包括教科书(textbook), 专著(monograph)和论文集(anthology)。 Ø 参考类图书(reference book):包括辞典(dictionary)、 手册(handbook)和百科全书(encyclopedia)、年鉴( year book)等。 图书的内容较成熟、全面、系统、可靠。是通过对大量一 次文献的综合提炼形成的三次文献。 n :图书资料的检索途径 Ø 各种图书馆的书目检索系统:如 上图、国图,中国高校联 合书目数据库(CALIS联机公共数据库)等。 (www. calis. edu. cn) Ø 各种网上电子图书: 超星数字图书馆 书生数字图书馆 n

2. 期刊 n 期刊(journal, periodic)包括所有定期和不定期的连 续出版物(serials)。 n 特点是:数量大,品种多、内容丰富、出版周期短, 报道速度快,是科研人员获取最新信息的主要来源。 中文核心期刊 外文核心期刊可参照SCI收录期刊一览表 n n n 2. 期刊 n 期刊(journal, periodic)包括所有定期和不定期的连 续出版物(serials)。 n 特点是:数量大,品种多、内容丰富、出版周期短, 报道速度快,是科研人员获取最新信息的主要来源。 中文核心期刊 外文核心期刊可参照SCI收录期刊一览表 n n n n 期刊的检索途径主要有: 1. 中科院图书馆全国期刊联合目录 http: //159. 226. 100. 50/catalog/default. htm检索全国 300 余家图书情报机构收藏的8万余种期刊(中西日俄文联 合目录)。另有3000余种国外期刊目次网上检索及近百 种国外全文上网期刊。 2. 各大图书馆的联机书目检索系统。 3. 各种全文期刊数据库: CNKI、维普、EBSCO、ELSVIER。 4. 在线免费全文期刊。

3. 专利文献(patent document) n n Ø Ø Ø 专利 文献(Patent document)是一切与专利制度有关 的专利文件的统称,包括专利说明书、专利公报、专 利分类表、专利检索 具以及专利的法律性文件等。 3. 专利文献(patent document) n n Ø Ø Ø 专利 文献(Patent document)是一切与专利制度有关 的专利文件的统称,包括专利说明书、专利公报、专 利分类表、专利检索 具以及专利的法律性文件等。 专利文献的检索途径: 1. 各种大型数据库如DIALOG联机检索 2 各种专利光盘数据库(上图等) 3 各国家的专利局网站提供检索

4. 学位论文(thesis, dissertation) n n Ø Ø 著者为取得专业资格的学位而提出的论文, 介绍其发现、 调查或研究成果。常指硕博论文。 学位论文的检索途径: 1. 万方数据库:收录有约 81年以后的学位论文数据 4. 学位论文(thesis, dissertation) n n Ø Ø 著者为取得专业资格的学位而提出的论文, 介绍其发现、 调查或研究成果。常指硕博论文。 学位论文的检索途径: 1. 万方数据库:收录有约 81年以后的学位论文数据 。 2. 清华同方优秀博硕士论文 3. CALIS:http: //162. 105. 138. 230/收录有约 81年以后 的学位论文数据 。 4. 中国国家图书馆博士论文库

5. 会议文献(conference paper) n n Ø Ø 会议文献指各种学术、专题会议上发表的论文和报告。会 议文献有助于及时了解本学科的最新科技动态。分为会前 文献和会后文献两种。 会议文献的检索途径: 1. 上海图书馆国内专业会议资料数据库查询系统 2. 5. 会议文献(conference paper) n n Ø Ø 会议文献指各种学术、专题会议上发表的论文和报告。会 议文献有助于及时了解本学科的最新科技动态。分为会前 文献和会后文献两种。 会议文献的检索途径: 1. 上海图书馆国内专业会议资料数据库查询系统 2. 万方数据库(上海高校网络图书馆) 3. CALIS 联机公共书目查询系统 每年在国内大学召开的国 际会议论文查询 4. ISTP数据库:

6. 科技报告(technical report) n 科技报告是关于科研成果或进展的报告,最著名的美国的四大 报告。就是美国国家技术情报服务局出版的PB报告,由美国武 装部队技术情报局出版的AD报告,由美国国家航空航天局出版 的NASA报告和由美国能源部出版的DOE报告。 n 检索途径: 1. 联机检索 : 如DIALOG系统文档 6. 科技报告(technical report) n 科技报告是关于科研成果或进展的报告,最著名的美国的四大 报告。就是美国国家技术情报服务局出版的PB报告,由美国武 装部队技术情报局出版的AD报告,由美国国家航空航天局出版 的NASA报告和由美国能源部出版的DOE报告。 n 检索途径: 1. 联机检索 : 如DIALOG系统文档 6,NTIS;科学技术研究成果 公报。 2. 上海图书馆等大型图书情报机构。 Ø Ø

7. 标准(standard) n n n Ø Ø Ø 技术标准是对 农业产品和 程建设的质量、规格及 其检验方法等方面所作的技术规定。 分国际标准、国家标准、部颁标准和企业标准等。国 际标准主要有 7. 标准(standard) n n n Ø Ø Ø 技术标准是对 农业产品和 程建设的质量、规格及 其检验方法等方面所作的技术规定。 分国际标准、国家标准、部颁标准和企业标准等。国 际标准主要有 ISO(国际标准化组织)。国家标准有 中国标准(GB)、美国国家标准(ANSI)、德国国家 标准(DIN)等。部颁标准有HG等,行业标准HB。地方 标准(DB) 检索途径: 万方数据库:中外标准 中国标准咨询网http: //www. chinastandard. com. cn/ 注册用户使用,一般用户可查到是否有该标准,可显 示标准名称,但无法显示标准号等信息。 各地标准局

8. 政府出版物 n n Ø Ø (government document) 各国政府部门极其所属机构发表的文件,分行 政性文件和科技性文件两大类。 检索途径: 1. 国际组织与外国政府出版物文库(中国国家 图书馆) 8. 政府出版物 n n Ø Ø (government document) 各国政府部门极其所属机构发表的文件,分行 政性文件和科技性文件两大类。 检索途径: 1. 国际组织与外国政府出版物文库(中国国家 图书馆) 2. 各国政府部门的网站

9. 档案 技术档案(technical records)指在生产建 设和科技部门的技术活动中形成的, 对一 定 程对象的技术文件的总称。包括任务 书、协议书、技术经济指标、审批文件、 研究计划、方案、技术措施、设计数据、 艺图纸等等。 9. 档案 技术档案(technical records)指在生产建 设和科技部门的技术活动中形成的, 对一 定 程对象的技术文件的总称。包括任务 书、协议书、技术经济指标、审批文件、 研究计划、方案、技术措施、设计数据、 艺图纸等等。

10. 产品资料(product literature) 国内外各厂商为推销其产品而印发的商业 宣传品,包括产品样本、目录、说明书、 厂商介绍等。 n 检索途径: Ø 各厂家的网页; n Ø Ø 企业黄页、白页; 10. 产品资料(product literature) 国内外各厂商为推销其产品而印发的商业 宣传品,包括产品样本、目录、说明书、 厂商介绍等。 n 检索途径: Ø 各厂家的网页; n Ø Ø 企业黄页、白页; 万方数据库《中国企业与产品数据库》

三、信息类型的识别 § 图书的著录格式 图书的著录特点是:有书名,有著者,有的还有编者; 必有出版地、出版社名和出版年份;非第一版的图书有版 次;有的图书还给出国际标准书号(ISBN)。 例: W. V. Etten, Foundamentals of optical fiber 三、信息类型的识别 § 图书的著录格式 图书的著录特点是:有书名,有著者,有的还有编者; 必有出版地、出版社名和出版年份;非第一版的图书有版 次;有的图书还给出国际标准书号(ISBN)。 例: W. V. Etten, Foundamentals of optical fiber 著者 书名 communication[M],London:Prentice--Hall(1991), 出版地 出版社 出版年份 xii+407 pp 页码

§ 期刊论文的著录格式 期刊论文著录的特点是:有作者,有时有篇名;期刊名 称常常缩写,有的还以斜体给出;必定有卷号,有的有期号。 例: H. Tohyama,A plasma Image bar for an electrophoto— 作者 § 期刊论文的著录格式 期刊论文著录的特点是:有作者,有时有篇名;期刊名 称常常缩写,有的还以斜体给出;必定有卷号,有的有期号。 例: H. Tohyama,A plasma Image bar for an electrophoto— 作者 篇名 graphic printer[J],Journal of the Imaging Science, 期刊名 Vol. 35 NO. 5,330 -3 (Sept-Oct 1991) 卷号 期号 页码 出版日期

§ 会议论文的著录格式 会议文献著录的特点是:有表示会议的专门用词,如 Conference,Symposium,Convention,Meeting,Congress, Assembly等;有表示会议录的一些词,如Proceedings of. . . , Collection of. . . ;有的有会议召开的地点、届次、时间, § 会议论文的著录格式 会议文献著录的特点是:有表示会议的专门用词,如 Conference,Symposium,Convention,Meeting,Congress, Assembly等;有表示会议录的一些词,如Proceedings of. . . , Collection of. . . ;有的有会议召开的地点、届次、时间, 以及会议录的出版社、出版地、出版时间等。 例: T. Sellis: “Performance of DBMS implementation of production systems”,Proceedings of the 2 nd International IEEE Conference on. Tools for Artificial Intellegence Herndon, VA USA, 6 -9 Nov. 1990, ( Alamitors, CA, USA: IEEE Computer Society Press 1990),393 -9

§ 学位论文的著录格式 学位论文著录的特点是:通常有表示学位论文的词,如 Thesis,Dissertation等;有的有论文作者所在学校的校名。 例: T. W. Lin,“Design of time-signal spectrum analyzers”, Ph. D § 学位论文的著录格式 学位论文著录的特点是:通常有表示学位论文的词,如 Thesis,Dissertation等;有的有论文作者所在学校的校名。 例: T. W. Lin,“Design of time-signal spectrum analyzers”, Ph. D dissertation,The Pennsylvania State Univ. ,1987

§ 科技报告的著录格式 科技报 告著录 的特点是:有表示报 告的词 ,如Report, Memorandum等;有报 告号。 例: J. S. Bymes,“Application of § 科技报告的著录格式 科技报 告著录 的特点是:有表示报 告的词 ,如Report, Memorandum等;有报 告号。 例: J. S. Bymes,“Application of approximation theory in antenna design, signal processing and filtering”, Final report. AD-A 244, 725 Promethesus, Inc. , Sharon, MA. 1991

§ 专利说明书的著录格式 专 利说 明书 著录 的特点是:通常有表示专 利的词 ( Patent);有专 利号。专 利号按国际规 定由两个字母表示的 国家名称和其后的顺 § 专利说明书的著录格式 专 利说 明书 著录 的特点是:通常有表示专 利的词 ( Patent);有专 利号。专 利号按国际规 定由两个字母表示的 国家名称和其后的顺 序号构成。 例: B. D. Dayton,“Differential amplifier apparatus”,US Patent No. 5095282,1992

第二节 信息检索原理 一、信息检索的含义 § 信息检索含义: 信息检索是指将信息按一定方式组织和储存起来,并 针对信息用户的特定需求查找出所需信息内容的过程。 数据库:由计算机进行处理的一定数量同类信息的有序 集合,是用来存储和查找文献的信息的电子化检索 具。 第二节 信息检索原理 一、信息检索的含义 § 信息检索含义: 信息检索是指将信息按一定方式组织和储存起来,并 针对信息用户的特定需求查找出所需信息内容的过程。 数据库:由计算机进行处理的一定数量同类信息的有序 集合,是用来存储和查找文献的信息的电子化检索 具。

信息检索示意图: 信息检索示意图:

§ 信息检索的实质是信息用户的需求和一定的信息集合的比 较和选择的过程,即匹配的过程。 § 信息检索的类型 Ø文献检索(书目信息检索):即检索结果是关于某主题知识的文献线 索,它是通过二次文献,包括传统的以纸张为存储介质的现代计算机 检索系统,找出所需的一次文献或三次文献。 Ø数据检索:就是满足数据需求的检索过程,如数理化等科学数据,经 济数据,历史数据,地理数据等。 Ø事实检索:就是对特定的事件或事实的检索。事实内容包括大量的科 学事件和社会事件。例如:我国建成最早的高速公路是哪条?何时建 设? Ø概念检索:就是查找特定概念的含义、作用、原理或使用范围等解释 § 信息检索的实质是信息用户的需求和一定的信息集合的比 较和选择的过程,即匹配的过程。 § 信息检索的类型 Ø文献检索(书目信息检索):即检索结果是关于某主题知识的文献线 索,它是通过二次文献,包括传统的以纸张为存储介质的现代计算机 检索系统,找出所需的一次文献或三次文献。 Ø数据检索:就是满足数据需求的检索过程,如数理化等科学数据,经 济数据,历史数据,地理数据等。 Ø事实检索:就是对特定的事件或事实的检索。事实内容包括大量的科 学事件和社会事件。例如:我国建成最早的高速公路是哪条?何时建 设? Ø概念检索:就是查找特定概念的含义、作用、原理或使用范围等解释 性内容或说明。最常见的概念检索是查找各种参考 具书,例如字词 典、百科全书、名录、手册、指南等参考 具书。

信息检索类型图: 文献检索 信息 检索 检索性 具书 间接答案(文献线索) 参考性 具书 直接答案(数据、事实) 数据检索 事实检索 概念检索 信息检索类型图: 文献检索 信息 检索 检索性 具书 间接答案(文献线索) 参考性 具书 直接答案(数据、事实) 数据检索 事实检索 概念检索

二、信息检索的意义 § 信息与现代科技的发展 现代科技发展特点:高速化、综合化、专业化。 Ø 信息量急剧增长。 Ø 信息的使用寿命缩短。 § 信息检索意义 Ø 充分利用信息资源,避免重复劳动。 Ø 为人们更新知识、实现终身学习提供门径。 二、信息检索的意义 § 信息与现代科技的发展 现代科技发展特点:高速化、综合化、专业化。 Ø 信息量急剧增长。 Ø 信息的使用寿命缩短。 § 信息检索意义 Ø 充分利用信息资源,避免重复劳动。 Ø 为人们更新知识、实现终身学习提供门径。

三、信息检索语言 § 检索语言概念 Ø 检索的基本原理: 是将用户的检索提问词与数据库文献记录中的标引 词进行对比,当提问词与标引词匹配一致时,即为命中, 检索成功。 Ø 检 索语 言: 是为 沟通文献标 三、信息检索语言 § 检索语言概念 Ø 检索的基本原理: 是将用户的检索提问词与数据库文献记录中的标引 词进行对比,当提问词与标引词匹配一致时,即为命中, 检索成功。 Ø 检 索语 言: 是为 沟通文献标 引与文献检 索而编 制的人 语 言, 也是连 接信息存储 和检 索两个过 程中标 引人员 与检 索 人员 双方思路的渠道,是用于文献标 引和检 索提问 的 约 定语 言。

n 经典向量检索模型 Ø Ø 把索引中的每个词作为空间的一个维度 把每一篇文档作为空间中的一个向量 把每一个查询也作为空间中的一个向量 通过计算文档和查询的内积或余弦等来 表示文档和查询的相关程度 n 经典向量检索模型 Ø Ø 把索引中的每个词作为空间的一个维度 把每一篇文档作为空间中的一个向量 把每一个查询也作为空间中的一个向量 通过计算文档和查询的内积或余弦等来 表示文档和查询的相关程度

n Ø 概率模型 查询Q是标引词的个子集,R表示已知的相关 文献集(最初的猜想集),用R表示R的补集, 即不相关文献集,条件概率P (R /dj)表示 文献dj与查询q相关的概率,文献dj与查询q 相似度sim(dj, q)可以定义为两者的比值: n Ø 概率模型 查询Q是标引词的个子集,R表示已知的相关 文献集(最初的猜想集),用R表示R的补集, 即不相关文献集,条件概率P (R /dj)表示 文献dj与查询q相关的概率,文献dj与查询q 相似度sim(dj, q)可以定义为两者的比值:

检索语言的类型划分: 检索语言的类型划分:

§ 分类语言 是以学科体系为基础,用号码作为概念标识,按分类编排 的检索语言。 国内一般高校图书馆使用的分类语言表是《中国图书馆图书 分类法》(第四版),简称《中图法》,是我国图书馆和情报单 位普遍使用的一部综合性的分类法。 § 分类语言 是以学科体系为基础,用号码作为概念标识,按分类编排 的检索语言。 国内一般高校图书馆使用的分类语言表是《中国图书馆图书 分类法》(第四版),简称《中图法》,是我国图书馆和情报单 位普遍使用的一部综合性的分类法。

《 》 中 国 图 书 馆 图 书 分 类 法 的 基 《 》 中 国 图 书 馆 图 书 分 类 法 的 基 本 大 类 : A B C D E F G H I J K N O P Q R S T U V X Z 马克思主义、列宁主义、毛泽东思想、邓小平理论 哲学、宗教 社会科学总论 政治、法律 军事 经济 F 2 经济计划与管理 F 7 贸易经济 文化、科学、教育、体育 语言、文字 文学 艺术 历史、地理 自然科学总论 数理科学和化学 天文学、地球科学 生物科学 医药、卫生 农业科学 业技术 TM电 技术 TN无线电电子学, 电信技术 TP自动化技术, 计算机技术 交通运输 航空、航天 环境科学、安全科学 综合性图书  

§ 主题语言是以语词作为概念标识,按字顺编排的检索语言。 主题语言包括: Ø 标题词语言——最早使用的一种主题语言。它以规范化的自然 语义作为标识,来表达文献涉及的主题概念,并将全部标识按字母 顺序排列。表达主题的词语称为标题词。 Ø 单元词语言——是从文献内容中抽选出来的最基本的词汇,将 代表最一般、最基本的、不可再分割的概念单元的词作为单独标引 文献的单位。 Ø 叙词语言——从自然语言中优选出来并经过规范化处理的名词 术语。叙词语言是采用表示单元概念的规范化语词的组配来对文献 § 主题语言是以语词作为概念标识,按字顺编排的检索语言。 主题语言包括: Ø 标题词语言——最早使用的一种主题语言。它以规范化的自然 语义作为标识,来表达文献涉及的主题概念,并将全部标识按字母 顺序排列。表达主题的词语称为标题词。 Ø 单元词语言——是从文献内容中抽选出来的最基本的词汇,将 代表最一般、最基本的、不可再分割的概念单元的词作为单独标引 文献的单位。 Ø 叙词语言——从自然语言中优选出来并经过规范化处理的名词 术语。叙词语言是采用表示单元概念的规范化语词的组配来对文献 内容主题进行描述的检索语言,也是目前使用最广泛的主题语言。 Ø 关键词语言——直接从文献题名、文摘或正文中抽取出来的未 经规范化处理的词。是一种用自然语言做标识的检索语言。

文献检索的常用途径 1 题名 :注意题名关键词的排序特征 2. 作者 :通常按姓在前名在后方式检索 3. 分类 :我国高校与公共图书馆的文献资料,一般采用《中国图书 馆图书分类法》(简称《中图法》)进行分类。 4. 主题 词:主题是指表征文献内容特征、经过规范化的名词术语。 文献检索的常用途径 1 题名 :注意题名关键词的排序特征 2. 作者 :通常按姓在前名在后方式检索 3. 分类 :我国高校与公共图书馆的文献资料,一般采用《中国图书 馆图书分类法》(简称《中图法》)进行分类。 4. 主题 词:主题是指表征文献内容特征、经过规范化的名词术语。 检索者通过检索这些规范的词语来找到所要的文献和情报。 《 化学化 主题词表》 5. 关键词:直接从文献的篇名或文摘或全文中抽取出来的非规范化 检索词。 6. 顺序号检索:专利号,标准号,研究报告号 7. 引文检索

四、信息检索步骤 分析检索课题,明确检索要求 选择检索 具,选择检索途径 确定检索标识,确定检索运算 构筑检索提问,实施检索操作 获取初步信息,调整检索策略 获得满意结果。 需求课题 用户 主题分析 选择检索系统 确定检索 具 四、信息检索步骤 分析检索课题,明确检索要求 选择检索 具,选择检索途径 确定检索标识,确定检索运算 构筑检索提问,实施检索操作 获取初步信息,调整检索策略 获得满意结果。 需求课题 用户 主题分析 选择检索系统 确定检索 具 具体操作 制定检索表达式 选择检索途径 结果输出 用户评价 检索结果