情报检索策略
qingbao jiansuo cele
情报检索策略
information retrieval strategy
在分析情报实质的基础上,确定检索途径与检索用词,并明确各词之间的逻辑关系与查找步骤的科学安排。在手工检索条件下,需要弄清楚用户所要求的检索角度、深度和广度,需要在结合考虑检索工具(数据库)特性的基础上确定从何种途径入手,使用什么索引,需要确定该查什么类目、该用什么主题词或关键词、分类号以及作者姓名、文献序号等检索点,以及需要计划查找的步骤及可能遇到挫折时的后备检索方案等。检索策略的制定是否周密,在检索过程中能否根据检索进程的反馈信息修改原来的检索策略,都关系着检索的成败。由于手工检索过程是由人的手翻、眼看和脑子作出判断而进行的,检索策略往往只存在于检索者的脑子里,不必写成书面的表达语句,并且可以边查边看边思考,灵活地改变策略。在计算机检索的条件下,由于情报提问与文献标识之间的对比匹配工作是机器进行的,必须事先拟订周密的检索策略,用计算机能够理解和运算的形式加以表达,而后交计算机去执行。最常用的表达形式,是应用布尔逻辑(OR,AND,NOT)的原理,使用概念组配的方法,转化成布尔逻辑检索表达式。这种表达式,从狭义来说就是检索策略。任何情报需求,不管表面看起来多么复杂,都可以用布尔逻辑式加以表达。例如,“轻金属的焊接”这一情报需求,包含了“轻金属”这一概念组面和“焊接”另一个概念组面,这两个组面之间是逻辑乘(AND或×) 的关系。而每个组面应根据所检数据库的词表选出合适的检索词。同一组面内的各词用逻辑或 (OR或+)连接因而可以形成如下检索表达式:(轻金属+镁+铝+铋)×(焊接+结合+铜焊+粘接) 。检索策略可根据检索目标和命中文献的有无或多寡而调整其查全率与查准率。提高查全率的措施有;提高检索词的泛指度,控制同义词;截词;减少用逻辑乘或逻辑非的概念组面;增加用逻辑或连接的相关检索词;聚类检索法,以及字串位置逻辑等。提高查准率的措施有:提高词的专指度;增加用逻辑乘或逻辑非连接的概念组面;连号法;职号法;加权法;利用文献的外表特征进行限制等。而在实现上述调整中,一是依靠概念的分析,即从学科专业知识出发,选择泛指词、专指词及相关词以及它们的权值,并确定概念组面和组配逻辑;另一是依靠功能操作,即利用计算机检索系统的功能,从文献的类型、年代、文种等外表特征入手对命中文献集合进行调整与控制。