王朝百科
分享
 
 
 

基于文献的知识发现

王朝百科·作者佚名  2010-03-14  
宽屏版  字体: |||超大  

基于文献的知识发现

基于文献的知识发现含义

基于文献的知识发现,更确切的术语是基于非相关文献的知识发现,它是1986年由Swanson教授首先提出,该术语目前尚无完整的定义,根据Swanson历次发表的论文,可将基于文献的知识发现含义归纳为:“从公开发表的非相关文献中发现某些知识片段间的隐含联系,并在此基础上提出科学假设或猜想,一道科研人员进行攻关或实验,从而发现新知识。”这里,发表的非相关文献是指两篇或多篇公开发表的文献不彼此引用或不共引其他文献。所谓知识片段是指知识单元或知识单元集合。最后提出的科学假设只是一种推测,尚需实验佐证,方能生成新知识,为科学界所认可。

Swanson提出的知识发现方法首先在生物医学中得到应用。1986年,他发现,雷诺氏病是一种病因和治疗方法均未知的血液循环紊乱疾病。有的文献记载了部分雷诺氏病患者血液中有些异常(如血液黏度偏高),又有一些文献记载了食用鱼油能纠正这些异常(如它可降低血液黏度)。Swanson将34篇论述血液变化可导致雷诺氏病的生物医学文献分为一组(A),而降25篇论述食用鱼油可引起血液某种变化的生物医学文献分为另一组(C),通过雷诺氏病主题词(B)将两组文献类型在一起。在此基础上,Swanson提出科学假设:“食用鱼油会对雷诺氏病患者有益。”当时,这一假设并未以任何形式公开发表过,学术界尚未发现食用鱼油与雷诺氏病之间的联系。两年后,这个科学假设被临床实验所证实。后来,Swanson通过文献研究又发现了偏头痛与镁的11条被忽略掉的联系。他在1998年发表的文章中提出了“镁的缺乏可能引起偏头痛”的假设,后来也被临床实验和脑中镁含量的检测报告所证实。

美国为嗯州立大学Cort教授讲Swanson方法成功应用于发现Wilson人文数据库中文献间的隐含关系。他发现可以前未被人们发觉的诗人Robert Forst(1874-1963)和希腊哲学家Carneades(公元前214~公元前129年)间的联系。为此证实在人文科学文献中同样存在着许多未被挖掘的隐含联系。

2001年F.Morrissery博士在美国第九届图书馆、保健图书馆和法律图书馆会议上发表了题为“科学技术与医学数据库中知识发现的理论与实践”一文。他以工程索引数据库Compendex为基础,采用Swanson的方法发现两人以前未被热发觉的聚合物中产生带状扭结的原因,从而证实了工程技术文献中也存在着大量未被发觉得隐含联系。

基于文献的知识发现产生背景

第一,记录性知识(文献)总量与人类吸收知识能力之间的鸿沟不仅是巨大的,而且是不断扩展和加深的,人的智力水平和有限的生命严重地影响新知识的产生,极大地延缓知识的演化过程。

第二,知识分裂现象日趋严重。知识分裂又称知识分化。由于跨学科、跨专业的知识交流,各个学科不断产生新的分支和专业。知识裂化的加剧导致文献中隐含的关系不易被发觉,人们识别文献之间意义联系及其关联网越感困难。

第三,文献之间意义联系呈“大爆炸”之势。一个专业领域的信息可能对另一个专业领域是有价值的,而这一事实却无人知晓。跨学科之间存在着许许多多未被人发现的联系,而这种联系未能通过文献之间的相互引用或其他交流方式进行沟通。另人惊讶的是,意想不到的这种隐性意义联系的数量远远超过显性(相互引用和交流)联系的数量,各种信息或知识单元在意义上的结合(潜在联系)数量要比信息或知识单元本身多的多。文献意义关联的数量爆炸令人担忧,后果更为严重。

基于文献的知识发现基本原理

Swanson提出的基于文献的知识发现方法最初是根据阿里斯托得的三段论。三段论一般由两个前提和一个结论构成,即是说,从两个因果关系中可以推导出第三个因果关系。例如,A→B(A引起B),B→C(B引起C),则A→C(A引起C)。知识的发现是以因果的演绎推理为基础的。然而,这种三段论有其局限性,必须遵循一定的规则。

美国密歇根大学商学院Gordon教授发展了Swanson的逻辑递推的理念,提出了中介文献概念。其基本原理为:“若某一篇文献中的A与另一篇文献中的Bi有关,而每一个Bi又与其他文献中的Cj有关,将这种递推关系一直进行下去,直至发现预定目标的内容T。而A与T没有在文献中共引或相互引用,也没有一篇文献同时论述A与T。” Gordon教授逻辑递推知识发现的原理,增加了中介文献,而这比Swanson教授简单演绎推理更进一步。

美国布拉斯加大学数学与计算机系的Chen创建了“文献相互交谈”的计算机模型,其基本原理可描述为:“若在文献dj中实体或对象Ok同Ol有关,而另一文献dj中实体或对象Oi与Om有关,则Ok与Om通过Ol被联系起来。” Chen的模型也是建立在三段论基础之上的。

计算机实现方法——Arrowsmith系统

Swanson教授根据其思想开发的Arrowsmith系统目前已经推出了3.0版本。由过去的数据库记录的标题检索模式过渡到主题词和文摘检索模式。该系统的网址为http//:kiwi.Uchicago.edu或http//:Arrowsmit.Psych.Uic.edu。

 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
中国古代四大美女:背后隐藏惊人秘密
 女性   2025-06-20
如何用java替换看不见的字符比如零宽空格​十六进制U+200B
 干货   2023-09-10
网页字号不能单数吗,网页字体大小为什么一般都是偶数
 干货   2023-09-06
java.lang.ArrayIndexOutOfBoundsException: 4096
 干货   2023-09-06
Noto Sans CJK SC字体下载地址
 干货   2023-08-30
window.navigator和navigator的区别是什么?
 干货   2023-08-23
js获取referer、useragent、浏览器语言
 干货   2023-08-23
oscache遇到404时会不会缓存?
 干货   2023-08-23
linux下用rm -rf *删除大量文件太慢怎么解决?
 干货   2023-08-08
刀郎新歌破世界纪录!
 娱乐   2023-08-01
js实现放大缩小页面
 干货   2023-07-31
生成式人工智能服务管理暂行办法
 百态   2023-07-31
英语学习:过去完成时The Past Perfect Tense举例说明
 干货   2023-07-31
Mysql常用sql命令语句整理
 干货   2023-07-30
科学家复活了46000年前的虫子
 探索   2023-07-29
英语学习:过去进行时The Past Continuous Tense举例说明
 干货   2023-07-28
meta name="applicable-device"告知页面适合哪种终端设备:PC端、移动端还是自适应
 干货   2023-07-28
只用css如何实现打字机特效?
 百态   2023-07-15
css怎么实现上下滚动
 干货   2023-06-28
canvas怎么画一个三角形?
 干货   2023-06-28
canvas怎么画一个椭圆形?
 干货   2023-06-28
canvas怎么画一个圆形?
 干货   2023-06-28
canvas怎么画一个正方形?
 干货   2023-06-28
中国河南省郑州市金水区蜘蛛爬虫ip大全
 干货   2023-06-22
javascript简易动态时间代码
 干货   2023-06-20
 
>>返回首页<<
 
 
静静地坐在废墟上,四周的荒凉一望无际,忽然觉得,凄凉也很美
© 2005- 王朝网络 版权所有