潜在语义标引

王朝百科·作者佚名  2010-05-08  
宽屏版  字体: |||超大  

M. W. Berry 和S. T. Dumais 在20世纪80年代末提出了一种新的信息检索模型:潜在语义标引(Latent Semantic Indexing,LSI),它可以看作经典向量空间模型(VSM)的一种改进。

LSI是一种建立在统计之上的学习方法:它试图发现对象之间的关联模式及其隐藏的对象间的结构关系。

LSI方法最初应用于文本信息检索领域,它可以有效地解决了同义词和多义词的问题,通过识别文本中的同义词, LSI将信息检索精度提高了10%--30%。

随着应用领域的不断拓展, LSI已在信息过滤、信息分类/聚类、交叉语言检索、信息理解、判断和预测、特征抽取(降维)、文本可视化等众多领域中得到了广泛的应用。

 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
 
© 2005- 王朝百科 版权所有