王朝百科
分享
 
 
 

并行搜索

王朝百科·作者佚名  2010-06-16  
宽屏版  字体: |||超大  

什么是并行搜索技术

并行搜索引擎(又称集成搜索引擎、元搜索引擎、大型搜索引擎)是一种可同时检索多个搜索引擎,并以统一的检索界面返回检索结果的检索工具,其结构模型如图1 所示。Metacrawler 是世界上第1个并行搜索引擎,它使用几大顶级搜索引擎(Google, hoo, About等)进行并行搜索,返回最相关的检索结果,从而使网页检索更容易。并行搜索引擎通过其转换功能,将检索用词转换为搜索引擎可接受的形式,并提交给搜索引擎,用于查找匹配记录、进行记录去重及检索结果整合。由于并行搜索引擎能协同检索多个搜索引擎,忽略其数据来源的结构差异,剔除相互之间的重复记录,并检验检索结果信息的有效性,因此可获得高质量的检索效果。

图1 并行搜索引擎的基本结构模型

与独立搜索引擎相比,并行搜索引擎有4 个优势:

(1)检索信息扩大对Internet 的覆盖范围。研究表明,Internet 数据增长速度比独立引擎索引网络数据的速度快很多,导致主流的独立搜索引擎对Internet 的覆盖范围逐步下降,而并行搜索引擎可以缓解该矛盾。

(2)提高信息检索的扩展性。使用并行搜索引擎检索网络信息比使用集中化的独立搜索引擎更容易得到扩展。

(3)并行检索可以同时使用多个搜索引擎。用户只需要提交一次查询就可以使用多个独立引擎,不必熟悉每个独立引擎的检索界面,且并行搜索引擎可以对检索结果进行排序和冗余处理。

(4)提高检索效率。有时并行搜索的检索速度低于单个独立搜索引擎,但并行检索可以获得较大的结果集,为用户提供更有效的检索信息。一些学者认为未来的网络检索服务将由许多各自覆盖的小部分互连网的专业引擎协同提供。通用大型检索系统的任务将由并行搜索引擎代替。相对一些成熟的独立搜索引擎而言,并行搜索引擎仍然

存在缺陷。由于并行搜索引擎基本没有自己管理的检索信息,因此无法获得检索信息的描述信息,且其检索质量还部分依赖于为其提供服务的独立搜索引擎,具体体现在:

(1)并行搜索引擎可能不支持某些高级检索功能,比如高级布尔检索等。

(2)并行搜索引擎不会返回所有检索结果,例如,它只是将每个搜索引擎最相关的检索结果返回给用户,若某个独立搜索引擎在规定时间内没有响应,则忽略它的检索结果。

(3)因为独立搜索引擎之间一般都有重复纪录出现,所以并行搜索引擎必须面对信息冗余问题。文献[4]提出基于Agent的方法,包含自然语言分析器、查询定制、网页收回、网页过滤、网页排序和用户选项Agent来解决上述问题。本文基于网格的并行搜索引擎,参考文献的思想来解决并行搜索引擎的一些问题。

 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
中国古代四大美女:背后隐藏惊人秘密
 女性   2025-06-20
如何用java替换看不见的字符比如零宽空格​十六进制U+200B
 干货   2023-09-10
网页字号不能单数吗,网页字体大小为什么一般都是偶数
 干货   2023-09-06
java.lang.ArrayIndexOutOfBoundsException: 4096
 干货   2023-09-06
Noto Sans CJK SC字体下载地址
 干货   2023-08-30
window.navigator和navigator的区别是什么?
 干货   2023-08-23
js获取referer、useragent、浏览器语言
 干货   2023-08-23
oscache遇到404时会不会缓存?
 干货   2023-08-23
linux下用rm -rf *删除大量文件太慢怎么解决?
 干货   2023-08-08
刀郎新歌破世界纪录!
 娱乐   2023-08-01
js实现放大缩小页面
 干货   2023-07-31
生成式人工智能服务管理暂行办法
 百态   2023-07-31
英语学习:过去完成时The Past Perfect Tense举例说明
 干货   2023-07-31
Mysql常用sql命令语句整理
 干货   2023-07-30
科学家复活了46000年前的虫子
 探索   2023-07-29
英语学习:过去进行时The Past Continuous Tense举例说明
 干货   2023-07-28
meta name="applicable-device"告知页面适合哪种终端设备:PC端、移动端还是自适应
 干货   2023-07-28
只用css如何实现打字机特效?
 百态   2023-07-15
css怎么实现上下滚动
 干货   2023-06-28
canvas怎么画一个三角形?
 干货   2023-06-28
canvas怎么画一个椭圆形?
 干货   2023-06-28
canvas怎么画一个圆形?
 干货   2023-06-28
canvas怎么画一个正方形?
 干货   2023-06-28
中国河南省郑州市金水区蜘蛛爬虫ip大全
 干货   2023-06-22
javascript简易动态时间代码
 干货   2023-06-20
 
>>返回首页<<
 
 
静静地坐在废墟上,四周的荒凉一望无际,忽然觉得,凄凉也很美
© 2005- 王朝网络 版权所有