王朝百科
分享
 
 
 

元搜索

王朝百科·作者佚名  2009-12-26  
宽屏版  字体: |||超大  

什么是元搜索元搜索引擎又称多搜索引擎,通过一个统一的用户界面帮助用户在多个搜索引擎中选择和利用合适的(甚至是同时利用若干个)搜索引擎来实现检索操作,是对分布于网络的多种检索工具的全局控制机制。(搜索引擎分类:全文搜索引擎、目录索引、元搜索引擎)

一个真正的元搜索引擎由三部分组成,即:检索请求提交机制、检索接口代理机制、检索结果显示机制。"请求提交"负责实现用户"个性化"的检索设置要求,包括调用哪些搜索引擎、检索时间限制、结果数量限制等。"接口代理"负责将用户的检索请求"翻译"成满足不同搜索引擎"本地化"要求的格式。"结果显示"负责所有源搜索引擎检索结果的去重、合并、输出处理等元搜索引擎的出现,对于那些需要连续地使用不同的搜索引擎重复相同的检索的人来说,是一个福音。使用元搜索引擎同时对几个搜索引擎进行检索,获得分级编排的检索结果。

元搜索引擎的另外一个定义:元搜索引擎(Metasearch Engine),是一种调用其它独立搜索引擎的引擎,亦称“搜索引擎之母(The mother of searce engines)”。在这里,“元”(Meta)为“总的”、“超越”之意,元搜索引擎就是对多个独立搜索引擎的整合、调用、控制和优化利用。相对元搜索引擎,可被利用的独立搜索引擎称为“源搜索引擎”(source Engine),或“搜索资源”(searcing resources),整合、调用、控制和优化利用源搜索引擎的技术,称为“元搜索技术”(Meta-searching technique),元搜索技术是元搜索引擎的核心。

元搜索的起源世界上最早的元搜索是metacrawler,它是infospace inc.的一部分,初始网上运行时间为 1995年,是由华盛顿大学的学生erik和教授oren etzin共同开发研制的。它是万维网搜索引擎metacrawler的姐妹引擎,是一个并行式的元搜索引擎。具有同时调用Google、Yahoo、Ask Jeeves About、LookSmart、Teoma Overture、FindWhat等搜索引擎的功能,然后按相关度给出精确,详细的结果。它可以对网页、图像、音频、多媒体、新闻、购物等进行选择检索,还提供了如下高级检索功能:

提高你检索的品质(Qualify Your Search):你可以创建一个特定的检索,查询一个精确的字段,或者排除包含特定词的页面。

使用布尔逻辑符检索(Use Boolean Terms):在关键词中使用and,or和not布尔逻辑检索符,使得检索结果更精确。

最后更新页面(Last Page Update):使用After来查询特定日期后更新的结果,使用Before来查询在特定日期千更新的结果。同时选择After和Before,将检索出两个日期之间的结果。

域名过滤(Domain Filter):可以排除以.com、.gov、.edu结尾的域名,你也可以包括一个特殊的包含.com的域名。

成人过滤(Adult Filter):可以包含或者过滤掉Web检索结果中的成人内容。

语言选择(Language Selection):可以选择返回结果所用的语言。

结果展示(Results Display):可以选择检索结果排序的方式,按与检索词的相关性排序或者按搜索引擎展示结果的顺序排序。

元搜索引擎的原理

元搜索
元搜索引擎的工作原理

我们可将元搜索引擎看成具有双层客户机/服务器结构的系统。用户向元搜索引擎发出检索请求,元搜索引擎再根据该请求向多个搜索引擎发出实际检索请求,搜索引擎执行元搜索引擎检索请求后将检索结果以应答形式传送给元搜索引擎,元搜索引擎将从多个搜索引擎获得的检索结果经过整理再以应答形式传送给实际用户。当然,某些元搜索引擎具有略微不同的机制。

搜索引擎功能和性能的术语简单搜索(Simple Search)指输入一个单词(关键词),提交搜索引擎查询,这是最基本的搜索方式。

词组搜索(Phrase Search)指输入两个单词以上的词组(短语),提交搜索引擎查询,也叫短语搜索。现有的搜索引擎一般都约定把词组或短语放在引号“”内表示。

语句搜索(Sentence Search)指输入一个多词的任意语句,提交搜索引擎查询,这种方式也叫任意查询。不同搜索引擎对语句中词与词之间的关系的处理方式不同。

目录搜索(Catalog Search)指按搜索引擎提供的分类目录逐级查询,用户一般不需要输入查询词,而是按照查询系统所给的几种分类项目,选择类别进行搜索,也叫分类搜索(Classified SearCh)。

高级搜索(Advance Search)指用布尔逻辑组配方式查询,也叫定制搜索。常用的逻辑运算为AND(和)、 OR(或)和NOT(非)。

上述前3种搜索方式可以合称为词语搜索(Word Search),与高级搜索和目录搜索一起构成3类常见搜索方式。

在所有搜索方式中,还可使用通配符,就像DOS文件系统用“*”作为通配符一样,通配符用于指代一个串字符,不过,每个搜索引擎所用的通配符不完全相同,大多用“*”或“?”,少数用“$”。

不少搜索引擎还支持加(+)、减(-)词操作。 元搜索引擎(Meta-search engine) 其英文原意是搜索引擎之后或之上的搜索引擎,即可以同时查询多个搜索引擎的WWW站点。虽然元搜索引擎依赖其他独立搜索引擎而存在,但它们集成了不同性能和不同独立的搜索引擎并发展了一些新的查询功能,查一个元搜索引擎就相当于查多个独立搜索引擎,可以收到事半功倍的效果,故值得选用。

元搜索引擎的发展方向及前景元搜索引擎是为弥补传统搜索引擎的不足而出现的一种辅助检索工具,有着传统搜索引擎所不具备的许多优势。但是,元搜索引擎依赖于数据库选择技术、文本选择技术、查询分派技术和结果综合技术等。用户界面的改进、调用策略的完善、返回信息的整合以及最终检索结果的排序,仍然是未来元搜索引擎研究的重点。

元搜索引擎及其网站元搜索引擎在接受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。著名的国外元搜索引擎有InfoSpace、Dogpile、Vivisimo等(元搜索引擎列表),中文元搜索引擎中具代表性的有比比猫搜索引擎、搜星搜索引擎。在搜索结果排列方面,有的直接按来源引擎排列搜索结果,如Dogpile,有的则按自定的规则将结果重新排列组合,如Vivisimo。

国外对元搜索的开发应用很早,目前在美国使用元搜索引擎和使用Google一样普遍,当然Google仍然占据美国绝对市场,但元搜索引擎也一样生机勃勃,财源滚滚。相比国内,起步很晚,中国首家元搜索引擎是比比猫(bbmao),于2005年成立,在2006年获得Red Herring 亚洲100强奖,从而拉开国内对元搜索的真正关注和探索。近期比较优秀的元搜索引擎有搜魅网(someta),整合了王朝、谷歌、雅虎等多家主流搜索引擎的结果,并且独创网站查询。

整体来讲,国外元搜索引擎已自成体系,而国内真正长期坚持致力于开发独特用户体验的元搜索网站并不多。

主要元搜索引擎列表国内:

·搜魅网(someta)

集合了王朝、google、搜狗、雅虎多家主流搜索引擎的结果,提供网页、资讯、网址导航等聚合查询。另外,搜魅网突破了元搜索引擎没有自己的蜘蛛的瓶颈,提供了网站查询的功能。

·比比猫(Bbmao)

独创国际领先的聚类和去重技术。搜索结果汇集各大搜索引擎结果,搜索结果智能分类整理,去掉重复搜索结果,并拥有直接搜寻文档和强大网络收藏夹等多元功能。对于记者、教授、高管等知性、高端且惜时如金的人群比较适用,支持中英文搜索。

·全博元搜索(QOOPOO)

聚合搜索的力量,已经运行多年,2006年格林斯潘曾接触这家公司,后劲比较强劲。

·Xooda 元搜索引擎

支持本地搜索,一次输入,返回多个搜索引擎结果,并对结果进行重新的优化排序。

·佐意综合搜索(Chinazss)

集主流搜索引擎为一体,分类详细,强大的搜索功能。让搜索变得更方便!

国外:

Vivisimo:是美国Vivisimo公司最新开发的一个具有对搜索结果自动进行分类功能的搜索引擎!它能非常快速地将不同类型的网站进行分类整理并将结果呈现在你眼前! 它在搜索结果页面左侧增加了一个搜索结果目录栏。不足之处在于搜索结果精准度不是很高。

ProFusionProFusion:是并行式元搜索引擎,拥有智能化的搜索技术、对查询的实用提示和非常宝贵的个人化搜索服务,它是目前很优秀的元搜索引擎,可同时调用9个独立万维网搜索引擎—AltaVista、Excite、HotBot、InfoSeek、Lycos、Magellan、OpenText、Webcrawler和Yahoo。

MetaCrawlerMetaCrawler:是独立万维网搜索引擎WebCrawler的姐妹引擎,也是一个并行式元搜索引擎,它条理清晰,组织结构完美,可以同时调用AltaVista、Excite、Infoseek、Lycos、WebCrawler和Yahoo 6个独立引擎,是简单搜索或中度复杂搜索的最佳网点。

DogpileDogPile:是目前性能较好的并行式元搜索引擎之一,它可以同时调用Web搜索引擎、Usenet搜索引擎和FTP搜索引擎等25个搜索引擎,其中,Web搜索引擎14个。

DigisearchDigisearch:是目前能同时调用独立搜索引擎较多的并行式元搜索引擎,它可以同时调用AltaVista、 Excite、 Infoseek、 Lycos、 WebCrawler、 Yahoo、 OpenText和 Magellen等 18个独立万维网搜索引擎,DejaNews等3个Usenet搜索引擎和Fourll等3个个人信息和商界信息搜索引擎。

Highway61Highway61:是并行式元搜索引擎,可以同时调用AltaVista、Excite、 Infoseek、 Lycos、WebCrawler和Yahoo等6个独立引擎,并将它们传回的结果进行排序,显示给用户。

MammaMamma:是并行式元搜索引擎,它自称是所有搜索引擎之母(Mother of all Search Engines),它可以同时调用AltaVista、Excite、Infoseek、Lycos、WebCrawler和Yahoo等独立引擎,并且可以查新闻组、商业黄负和发布新闻。

 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
如何用java替换看不见的字符比如零宽空格​十六进制U+200B
 干货   2023-09-10
网页字号不能单数吗,网页字体大小为什么一般都是偶数
 干货   2023-09-06
java.lang.ArrayIndexOutOfBoundsException: 4096
 干货   2023-09-06
Noto Sans CJK SC字体下载地址
 干货   2023-08-30
window.navigator和navigator的区别是什么?
 干货   2023-08-23
js获取referer、useragent、浏览器语言
 干货   2023-08-23
oscache遇到404时会不会缓存?
 干货   2023-08-23
linux下用rm -rf *删除大量文件太慢怎么解决?
 干货   2023-08-08
刀郎新歌破世界纪录!
 娱乐   2023-08-01
js实现放大缩小页面
 干货   2023-07-31
生成式人工智能服务管理暂行办法
 百态   2023-07-31
英语学习:过去完成时The Past Perfect Tense举例说明
 干货   2023-07-31
Mysql常用sql命令语句整理
 干货   2023-07-30
科学家复活了46000年前的虫子
 探索   2023-07-29
英语学习:过去进行时The Past Continuous Tense举例说明
 干货   2023-07-28
meta name="applicable-device"告知页面适合哪种终端设备:PC端、移动端还是自适应
 干货   2023-07-28
只用css如何实现打字机特效?
 百态   2023-07-15
css怎么实现上下滚动
 干货   2023-06-28
canvas怎么画一个三角形?
 干货   2023-06-28
canvas怎么画一个椭圆形?
 干货   2023-06-28
canvas怎么画一个圆形?
 干货   2023-06-28
canvas怎么画一个正方形?
 干货   2023-06-28
中国河南省郑州市金水区蜘蛛爬虫ip大全
 干货   2023-06-22
javascript简易动态时间代码
 干货   2023-06-20
感谢员工的付出和激励的话怎么说?
 干货   2023-06-18
 
>>返回首页<<
 
 
 
静静地坐在废墟上,四周的荒凉一望无际,忽然觉得,凄凉也很美
© 2005- 王朝网络 版权所有