定向爬虫

王朝百科·作者佚名  2010-04-21  
宽屏版  字体: |||超大  

定向爬虫是网络爬虫的一种。

定向爬虫可以精准的获取目标站点信息。

定向爬虫获取信息,配上手工或者自动的模版进行信息匹配,将信息进行格式化分析存储。

优势:

基于模版的信息提取技术,能提供更加精准的信息。比如价格,房屋面积,时间,职位,公司名等等。

劣势:

目标网站难以大面积覆盖,因为基于模版匹配的信息提取技术,需要人工的参与配置模版,欲要大面积覆盖各个目标网站,需要大量的人力成本,同样维护模板也需要很大的人力成本。

 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
 
© 2005- 王朝百科 版权所有