twiceler

王朝百科·作者佚名  2010-04-29  
宽屏版  字体: |||超大  

说明twiceler是一个爬虫程序,据说是美国斯坦福大学研究搜索引擎的一个学生项目。

爬虫信息爬虫名称:Twiceler

HTTP User Agent:

Mozilla/5.0 (Twiceler-0.9 http://www.cuill.com/twiceler/robot.html") </pre>

抓取强度:高

推广效果:未知

来访IP:38.99.13.122 64.1.215.164 (均为美国IP)

禁止twiceler访问twiceler是一个中低强度的爬虫,遵循robots.txt爬行标准。如果你觉得它占用了服务器资源,可以屏蔽这个爬虫。方法为在服务器上的网站根目录建立robots.txt,包含以下内容:

User-agent: twiceler Disallow: / </pre>

上面在全站之内禁止twiceler爬行。或者禁止爬行某个目录:

User-agent: twiceler Disallow: /somedir/ </pre>

 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
 
© 2005- 王朝百科 版权所有