文本采集器

王朝百科·作者佚名  2010-05-30  
宽屏版  字体: |||超大  

文本采集

将非结构化的网络文本信息从大量的网页中抽取出来保存到结构化的数据库中的过程。

文本采集系统的主要功能

根据用户自定义的任务配置,批量而精确地抽取目标文本文件中的内容,转化为为结构化的记录,保存在本地数据库中。 特别适用于网络博客/Blog文章采集,RSS/ATOM XML内容采集,Text/CSV内容采集,任意格式XML采集,自定义结构文本内容采集等。

 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
 
© 2005- 王朝百科 版权所有