王朝百科
分享
 
 
 

全文检索系统软件

王朝百科·作者佚名  2010-07-15  
宽屏版  字体: |||超大  

1、系统支持远程和本地多种格式文档:PDF、DOC、XLS、PPT、HTM等文件。

2、支持Oracle 、Sqlserver 、Sybase、Mysql 等异构数据库统一检索查询。

3、该软件广泛应用在数字图书馆、档案馆、专业数据库、行业数据库检索。

在当今信息爆炸的时代,每个单位或个人都在为信息的快速增长做出了各种贡献。信息的种类也在不断的扩展,越来越多的非结构化信息不断出现,包括企业的各种报表、帐单、电子文档、网站的各种元素、图片、传真、扫描影像,以及大量的多媒体的音频、视频信息等等。

所有的存储数据中,有85%采用的是非结构化格式的,非结构化信息每三个月增长一倍。 由于信息格式的差异很大,所以基本无法整合为统一的接口供政府工作人员或广大群众方便使用。

Goonie全文检索系统以先进的信息整合处理技术为核心,为政府及企业建设高性能信息检索平台,能够将分散的多种信息集中检索,让用户在一个检索界面即可获取到所需的各种相关信息,不论是内网的网页、办公的文档、行业的数据库,对于Goonie都能提供完美的检索解决方案。

产品概述Goonie全文检索系统是一个功能强大、高性能、灵活的全文索引和检索平台,核心功能是实现对结构化、非结构化信息的全文检索和统一存储。Goonie全文检索系统的主要目标是实现文本索引的快速构建(Index Construction),动态文档集的索引维护(Index Maintenance),短语查询(Phrase Query),Top-k查询的快速处理(Top-k Query Process)以及各种检索模型(IR Model)等。高性能和灵活的架构也使Goonie全文检索引擎可以应用在内外网检索、专业系统资料检索、行业专业数据库检索。

Goonie全文检索系统支持办公文档、动静态网页、多种数据库等格式,支持中文(GB2312和GBK)和英文,灵活的架构也可以方便地扩展支持其他语言和编码;检索语法丰富,支持多字段检索,日期范围检索,检索结果自定义排序等;系统也可以通过插件无限扩展。

产品架构

功能特点强大的信息采集能力

Goonie全文检索系统是以先进的搜索技术为核心,并针对专业用户所要求的搜索深度深、采集精度高和抓取速度快等进行了专门的优化,采用了分布式多线程并发指令执行体系结构,95%信息分钟级到达本地。能够采集多种动态和静态网页类型、多种文档、数据库类型,同时网页实时增量采集技术实现分秒监测网站信息变化动态,使网站随时获取最新的信息资源。

分秒级的实时检索

Goonie全文检索系统采用独有的增量实时索引技术保证信息即时采集即时检索,使用户随时检索到行业/地区最新的信息。

快速的检索响应

Goonie全文检索系统可实现亚秒级的检索速度以及每秒上百次的并发检索支持,保证全面快速的响应用户检索需求。

全面的检索功能

Goonie全文检索系统可实现全文检索,完全支持布尔逻辑检索、支持n阶渐进检索、支持同义词检索、支持自定义用户词典,模糊检索,相关检索等,并可以由系统管理员人工过滤不当网页,为用户提供最为适当的检索结果。

精确的检索结果

Goonie全文检索系统采用智能中文切词技术,避免中文检索的歧义与多义现象,同时采用相关性算法对网页进行排序,保证检索相关性最高的页面放在最前面。

丰富的检索结果展示

Goonie全文检索系统为用户提供丰富的检索结果展示,能够根据每个网站的不同风格和要求定制结果显示模版。检索结果包括智能动态摘要、独有的网页快照,以及多种检索结果排序方式等。能够极大的方便用户对检索结果的浏览查看,提高用户对检索效果的满意度。

基于Web的系统管理平台

Goonie全文检索系统采用标准的B/S架构,系统管理员可以随时随地通过浏览器登陆Web管理界面对整个系统的各项功能进行管理和系统维护,操作简单易用,无需专业培训即可迅速上手。

产品优势无论是网页、文档、数据库均能实现增量检索,同步信息的变化。 实时索引技术保证信息索引时检索。 亚秒级的检索速度,海量信息瞬间响应。 每秒上百次的并发量支持。 独有的同义词、近义词等检索功能,满足多种检索需求。 如果是网页信息则可以提供完整的快照效果。 先进的中文切分词技术,避免中文检索的歧义与多义现象,确保检索结果的准确。 丰富的检索结果显示方式,人性化的设计可以使用户以最适合自己使用的方式呈现检索结果。

运行环境Microsoft Windows XP/NT/2000/2003/

Linux/Unix/Aix

 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
如何用java替换看不见的字符比如零宽空格​十六进制U+200B
 干货   2023-09-10
网页字号不能单数吗,网页字体大小为什么一般都是偶数
 干货   2023-09-06
java.lang.ArrayIndexOutOfBoundsException: 4096
 干货   2023-09-06
Noto Sans CJK SC字体下载地址
 干货   2023-08-30
window.navigator和navigator的区别是什么?
 干货   2023-08-23
js获取referer、useragent、浏览器语言
 干货   2023-08-23
oscache遇到404时会不会缓存?
 干货   2023-08-23
linux下用rm -rf *删除大量文件太慢怎么解决?
 干货   2023-08-08
刀郎新歌破世界纪录!
 娱乐   2023-08-01
js实现放大缩小页面
 干货   2023-07-31
生成式人工智能服务管理暂行办法
 百态   2023-07-31
英语学习:过去完成时The Past Perfect Tense举例说明
 干货   2023-07-31
Mysql常用sql命令语句整理
 干货   2023-07-30
科学家复活了46000年前的虫子
 探索   2023-07-29
英语学习:过去进行时The Past Continuous Tense举例说明
 干货   2023-07-28
meta name="applicable-device"告知页面适合哪种终端设备:PC端、移动端还是自适应
 干货   2023-07-28
只用css如何实现打字机特效?
 百态   2023-07-15
css怎么实现上下滚动
 干货   2023-06-28
canvas怎么画一个三角形?
 干货   2023-06-28
canvas怎么画一个椭圆形?
 干货   2023-06-28
canvas怎么画一个圆形?
 干货   2023-06-28
canvas怎么画一个正方形?
 干货   2023-06-28
中国河南省郑州市金水区蜘蛛爬虫ip大全
 干货   2023-06-22
javascript简易动态时间代码
 干货   2023-06-20
感谢员工的付出和激励的话怎么说?
 干货   2023-06-18
 
>>返回首页<<
 
 
静静地坐在废墟上,四周的荒凉一望无际,忽然觉得,凄凉也很美
© 2005- 王朝网络 版权所有