王朝百科
分享
 
 
 

Semantic Web

王朝百科·作者佚名  2010-06-29  
宽屏版  字体: |||超大  

核心它的核心是:通过给全球信息网上的文档(如:HTML)添加能够被计算器所理解的语义(Meta data),从而使整个因特网成为一个通用的信息交换媒介。语义全球信息网通过使用标准、置标语言和相关的处理工具来扩展全球信息网的能力。不过语义网概念实际上是基于很多现有技术的(某些技术甚至可以追溯到20世纪60年代末期), 也依赖于后来和text-and-markup与知识表现的综合.

定义"语义"网是由比现今成熟的网际搜索工具更加行之有效的、更加广泛意义的并且自动聚集和搜集信息的文档组成的。 其最基本的元素就是语义连结

通过下列方法可以提升万维网以及其互连的资源的可用性(usability)和有效性(usefulness):

"标记"了语义信息的文档。这可以是机器可以理解的关于文档内容(例如文档的作者,标题,简介等)的描述, 或者是描述该网站所拥有的服务和资源.(注意:任何东西都是能被URI-统一资源定位符-所描述的,因此语义网能理解人物、地方、想法、类别等等)

通用元数据词汇表(本体论)及词汇间的影射使得文文件作者知道如何来标记文文件方可让机器识别他想提供的元数据.

利用元数据为语义网用户执行任务的自动软件代理(agent).

为自动软件代理提供特定信息的网络服务 (例如, 可信度服务可以让软件代理查询某个在线商店是否曾经有过不良纪录或者发送过垃圾邮件).

这方面的技术依靠下列的工具: URIs (以识别任何资源定位) 及 XML 及 名字空间. 这些技术,加点逻辑,能组成RDF,一种用于描述任何事物的标记语言. 和RDF类似, 很多其它技术, 例如 概念图 和 Web之前的人工智能 技术,例如知识库和描述逻辑, 都有可能对语义网有贡献.

目前的各种万维网技术都有可能被应用于语义网 (在语义环球网的意义上), 例如 :

DOM 文文件对象模型, 一组访问XML和HTML 文文件组成部分的标准接口.

XPath、XLink、XPointer

XInclude XML fragment XML查询语言 XHTML

XML Schema, RDF (Resource Description Framework)

XSL, XSLT Extensible Stylesheet Language

SVG (Scalable Vector Graphic)

SMIL

SOAP

DTD

元数据概念.你可以使用Friend-of-a-Friend-o-matic 创建一小篇RDF代码(FOAF)来在语义网中描述你自己

引言随着INTERNET 应用的普及和软件技术的进步,基于Web 的网络计算模式或INTERNET

计算模式得到了广泛的重视和应用。目前, 面向Web 应用的三层结构( 或多层结构)、构件

化的商务逻辑封装、基于XML 和Web Services 的自动电子商务等理论和技术深入人心。而

现有的这些Web 技术并不能真正解决人们期待已久的智能搜索引擎、智能信息代理、智能交

易代理等基于Web 的个性化、智能化的服务。这正是语义Web(Semantic Web) [9]要解决的

问题。用本体来改进目前Web Services,使之成为语义Web 服务( Semantic Web Services)[5],

正是目前国际上语义Web 研究中的共识。基于此,W3C,DARPA 等研究机制定了基于本体

的, 应用于Web 的技术标准,如RDF[4]、DAML 和OWL 等[1] [2 ]。

建立语言标准是实现Semantic Web 的重要基础性工作, 但还需要在语言标准的研究之上

建立支持这些标准的相应支撑软件,这一软件是最终实现Semantic Web 的一个重要的基础软

件[3] [6]。所以开发一种可以处理本体形式化表示、存储管理、分布式管理、甚至是推理机制

的Semantic Web 支撑软件成为发展Semantic Web Services 的重要一环。本文讨论的就是这样的可以应用于Semantic Web 的支撑软件。

本文第二部分对国内外现有支撑软件进行了比较详尽的分析; 第三部分描述了本文提出

的一个语义Web 的支撑软件的体系结构;第四部分对这一支撑软件中的各个功能的实现进行

了说明; 最后给出针对本文中提出的方法需要进一步研究的内容。

语义Web 的支撑软件现状基于Semantic Web 对于支撑软件的需求, 很多科研机构和学校、公司在Semantic Web

和DAML、RDF 的基础上开展了自己的研究工作, 开发了许多工具和平台。

最早出现的是SiRPAC (Simple RDF Parser & Compiler), 它是一个由Stanford 大学开发

的RDF 的解释器,被广泛应用于许多SW1 项目。其功能还比较简单,实际上只是一个 RDF

API, 本体存储形式仍然是文件系统, 不能充分发挥数据库的事务管理、分布性以及便于查

询的结构等特性。而随后出现的OpenCyc、Sesame、KAON、Jena 就显得相对完善了, 但是

也都包含不足。

OpenCyc 是一个基于常识的,具有最完整知识库的,世界上最大的逻辑推理引擎。现在

最新的版本是0.7Beta,已经可以支持Linux、Windows NT/2000/XP 等多种操作系统。OpenCyc

可以用于各种领域的智能推理软件, 例如语音理解、数据库集成、快速开发本体、邮件的优

先级、邮件路由、邮件摘要、邮件标注等。即将推出的OpenCyc1.0 将包括6000 条概念、60000

条断言、Cyc 推理引擎、Cyc 基于知识的浏览器、CycL 规范(Cyc language, 用于开发Cyc

的语言)、CycL 到Lisp 以及C 语言的翻译器等等。采用开放源代码的授权机制, 可从

sourceforge 下载。但是OpenCyc 也存在不足, 由于它所支持的CycL 并不是一种通用的标准

语言,这就使得它与标准化的本体表示的兼容性成为瓶颈。并且它使用C 语言开发,其代码

的可重用性、可移植性和平台无关性就不如用纯Java 语言的代码好。

Sesame 是一个开放源代码的本体存储与查询系统,由Aidministrator 公司开发。它解决

了以往的本体数据存储的问题, 支持关系型数据库和面向对象的数据库。并且实现了RQL

(RDF Query Language)查询语言,可以在数据库中检索需要的本体。Sesame 虽然解决了本

体数据库的存储问题,但是它所实现的RQL 是对于整个本体数据进行的,当本体数据量达到

一定程度时, 其查询效率就会成为整个系统的瓶颈。

KAON, 即“ The Karlsruhe Ontology and Semantic Web Infrastructure” 是德国Karlsruhe

大学的一个科研项目。致力于语义Web 提供所需的基础本体系统和相关工具。它针对基于本

体的上层商业应用的需求提供了一个开放的本体管理基础软件, 为本体的存储、创建、标识

提供了一个全面的支撑平台。它目前的版本是1.2。

HP 实验室的Jena 是一个以RDF API 为核心, 用于实现语义网络( Sematic Web) 的工

具。Jena 由Network API、Query、Readers、Inference、Writers、Stores 几部分围绕RDF API

组成。它支持RDF 的创建、操作和查询等功能。而RDF API 也能够支持很多不同的数据存

储技术。插件式的接口设计能够自动适应各种由不同的语言编写的读写RDF 文件的需要。推

理层、查询功能以及网络API 建立在RDF API 之上。Jena 目前的版本是1.6.0,支持N3,可

以更快速的处理关系数据库模型, 并且修正了一些错误。

KAON 和Jena 可以说是目前功能和结构较完善的Semantic Web 的支撑软件, 它们都支

持本体数据库的存取操作,支持RDF 标准,使用纯Java 语言开发,有着良好的结构和性能。

但美中不足的是,它们不支持基于本体信息的逻辑推理,只能查询当前数据库中已有的信息。

我们知道对于一种本体知识库来说, 有些知识本身是隐含的, 需要进行推理才能得到, 这只

有在已有的本体知识库中运用基于知识的推理才能真的展示出本体知识的丰富性, 更好的发

挥本体知识的作用。

我们看到, 虽然围绕语言标准已经推出了很多的支撑平台和软件工具, 但分析其现有研

究状况, 它们都普遍存在以下问题:

􀁺 语言支持问题。从国内外发表的论文情况来看,目前这方面的主要研究成果暂时还是来自于国外, 现有平台并不支持中文。

􀁺 Semantic Web 要使本体以一种高效的、稳定的机制存于数据库中,并支持分布式的本

体访问、存取与搜索查询。目前虽然在这方面已经有了比较多的研究,但是如何提高

本体存储、访问和搜索的效率还有待于进一步的研究

[ 7 ]

􀁺 分布式本体粒度问题与具体处理机制还有待于进一步的深入研究

[ 8 ]

。目前本体分布的粒度比较简单,是本体的一个类。实际上,这种粒度太小,从效率等各方面看,可以

把多个关系密切的CLASS 看成是一个本体构件,以本体构件为单位进行本体的分布,

提高对本体访问和处理的效率。但本体构件以何标准划分,这种划分是静态的还是动

态自适应的, 都是一个有待解决的、值得研究的理论问题。

􀁺 将推理机制与本体知识库整合,实现一个直接操作数据库中的基于本体推理系统,是

一个尚待研究的课题。

基于调研以上各种的Semantic Web 支撑软件的现状并分析他们的不足,我们开发了一个

面向web 的分布式本体系统—WODOS(Web Oriented Distributed Ontology System)。它本身

是一个语义Web 的支撑软件,该软件具有以下功能:支持中英文,可以将本体信息存于关系

型数据库中, 做RDF 文件的导入导出, 支持RQL 查询, 第三方软件可以通过OdoAPI 进行

操作。本支撑软件还引入推理机制, 可以对存于WODOS 中的本体事实施以规则( 基于

F-Logic), 并在这些规则的基础上进行推理。WODOD 建立了统一的用户界面, 可以把对它

的各种操作( 如原有的RQL 查询、RDF 文件导入导出和新加入的F-Logic 操作等)集成在一

起。

表1 综合说明了前面介绍的各种研究成果。从表中看出, 本文研究的语义web 的支撑软

件在支持本体的分布性、支持语言和推理机制方面要好于现有其他的支撑软件。

WODOS 的结构内容通过分析目前其他Semantic Web 支撑软件的功能和结构。我们把WODOS 系统的功能模

块规划成四个部分,这四个部分相辅相成,各自都有明确的功能。首先,这个系统要提供本

体信息的数据库存储机制, 这就需要本体数据库的访问操作模块, 我们定义为RCS; 其次,

作为支撑软件,WODOS 是以第三方软件的形式提供给别人使用的, 这就需要定义一个对外

的接口个OdoAPI 查询模块( 含RQL 解释器), 整个接口模块我们定义为ACS; 再次, 处理本体需要很多的参数, 而且要调用系统的功能需要一个可视化的界面,我们将这一部分界面和管理功能模块定义为MCS;最后,为了实现基于本体的推理机制, 我们定义了以F-Logic 推理内核为核心的功能模块ICS。4.WODOS 的实现我们发现WODOS 虽然可以进行RQL(RDF Query Language) 查询, 实现了在本体数据库中比SQL 更高级的查询模式, 但是仅仅依靠RQL 还存在着一些明显的不足:

􀁺本体的局限性大RQL 只能查询本体数据库中已有的本体知识,不能推理出隐含的本

体知识。而在实际应用中,发现隐含的本体知识也应该是本体数据库的一个重要组成

部分。􀁺 查询语句的可读性差RQL 语句虽在形式上和SQL 有一些相似之处, 但是由于其处理的对象是本体知识,而不是简单的记录,因此在语法上变得更为灵活和复杂。例如以下语句:

select P from subClassOf(Class[4]){P} where P in Class

可以查询出一个类的所有子类。但是这种形式的语言与自然语言还有很大差距, 不容易

让人很直观的理解一个稍微复杂一些的RQL 语句。

通过分析上述不足, 我们迫切需要一种能够基于本体进行真正的逻辑推理并且语句更接

近自然语言的新的查询方法。经过调研, 我们发现F-Logic 语言表达逻辑推理比较合适。目

前支持F-Logic 的系统是SiLRI( Simple Logic-based RDF Interpreter)。

一个一般的F-Logic 描述由三个部分组成:事实、规则和查询。在SiLRI 系统中,事实可

以用RDF 文件或者F-Logic 自己定义的事实表示方法来描述; 规则和查询都是用F-Logic 语

句来实现。比如用F-Logic 定义一个祖父关系的推理规则, 然后查找出所有的有祖父关系的

祖孙对, 就可以这样来写:

注意我们默认已经存在“ Father”本体关系,但是没有“ Grandpa”本体关系。“ Grandpa”

本体关系是通过第一条规则语句用户自己定义的, 即如果Y 是X 的“ Father”, Z 是Y 的

“ Father”,那么Z 是X 的“Grandpa”。然后通过第二条查询语句查找出所有的有祖父关系的

祖孙对。很明显,这样定义的推理规则以及查询语句恰到好处的解决了RQL 的两个不足,即

可以推理出隐含的本体关系, 且语句更接近自然语言, 更为人性化。

在SiLRI 的调研基础上,我们进一步完善了WODOS,加入了F-Logic 逻辑推理内核。目

前的WODOS 具备以下新特性:

􀁺本体推理机制集成了SiLRI 的F-Logic 推理内核, 实现基于本体的推理机制。

􀁺数据源的多样性我们发现如果仅仅以RDF 文件做为F-Logic 运算的数据源,那么就

不能利用上分布式本体数据库的优势,因此我们研究出了直接从分布式本体数据库获

得数据源并且进行F-Logic 运算的方法。

􀁺本体粒度的细化我们考虑到在实际应用的系统中,可能由于本体库中会有各种不同

的本体,大量本体之间的联系不一定很紧密,如果在如此庞杂的各类本体中进行某种

逻辑推理,效率是一个问题。因此,我们继续研究了本体库的粒度问题,进而实现了

从本体数据库中导出某一个或某些本体的功能。为了使使用更为灵活,更能表达语义

信息, 对于这个功能, 我们实现了用RQL 查询语句直接查询出相应的规则作用域,

之后在此规则作用域上继续进行F-Logic 的逻辑运算。这种功能的实现更能满足实际

工程的需求。

WODOS 运行举例􀁺运行环境和问题描述此系统可以运行于Windows、Linux 等各种操作系统, 支持Mysql 数据库, 通过RDF

文件描述本体信息, 并且将RDF 解析到本体数据库中, 进而在此基础上进行RQL 查

询以及F-Logic 逻辑推理。下面的例子说明了这个过程。

􀁺此RDF 文件描述了简单的Father 和Mother 本体关系, 比如本体Robbie 是本体Ellen 的

Father, 本体Marilyn 是本体Ellen 的Mother 等。

􀁺使用的RQL 查询语句select X, Y from {X}Property[6]{Y}其中Property[6]就是Father 属性( 说明:系统的固有的属性有:type、domain、range、subClassOf 和subPropertyOf 等5 个, 因此Father 属性是第6 个属性, 相应的Mother属性是第7 个属性)。这条RQL 语句的含义就是查询出所有的有Father 属性关系的主语和宾语。􀁺 使用的F-Logic 查询语句:FORALL X,Y,Z Grandpa(X,Z) <- X[">Y">规则FORALL grandson,grandpa <- Grandpa(grandson,grandpa).//查询如同前面介绍的那样,通过Father 属性关系的传递性定义了Grandpa 属性关系,并且查询出所有的祖孙对。􀁺查询结果分三个部分:1. RQL 语句的查询结果:RQL Query 􀁺 本例小结:在这个例子中, 说明了WODOS 将RDF 本体信息导入本体数据库, 执行RQL 语句,执行F-Logic 语句, 以及RQL 和F-Logic 的综合查询等功能。6. 结论和下一步工作通过上述分析和讨论, 我们发现虽然目前存在着各种各样的语义Web 的支撑软件, 但是功能并不是十分完善, 有的不支持数据库操作, 有的操作界面还是字符形式, 有的还停留在使用C 语言开发( 不如java 有更好的可扩展性和移植性), 大多数不支持基于本体的逻辑运算。我们则从中吸取了经验, 使用纯java 开发, 支持数据库的本体信息存取, 使用F-Logic语言作为本体的逻辑推理内核,在同一个综合界面上实现了RQL 和F-Logic 功能的集成,可以先使用RQL 查出相应本体, 再运用F-Logic 进行基于规则的逻辑推理。当然, 我们的WODOS 系统也在逐步的成熟阶段, 还有相当的工作要做:􀁺 制定用RDF 表示F-Logic 规则的规范。将目前的本体数据库发展成本体规则数据库,使得数据库中不仅保存本体信息,并且也保存相应的规则,提供更为简洁的推理机制。􀁺 支持XML 数据库以及面向对象的数据库也是比较重要的发展方向。由于处理的对象是本体信息, 并且本体信息一般用RDF 文件的形式表示, 而RDF 本身就是XML 的扩展, 因此进一步研究XML 数据库以及面向对象的数据库对于本体信息的存取, 可以更好的保存语义信息, 提供更高的性能。References:1. XU Jian-Jun et al, “The Intelligent Web Services Based on the Ontology”,Computer Science,2002,29(12):92-942. James Hendler. “Agents and the Semantic Web” IEEE Intelligent Systems March/April2001: 30-373. Jeff Heflin and James Hendler. “A Portrait of the Semantic Web in Action” IEEEIntelligent Systems March/April 2001: 54-594. Michel Klein. “XML, RDF and Relatives” IEEE Intelligent Systems March/April 2001:26-285. Sheila A. McIlraith, Tran Cao Son and Honglei Zeng. “Semantic Web Service” IEEEIntelligent Systems March/April 2001: 46-536. Deborah L. McGuinness, Richard Fikes, James Rice, and Steve Wilder. “The ChimaeraOntology Environment” Proceedings of the Seventeenth National Conference on ArtificialIntelligence (AAAI 2000). Austin, Texas. July 30-August 3, 20007. Deborah L. McGuinness. “Conceptual Modeling for Distributed Ontology Environments”Proceedings of the Eighth International Conference on Conceptual Structure Logical,Linguistic, and Computational Issues(ICCS 2000), Darmstadt, Germany, August 14-18, 2000.8. McGuinness, D.L., Fikes, R., Rice, J. and Wilder, S. “An Environment for Merging andTesting Large Ontologies,” Principles of Knowledge Representation and Reasoning:Proceedings of the Seventh International Conference(KR 2000). A.G.Cohn, F.Giunchiglia andB.Selman, editors. San Francisco, CA, Morgan Kaufmann Publishers.9. Tim Berners-Lee, James Hendler and Ora Lassila. “ The Semantic Web”, SCIENTIFICAMERICAN, May, 2001: 34-43附中文参考文献:1. 徐剑军等,“ 基于本体的智能Web 服务” ,计算机科学,2002,第29 卷第12 期:92-94

 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
如何用java替换看不见的字符比如零宽空格&#8203;十六进制U+200B
 干货   2023-09-10
网页字号不能单数吗,网页字体大小为什么一般都是偶数
 干货   2023-09-06
java.lang.ArrayIndexOutOfBoundsException: 4096
 干货   2023-09-06
Noto Sans CJK SC字体下载地址
 干货   2023-08-30
window.navigator和navigator的区别是什么?
 干货   2023-08-23
js获取referer、useragent、浏览器语言
 干货   2023-08-23
oscache遇到404时会不会缓存?
 干货   2023-08-23
linux下用rm -rf *删除大量文件太慢怎么解决?
 干货   2023-08-08
刀郎新歌破世界纪录!
 娱乐   2023-08-01
js实现放大缩小页面
 干货   2023-07-31
生成式人工智能服务管理暂行办法
 百态   2023-07-31
英语学习:过去完成时The Past Perfect Tense举例说明
 干货   2023-07-31
Mysql常用sql命令语句整理
 干货   2023-07-30
科学家复活了46000年前的虫子
 探索   2023-07-29
英语学习:过去进行时The Past Continuous Tense举例说明
 干货   2023-07-28
meta name="applicable-device"告知页面适合哪种终端设备:PC端、移动端还是自适应
 干货   2023-07-28
只用css如何实现打字机特效?
 百态   2023-07-15
css怎么实现上下滚动
 干货   2023-06-28
canvas怎么画一个三角形?
 干货   2023-06-28
canvas怎么画一个椭圆形?
 干货   2023-06-28
canvas怎么画一个圆形?
 干货   2023-06-28
canvas怎么画一个正方形?
 干货   2023-06-28
中国河南省郑州市金水区蜘蛛爬虫ip大全
 干货   2023-06-22
javascript简易动态时间代码
 干货   2023-06-20
感谢员工的付出和激励的话怎么说?
 干货   2023-06-18
 
>>返回首页<<
 
 
 
静静地坐在废墟上,四周的荒凉一望无际,忽然觉得,凄凉也很美
© 2005- 王朝网络 版权所有