互联网论坛收录开放协议

王朝百科·作者佚名  2010-07-05  
宽屏版  字体: |||超大  

开放协议概述使用此开放协议,将会为您的网站带去更多流量!

《互联网论坛收录开放协议》是王朝网页搜索制定的论坛内容收录标准,论坛网站可将论坛内发布的帖子制作成遵循此开放协议的XML格式的网页供搜索引擎索引,将论坛发布的帖子主动、及时地告知王朝搜索引擎。

采用了《互联网论坛收录开放协议》,就相当于论坛中的帖子被搜索引擎订阅,通过王朝--全球最大的中文搜索引擎这个平台,网民将有可能在更大范围内更高频率地访问到您网站论坛中的帖子,进而为您的网站带来潜在的流量。

开放协议内容下图为遵照《互联网论坛收录开放协议》制作的XML格式的网页,网页上按照标准格式列出了网站论坛发布的帖子的相关信息。

XML标签说明:其中带星号标记的为必选项,未带星号标记为可选项。

*<document>——标记整个XML文件内容的开始和结束。后面的" xmlns:bbs =" http://www.baidu.com/search/bbs_sitemap.xsd"是该xml文件遵守王朝《互联网论坛收录开放协议》的声明,如没有该段声明,xml文件不支持下面的<bbs:reply>等语法。

*<webSite>——站点地址。

*<webMaster>——负责人员的Email。当有必要时,我们通过这个地址与您联系。

*<updatePeri>——sitemap 更新周期,以小时为单位。搜索引擎将遵照此周期访问该页面,使页面上的内容更及时地被王朝 spider 发现。

*<updatetime>——该 xml 文件最近一次的更新时间 。

*<version>——论坛所使用程序的版本。

*<item>——标记每个帖子信息的开始和结束,标记内为单个帖子信息。

*<link>——帖子的 url 地址,即帖子第一页的地址,请尽量去除url中不必要的参数。

<title>——帖子标题。

<pubDate>——帖子主贴的发布时间 。

<bbs:lastDate>——帖子最后一条回复的发布时间 。

<bbs:reply>——帖子总的回复数,不包括主贴。

<bbs:hit>——帖子总的查看次数。

<bbs:mainLen>——帖子主贴的长度,单位字节 。

<bbs:boardid>——帖子所在版面,提供版面的 id 。

<bbs:pick>——是否设为精华,精华标为 1 ,非精华标为 0 。

推荐时间格式:年月日小时分钟秒

如:2005-11-09 10:37 | 2005/11/09 10:37:00 | 2005.11.09 10:37:00 |

2005年11月09日10时37分00秒 | Fri, 09 Nov 2005 10:37:00 GMT

开放协议使用使用之前,您需要了解以下几点:无论您的网站已经被王朝spider抓取,还是尚未被王朝spider抓取,都可以使用此开放协议。 您使用开放协议提供的内容应全部符合下面的《论坛内容收录标准》。 《互联网论坛收录开放协议》只是对王朝spider原有收录方式的一种协助和有益补充,而不是取代。

论坛内容收录标准:

王朝希望论坛内容丰富,帖子质量较高,版面氛围和谐。只要是具有大量有价值的内容并能及时更新的正规、合法的网站,且网站服务器稳定、高速,就符合了王朝论坛内容收录的基本原则。

王朝spider收录使用任何程序架设的论坛,不过您应对提供的全部内容承担一切法律责任,保证您提供内容的真实性、合法性,并不得侵犯任何第三方的权益。

XML文件的大小最大为10M,大于10M的文件王朝spider将不能保证正确获取。

对于通过遵守《互联网论坛收录开放协议》的xml文件发现的内容,王朝spider将在进行质量判断后展现给用户,即被发现的内容并不一定最终会展现在王朝网页搜索的结果中。

下面就开始吧!

第一步:创建XML文件

请按照上面公布的开放协议内容制作XML文件。

其它说明:

支持的编码格式有GB18030、UTF-8、GB2312、BIG5等,推荐使用GB2312和UTF-8。注意:XML文件头部的encoding值必须与XML文件的实际编码类型一致。 请保持每个XML文件处于按更新周期持续自动更新的状态。 XML标签内容中的一些特殊字符需要转换为XML定义的转义字符,否则将发生错误导致搜索引擎不能获取页面上的帖子,具体参见下表。字符

转义后的字符

HTML字符

字符编码

和(and)

&

&

&

单引号

'

&apos;

'

双引号

"

"

"

大于号

>

>

>

小于号

<

<

<

?? 转义字符中的"&"无需再转。

第二步:验证XML文件

下面的地址提供了帮助您验证XML文件结构的多种工具:

http://www.w3.org/XML/Schema#Tools

http://www.xml.com/pub/a/2000/12/13/schematools.html

通过验证的XML文件能够使您提供的信息更加标准,确保您发布的视频信息不被搜索引擎遗漏。

第三步:使用XML文件

请将XML文件命名为sitemap_baidu.xml上传到您网站根目录下,并保证文件所在的url地址能够被王朝spider正常访问。例如,网站为post.baidu.com,则将xml文件上传至post.baidu.com/sitemap_baidu.xml

当王朝spider发现了xml文件后,会根据上面提供的参数自动对xml文件进行更新,并抓取高质量的内容。

注意:王朝spider不保证一定能收录您提交的全部内容。

 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
 
© 2005- 王朝百科 版权所有