您的位置:首页 > 编程语言 > Go语言

Google“博客搜索” Ping 服务及其设置

2008-10-26 22:16 148 查看
什么是 Google“博客搜索” Ping 服务?

Google“博客搜索”Ping 服务是一种通知 Google“博客搜索”引擎某一博客内容发生更新的方式。这些更新将被发布出去,并与其他的搜索引擎共享,使google blogsearch 爬虫能发现您的博客内容的变化。同时,Google“博客搜索”将把所提交的更新博客记录添加到它需要进行抓取和索引的博客列表中。

Google“博客搜索”Ping 服务适用于那些希望自己的博客内容能被 Google 所获取并在 Google 的“博客搜索”中进行更新的博客们。同时它也适用于那些希望向其博客作者们提供 Ping 服务的博客服务提供商。目前,Google 同时也追踪其它 Ping 服务,并将继续下去。然而,直接使用 Google 的 Ping 服务将潜在地减小对您的博客最新内容进行抓取的延迟。

手动的 Ping Google“博客搜索”

如果您的博客最近更新过,且您希望让 Google 获取它,请在通过以下链接提交您的博客URL。

http://blogsearch.google.com/ping?hl=zh-CN

由于这是一项一次性通知服务,每次您的博客发生变化,请再次进行提交。

理想情况下,每次您的博客内容发生变化,请重新 Ping 一次。

尽管 Google“博客搜索” Ping 服务能够帮助google blogsearch爬虫在您的博客更新时得到及时的通知,但它并不能保证您的博客内容一定包含在google的“博客搜索”结果中。由于google的收录过程是全自动的,许多因素,例如从google blogsearch爬虫接收 Ping 到对您的站点进行抓取之间的延时,都将影响对您的博客的收录。

配置博客软件去 Ping Google

许多商业博客服务提供商可能已经在 Ping Google“博客搜索”。因此,您可以向您的服务提供商进行确认。您也可能需要按照如上所述的方法手动的进行 Ping,或者调用 Google“博客搜索”Ping 服务API自动 Ping Google“博客搜索”。

通过 Google“博客搜索”Ping API, 你可以程序化的方式将博客内容的更新通知给 Google“博客搜索”引擎。这对于经常更新博客内容的用户尤其有用。博客服务提供商的管理人员也可以利用此API将其平台上的博客内容变化向 Google 通告,以便 Google“博客搜索”及时抓取来自这一服务提供商的最新内容。为设置对 Google“博客搜索”的自动 Ping 机制,可以按照如下所述设置XML-RPC客户端或REST客户端以发送请求。任意选择其中一种方法进行通知,Google“博客搜索”都将按照相同的方式进行处理。

XML-RPC客户的请求应包含如下元素:

RPC端点: http://blogsearch.google.com/ping/RPC2

调用方法名: weblogUpdates.extendedPing

参数: (应按照如下所列的相同顺序传送)

站点名

站点URL

需要检查更新的页面URL

相应的RSS、RDF或Atom种子的URL



可选 页面内容的分类名称(或标签)。您可以指定多个值,之间用'|'字符进行分隔。

XML-RPC响应中将返回含有两个元素的<struct> :

flerror (Boolean):当有错误发生时设为true/1

message (string) :"Thanks for the ping." (如果成功) 或者一个错误信息(如果不成功)。

XML-RPC请求的例子

POST /RPC2 HTTP/1.0
User-Agent: request
Host: blogsearch.google.com
Content-Type: text/xml
Content-length: 447

<?xml version="1.0"?>
<methodCall>
<methodName>weblogUpdates.extendedPing</methodName>
<params>
<param>
<value>Official Google Blog</value>
</param>
<param>
<value><a target="_blank" href="http://googleblog.blogspot.com/%3C">http://googleblog.blogspot.com/<</a>;;/value>
</param>
<param>
<value><a target="_blank" href="http://googleblog.blogspot.com/%3C">http://googleblog.blogspot.com/<</a>;;/value>
</param>
<param>
<value><a target="_blank" href="http://googleblog.blogspot.com/atom.xml%3C">http://googleblog.blogspot.com/atom.xml<</a>;;/value>
</param>
</params>
</methodCall>

XML-RPC响应的例子

HTTP/1.1 200 OK
Connection: close
Content-Length: 451
Content-Type: text/xml
Date: Sun, 30 Sep 2001 20:02:30 GMT
Server: Apache

<?xml version="1.0"?>
<methodResponse>
<params>
<param>
<value>
<struct>
<member>
<name>flerror</name>
<value>
<boolean>0</boolean>
</value>
</member>
<member>
<name>message</name>
<value>Thanks for the ping.</value>
</member>
</struct>
</value>
</param>
</params>
</methodResponse>

设置REST客户

REST客户的请求中包含如下元素:

URL: http://blogsearch.google.com/ping

参数:

name = 博客的名字

url = 博客的URL

changesURL = RSS、RDF或Atom种子的URL (可选)

响应中将返回文本内容,在成功的时候是"Thanks for the ping.",在失败时是一条错误消息。

changes.xml的格式

Google 将所接受的“博客搜索” Ping 记录以XML格式发布到http://blogsearch.google.com/changes.xml。changes.xml文件格式包含一个根元素<weblogUpdates>和一个或多个的<weblog>元素。

<weblogUpdates version="2" updated="Wed, 30 May 2006 14:10:00 GMT" count="1384779">
<weblog name="Some Blog"
url="http://googleblog.blogspot.com"
rssUrl="http://googleblog.blogspot.com/atom.xml"
when="1"/>
...
</weblogUpdates>

<weblogUpdates>元素

version:用来指示一个主要的格式变化,目前的版本是2。

updated:以 HTTP 1.0格式表示的日期时间。它指示了该文件上一次更新的时间。

count:一个递增的数字,表示了changes.xml文件的版本。新版本changes.xml文件通常具有更大的count值。

<weblog>元素

name:Blog的名称。

url: Blog的url。

rssUrl: 相应的RSS、Atom或其它种子的URL。

when: <weblogUpdates>元素的updated属性对应的时间减去相应的 Ping 发生的时间的差值,单位为秒。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: