您的位置:首页 > 运维架构 > 网站架构

网站文档如何在最短的时间内被Google收录?

2009-05-25 17:51 399 查看

什么是 Google Sitemap 文件?为什么我需要一个?

您可使用 Sitemap 文件告诉Google关于您网站上的网页,另外,还可以选择是否告诉Google关于这些网页的信息,如哪些网页最重要以及更改频率。通过提交 Sitemap 文件,您可以控制抓取/编制索引过程的第一阶段,即查找网页。
如果您的网页有动态内容、页面不容易通过追踪链接到达或您的网站是一个新网站并且很少追踪链接,这会非常有用。
Sitemaps 有助于加速网页的查找,这也是抓取网页和编制索引重要的第一步,但有很多因素会影响抓取/编制索引过程。Sitemaps 可让您告诉Google关于您网页的信息(您认为哪些网页最重要、这些网页的更改频率),这样,在后续的步骤中,您可以表达自己的意见。其他因素包括有多少网站链接到您的网站、网站内容是唯一的还是相关的、Google是否可以成功抓取网页,以及Google在网站管理员指南中阐述的一切事项。
Sitemap 通过另一角度观察网站(如同您的主页和 HTML 网站地图所采取的方式)。该计划并不会取代Google抓取网络的常规方法。无论使用该计划与否,Google 都将使用与以往相同的方式搜索网站并编制索引。网站不会因使用此服务而受到处罚。目前,它只是一项测试计划,因此我们还无法预见或保证您的网址何时或是否会被Google抓取或添加到Google的索引。

什么是 Sitemap 生成器?

Sitemap 生成器是可以配置为自动创建 Sitemap 并将其提交到 Google 的简单脚本。Sitemap 生成器可以根据网址列表、访问日志或者根据网址托管静态文件的目录路径来创建 Sitemap。
SiteManager-CMS Server Google SiteMap 生成器模块可帮助您自动生成符合Google SiteMap 协议的SiteMap文件,帮助您的网站文档更快的被Google收录。
Google SiteMap 协议文档:http://www.google.com/webmasters/sitemaps/docs/zh_CN/protocol.html
使用SiteManager-CMS生成的符合Google SiteMap协议的SiteMap.xml文件: http://www.jaron.cn/SiteManager-CMS.SiteMaps.Xml

如何将我的网站加入 Google 搜索结果?

包含在 Google 搜索结果中不需要付费,并且非常容易执行;不需要将网站提交到 Google。Google 是一个完全自动化的搜索引擎,它使用称为"Spider"的软件定期搜索网络并找到可添加到 Google 索引的网站。事实上,列入索引的绝大多数网站都不是人工提交的,而是 Spider 抓取网络时找到并自动添加进来的。
要判断您的网站目前是否包含在 Google 索引中,只需对您的网站网址执行搜索。例如,搜索 [ site:www.jaron.cn ] 将返回以下结果:http://www.google.com/search?hl=zh_CN&q=site%3Awww.jaron.cn+ 虽然 Google 可抓取超过几十亿个网页,但丢失几个网站也在所难免。造成 Spider 丢失网站的常见原因有:
- 此网站未通过多个链接牢靠连接到网络的其他网站。
- 在 Google 的最近一次抓取后此网站才启动。
- 网站的设计使 Google 很难有效抓取其内容。
- Google执行抓取时网站暂时不可用。
"公平准确地展示互联网内容"是Google的宗旨。为实现此目标,Google提供了建立便于抓取网站的指南。虽然Google无法保证 Spider 能找到某特定网站,但遵循以下指南应该可以增加网站在搜索结果中显示的机会。
您需要在网页上提供高品质的内容,尤其是主页。这是您要做的最重要的工作。如果您的网页包含有用的信息,其内容就可以吸引许多访问者并使网站管理员乐于链接到您的网站。要创建具有实用性且信息丰富的网站,网页文字应清晰、准确地表述要传达的主题。想一想,用户会使用哪些字词来查找您的网页,然后尽量在网站上使这些字词。
确保有网站链接到您的网站上。链接可帮助Google的抓取工具找到您的网站,并提高您的网站在Google的搜索结果中的展示机率。返回搜索结果时,Google 会将 PageRank(Google对网页重要性的评测)与先进的文字匹配技术合并使用,以显示对每个搜索结果都兼具重要性与相关性的网页。Google 会计算一个网页收到的投票数量,以确定其 PageRank,其计算方法是将从网页 A 指向网页 B 的链接解释为由网页 A 对网页 B 所投的一票。自身"重要"的网页所投的票会更具分量,有助于提高其他网页的"重要性"。请注意,网站在搜索结果中的排名完全自动,我们不会人为地为网站指定关键字。

以合理的链接结构建立您的网站。每个网页应至少可以通过一个静态文本链接打开。
使用文本浏览器(如 Lynx)检查您的网站。大部分 Spider 查看网站的方式与 Lynx 一样。如果因应用了 JavaScript、Cookie、会话 ID、框架、DHTML 或 Macromedia Flash 等技术,而造成在文本浏览器中无法看到整个网站,则 Spider 在抓取此网站时可能也会遇到麻烦。
考虑创建动态网页的静态复本。虽然 Google 索引中包括动态网页,但它们只占索引的一小部分。如果您怀疑您动态生成的网页(例如包含问号的网址)给Google的抓取工具带来了麻烦,可以为这些网页创建静态复本。如果要创建静态复本,不要忘记将动态网页添加到您的 robots.txt 文件,防止我们将其当成重复内容。
请考虑使用 Google Sitemaps 创建并提交关于您网页的详细网站地图。Google Sitemaps 是您向 Google 索引提交所有网址并详细了解您网页在 Google 可见度的一条捷径。通过 Google Sitemaps,Google始终可以自动得到您当前网页及其更新的所有信息。请注意,提交 Sitemaps 并不能保证您网站中的所有网页都能够被抓取或包含在Google的搜索结果中。要了解有关 Google Sitemaps 的详情,请访问Google网站管理员指南网页: http://www.google.com/webmasters/sitemaps/about?hl=zh_CN
需要避免的事项
不要使用关键字列表填写网页、"遮蔽"网页或建立"仅供抓取"的网页。如果您的网站上包含您不希望访问者看到的网页、链接或文字,Google 会认为这些内容具有欺诈性并可能忽略您 的网站。
您不一定非要购买搜索优化服务。有些公司声明可以"保证"您的网站在 Google 搜索结果中享有高排名。合法的咨询公司可以改善您网站的流量和内容,但其他公司会采用欺骗性手段来骗过搜索引擎。请务必小心;如果您的网域与这些欺诈性服务相关,Google可能禁止其加入Google的索引。
不要使用图片来显示重要名称、内容或链接。Google的抓取工具无法识别图形中所含的文字。如果网页上的重要内容和关键字不能以普通的 HTML 格式显示,请使用 ALT 标记。
不要为不同网址下的一个网页创建多个复本。许多网站提供纯文本或易于打印的网页,其内容与相应的图形丰富的网页不相上下。为了确保您首选的网页包括在我们的搜索结果中,请使用 robots.txt 文件拦截 Spider 抓取到的重复内容。有关使用 robots.txt 文件的详情,请访问 关于拦截 Googlebot 的信息。
以上文档部分引用《Google 网站管理员指南》文档。请访问:https://www.google.com/webmasters/sitemaps/siteoverview?hl=zh_CN
使用SiteManager-CMS生成的符合Google SiteMap协议的SiteMap.xml文件: http://www.jaron.cn/SiteManager-CMS.SiteMaps.Xml
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: