注意: WordPress 6.5 版现在支持站点地图文件中的 lastmod 元素,这可以帮助搜索引擎了解哪些内容是新的或更新的。
XML 站点地图最佳实践
保持 XML 站点地图最新:定期更新站点地图以包含新页面并删除旧页面或已删除页面。这可确保搜索引擎索引您当前的内容。
使用正确的 URL:确保站点地图中列出的 URL 准确无误,并指向实际网页。避免包含重定向到其他页面或返回错误代码的 URL。
优先考虑重要页面:虽然包含大多数页面是件好事,但要优先考虑最重要的内容。应包含具有高 SEO 价值的页面,如主要产品页面、主要类别页面和基石内容。
限制站点地图的大小:单个 XML 站点地图不应超过 50MB 和 50,000 个 URL。如果您的网站较大,请将站点地图拆分为多个文件并使用站点地图索引文件。
包含元数据:除了位置 ( 之外,还包括每个 URL 的上次修改日期 ( 更改频率 和优先级 以便向搜索引擎提供更多信息。
对大型网站使用站点地图索引文件:如果您有多个站点地图,请使用站点地图索引文件。这本质上是站点地图的站点地图,可让搜索引擎更轻松地找到和抓取您的内容。
这最适合已添加了数百万个 URL 的新闻和购物网站。
站点地图索引文件的 XML 格式与普通站点地图类似。不过,XML 中使用的元素会发生变化。
站点地图周围的父标签将是“sitemapindex”,而列出的每个子站点地图的父标签将是“sitemap”。归属的位置必须指向子站点地图的 URL。
以下是一个例子:
<站点地图索引> <站点地图> </站点地图> <站点地图> </站点地图> </站点地图索引>
RSS、mRSS 和 Atom 1.0 站点地图
对于新闻和杂志网站来说,这是最佳格式,因为他们已经将 RSS 提要用于多种用途。
您所要做的就是将 RSS 源 URL 添加到搜索控制台中的站点地图部分。Google 很乐意将 RSS 源中的 URL 编入索引。
这与 Google 新闻发布商使用的机制相同。发布商被要求在 Google 新闻发布商中心工具中提交 RSS 源。
当信息流更新时,Google 新闻爬虫会将新添加的页面编入索引。而且几乎是即时的。
纯文本网站地图
现在您对如何创建上述格式已经有了一定的了解。
然而,有很多人不了解其中的技术细节。
众所周知,谷歌迎合了所有阶层的需求,并且不会限制功能。
这就是为什么谷歌新近宣布站点地图文件甚至可以是包含需要索引的 URL 列表的纯文本文件。
您所要做的就是创建一个纯文本文件,每行添加一个 URL。将其上传到 Search Console,就大功告成了。
就这么简单。
以下是创建文本站点地图文件时需要牢记的一些最佳做法。
- 保存文件时使用 UTF-8 编码。
- 确保文件中除了 URL 之外没有其他内容。
- 文件名没有限制。但请确保扩展名是 .txt
- 不同类型的站点地图扩展
在Web 1.0时代,内容仅仅意味着文本。
然而,在过去十年里,网络发生了翻天覆地的变化,甚至连万维网的创始人蒂姆·伯纳斯·李爵士都从未想过。
您的网站现在是文本、图像和视频的集合,通过建立上下文来组织每一个内容非常重要。
站点地图是目前组织这些不同多媒体内容的最佳选择,以便搜索引擎可以轻松找到它们并进行索引。
此外,有些页面需要 Google 及其爬虫程序的立即关注。
新闻网站属于此列表,因为发布的内容是为了立即传播,任何延迟都可能导致新闻变得陈旧。
视频网站地图
视频在网络上非常流行,许多网站都在使用视频来吸引目标受众关注内容。
然而,谷歌和其他 搜索引擎必须了解视频的内容才能更好地对网站进行排名。
这正是视频站点地图的用途。
谷歌爬虫可能无法理解网站上的视频内容,这是这家搜索引擎巨头已经承认的事实。
但是,如果视频站点地图包含所有页面的链接以及网站上传的相关视频文件的链接,那么爬虫程序错过视频的机会就会减少。
视频站点地图是什么样的?
图片网站地图
与视频一样,图像现在已成为网页不可或缺的一部分,用户已经习惯了看到图像,以至于任何缺少图像的页面都会被看不起。
图片站点地图与视频站点地图类似,其目的在于向搜索引擎提供信息来发现图片和链接到图片的页面。
站点地图上的图像后来会用于显示在 Google 图片搜索以及某些SERP 功能中。