SEO 工具
XML Sitemap 生成器
在几秒内从任意 URL 列表生成符合标准的 XML Sitemap。每行粘贴一个 URL,配置可选的 lastmod 日期、changefreq 和 priority 值,然后将完成的 sitemap.xml 直接下载到电脑。工具强制执行 50,000 URL 协议上限,在下载前标记格式错误的 URL,并支持带 xhtml:link hreflang 互链的多语言 Sitemap。
SEO 工具
在几秒内从任意 URL 列表生成符合标准的 XML Sitemap。每行粘贴一个 URL,配置可选的 lastmod 日期、changefreq 和 priority 值,然后将完成的 sitemap.xml 直接下载到电脑。工具强制执行 50,000 URL 协议上限,在下载前标记格式错误的 URL,并支持带 xhtml:link hreflang 互链的多语言 Sitemap。
从 URL 列表生成可下载的 sitemap.xml / Generate a downloadable sitemap.xml from a URL list
选项 / Options
预览(前 5 个 URL)/ Preview (first 5 URLs)
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://example.com/</loc>
<lastmod>2026-06-12</lastmod>
<changefreq>weekly</changefreq>
<priority>0.5</priority>
</url>
<url>
<loc>https://example.com/about</loc>
<lastmod>2026-06-12</lastmod>
<changefreq>weekly</changefreq>
<priority>0.5</priority>
</url>
<url>
<loc>https://example.com/blog</loc>
<lastmod>2026-06-12</lastmod>
<changefreq>weekly</changefreq>
<priority>0.5</priority>
</url>
</urlset>仅包含有效的 http/https URL · Invalid URLs are excluded · Google sitemap 上限 50,000 URL / 50MB
XML Sitemap 是一个结构化文件,列出了你希望搜索引擎发现并抓取的所有 URL。它不是给人类看的导航文件——它是你的网站与搜索引擎之间的通信协议,直接提交给 Google Search Console、Bing Webmaster Tools 等索引服务。Sitemap 告诉爬虫内容在哪里、最近一次更新是什么时候,以及每个页面相对于网站上其他页面的重要程度。
Sitemap 在两种情况下最为重要:对于缺乏入站链接的新网站(爬虫可能无法通过跟踪链接发现所有页面),以及对于抓取预算管理是真实挑战的大型网站。对于具有强大外链档案和完善内部链接的成熟网站,搜索引擎可能无需 Sitemap 就能找到大部分页面——但 Sitemap 仍然是质量信号,并在内容更新后加速收录。
关于 Sitemap 如何与 robots.txt、Canonical 标签和抓取预算协同配合,请参阅 技术 SEO 指南。
XML Sitemap 遵循 Sitemaps 协议,这是 Google、Bing、Yahoo 和 Ask 共同支持的标准。关键限制如下:
| 限制 | 数值 |
|---|---|
| 每个 Sitemap 文件最多 URL 数 | 50,000 |
| 最大未压缩文件大小 | 50 MB |
| 最大压缩文件大小 | ~10 MB(gzip) |
| Sitemap 索引文件 | 最多引用 50,000 个 Sitemap |
如果你的网站超过 50,000 个 URL,必须将 Sitemap 拆分为多个文件,并通过 Sitemap 索引文件(<sitemapindex> 根元素)引用它们。生成器会自动处理拆分,并在需要索引文件时发出提示。
一个完整的 Sitemap 条目如下所示:
<url>
<loc>https://example.com/page/</loc>
<lastmod>2026-06-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
<loc>(必填) — 页面的规范 URL,必须包含完整协议(https://)。URL 必须与你的 Canonical 声明保持一致——如果 Canonical 标签指向 www 版本,Sitemap 也应该如此。生成器会验证 URL 格式,并在下载前标记格式错误的条目。
<lastmod>(选填,推荐) — 页面内容最近一次实质性更新的日期,使用 W3C 日期时间格式(YYYY-MM-DD 即可)。Google 使用此信息优先重新抓取最近更新的页面。这是直接影响抓取频率的少数几个信号之一。不要对所有页面无差别地将 lastmod 设为今天——如果 Google 每次抓取都看到所有页面显示今天的日期,它会学会忽略这个字段。
<changefreq>(选填,建议性) — 提示页面通常多久更新一次:always、hourly、daily、weekly、monthly、yearly、never。Google 将此视为建议而非指令。新闻页面用 daily,稳定产品页面用 monthly,常青内容用 yearly,不再更新的归档内容用 never。Google 自己的抓取调度器根据观察到的实际变化率做决定,这个字段越来越受到忽视。
<priority>(选填,建议性) — 页面在网站内的相对重要性评分,范围 0.0 到 1.0,默认 0.5。这是站内相对值,而非绝对值:priority 为 0.8 的页面告诉 Google,它比你的 0.5 页面更重要,但不如 1.0 页面重要。最常见的错误是将所有页面设为 1.0,这样相对信号完全消失。建议:首页 1.0,顶级分类页 0.8,重要内容页 0.6–0.7,低优先级页面 0.3–0.5。
Sitemap 文件位置应通过 Sitemap: 指令在 robots.txt 中声明:
Sitemap: https://example.com/sitemap.xml
这个声明独立于任何 user-agent——它出现在所有 User-agent: 块之外,被所有爬虫读取。如果你有多个 Sitemap 文件或索引文件,允许多条 Sitemap: 指令。使用 Robots.txt 测试器 确认 Sitemap URL 对 Googlebot 和其他爬虫可访问。
https://example.com/sitemap.xml)。Google 会立即尝试抓取并解析 Sitemap。Sitemap 报告显示提交的 URL 数量、已发现的数量以及任何解析错误。在重大内容更新后重新提交 Sitemap——这向 Google 发出信号,告知有新 URL 可供抓取,无需等待常规抓取周期。
Bing 方面,在 Bing Webmaster Tools 的对应 Sitemap 部分提交,或在 robots.txt 中包含 Sitemap 指令(Bing 会自动读取)。
Sitemap 可以使用每个 <url> 块内的 <xhtml:link> 元素声明 hreflang 互链 URL。这是 head link 标签方式的替代方案,适用于修改单个页面模板不切实际的大型多语言网站。
<url>
<loc>https://example.com/page/</loc>
<xhtml:link rel="alternate" hreflang="en" href="https://example.com/page/"/>
<xhtml:link rel="alternate" hreflang="de" href="https://example.com/de/page/"/>
<xhtml:link rel="alternate" hreflang="x-default" href="https://example.com/page/"/>
</url>
互惠性要求同样适用:集群中的每个 URL 都必须出现在其他每个 URL 的互链列表中。生成器会验证这一互惠性,并在下载前标记缺少回链的集群。
sitemap.xml 文件直接下载到你的电脑。https://yourdomain.com/sitemap.xml(标准路径)或你选择的任意路径,然后在 robots.txt 中声明该路径。不应该。只包含你希望被收录且内容质量足以值得收录的页面。排除以下内容:第 2 页之后的分页页面(除非呈现独特产品)、产生近似重复内容的筛选/分面导航 URL、感谢页和确认页、账户页和结账页、站内搜索结果页,以及已被 robots.txt 屏蔽的 URL(永远不要在 Sitemap 中列出被屏蔽的 URL——这会产生相互矛盾的信号)。一个小而高质量的 Sitemap,比一个充斥着薄弱或重复内容的大型 Sitemap 更有价值。
提交 Sitemap 不保证收录。Google 独立判断 URL 是否达到其质量标准。已提交 URL 未被收录的常见原因:内容薄弱或重复、内部链接不足(Sitemap 是内部链接的补充,而非替代)、Canonical 指向其他 URL,或大型网站面临抓取预算限制。使用 Search Console 中的 URL 检查工具查看特定 URL 的收录状态和 Google 抓取结果。
对于活跃网站:每次发布大量新内容(超过 10–20 个新 URL)或对现有页面进行重大内容更新时,重新生成并重新提交。对于静态或更新缓慢的网站:每月重新提交一次即可。自动化 Sitemap 生成——由你的 CMS 或构建流程在每次发布事件时自动生成新 Sitemap——完全消除了这一步骤,是规模化运营的推荐方式。
免费 robots.txt 测试器,支持 Googlebot、GPTBot、ClaudeBot、PerplexityBot 及所有主流爬虫。粘贴 robots.txt,选择 user-agent,同时测试多个 URL 路径——每条结果显示路径是允许还是被屏蔽,以及触发匹配的具体规则,完整复现搜索引擎和 AI 爬虫使用的 RFC 9309 匹配算法。
无需编写代码,为任何页面生成有效的 JSON-LD 结构化数据。从六种 Schema 类型中选择——Article、FAQPage、Product、Organization、LocalBusiness、BreadcrumbList——填写表单字段,工具输出经 Schema.org 标准验证、可直接粘贴的标记代码。复制输出内容粘贴到页面 `<head>` 即可解锁 Google 富媒体结果。
为多语言和多地区网站创建并校验 hreflang link 标签。生成器模式输出包含 x-default 的完整 `<link rel="alternate" hreflang="...">` 标签集,校验器模式检查现有标签的常见错误,如错误的语言代码(en-UK 而非 en-GB)、重复的 hreflang 值、缺少 x-default 声明,以及导致 Google 忽略整个 hreflang 集群的缺少自我引用标签问题。