運用 // 記事

sitemap.xmlとは何か

検索エンジンにURL一覧を伝えるためのsitemap.xmlについて、役割、種類、確認ポイントを整理します。

sitemap.xmlは、サイト内のURLを検索エンジンなどのクローラーに伝えるためのXMLファイルです。ページを必ず登録させるためのものではありませんが、公開しているURL、更新日、サイト構造を見つけやすくする手がかりになります。

ページ一覧を機械向けにまとめる

人が見るナビゲーションや記事一覧とは別に、クローラーが読むためのURL一覧を用意するのがsitemap.xmlの役割です。大きなサイト、更新が多いサイト、内部リンクだけでは見つけにくいページがあるサイトでは特に役立ちます。

urlsetとsitemapindex

小さなサイトではURLを直接並べるurlsetがよく使われます。URL数が多い場合や種類ごとに分けたい場合は、複数のsitemapを束ねるsitemapindexを使います。記事、固定ページ、画像、ニュースなどでファイルが分かれているCMSもあります。

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://example.com/articles/example</loc>
    <lastmod>2026-05-08</lastmod>
  </url>
</urlset>

確認したいポイント

  • sitemap.xmlが公開URLから取得できる
  • XMLとして壊れていない
  • locが正規URLと矛盾していない
  • HTTPSサイトなのにHTTPのURLが混ざっていない
  • 古いURLや404になるURLが残っていない
  • lastmodが機械的に全ページ同じ日付になっていない

TOOLPOOLのサイトマップチェッカーでは、サイトURLやsitemap URLからsitemapを探し、URL数、lastmod、sitemapindexの構成、robots.txtからの参照をまとめて確認できます。