sitemap.xmlは、サイト内のURLを検索エンジンなどのクローラーに伝えるためのXMLファイルです。ページを必ず登録させるためのものではありませんが、公開しているURL、更新日、サイト構造を見つけやすくする手がかりになります。
ページ一覧を機械向けにまとめる
人が見るナビゲーションや記事一覧とは別に、クローラーが読むためのURL一覧を用意するのがsitemap.xmlの役割です。大きなサイト、更新が多いサイト、内部リンクだけでは見つけにくいページがあるサイトでは特に役立ちます。
urlsetとsitemapindex
小さなサイトではURLを直接並べるurlsetがよく使われます。URL数が多い場合や種類ごとに分けたい場合は、複数のsitemapを束ねるsitemapindexを使います。記事、固定ページ、画像、ニュースなどでファイルが分かれているCMSもあります。
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://example.com/articles/example</loc>
<lastmod>2026-05-08</lastmod>
</url>
</urlset>確認したいポイント
- sitemap.xmlが公開URLから取得できる
- XMLとして壊れていない
- locが正規URLと矛盾していない
- HTTPSサイトなのにHTTPのURLが混ざっていない
- 古いURLや404になるURLが残っていない
- lastmodが機械的に全ページ同じ日付になっていない
TOOLPOOLのサイトマップチェッカーでは、サイトURLやsitemap URLからsitemapを探し、URL数、lastmod、sitemapindexの構成、robots.txtからの参照をまとめて確認できます。