운영 // Articles

sitemap.xml이란?

검색 엔진에 URL 목록을 전달하는 sitemap.xml의 역할, 종류, 확인 포인트를 정리합니다.

sitemap.xml은 사이트 안의 URL을 검색 엔진과 crawler에 알려 주기 위한 XML 파일입니다. 색인을 보장하는 파일은 아니지만, 공개 URL과 업데이트 단서, 사이트 구조를 찾기 쉽게 해 줍니다.

기계가 읽는 URL 목록

사람이 보는 내비게이션과 달리 sitemap은 crawler가 읽기 위한 목록입니다. 규모가 큰 사이트, 업데이트가 잦은 사이트, 내부 링크만으로 찾기 어려운 페이지가 있는 사이트에서 특히 유용합니다.

urlset과 sitemapindex

작은 사이트는 URL을 직접 나열하는 urlset을 자주 씁니다. URL이 많거나 종류별로 나누어야 하는 경우에는 여러 sitemap을 묶는 sitemapindex를 사용합니다.

  • sitemap을 공개 URL에서 가져올 수 있음
  • XML을 파싱할 수 있음
  • loc가 canonical URL과 맞음
  • HTTPS 사이트에 HTTP URL이 섞이지 않음
  • 오래된 URL이나 404 URL이 남아 있지 않음

TOOLPOOL 사이트맵 체커는 사이트 URL 또는 sitemap URL에서 sitemap을 찾고 URL 수, lastmod, sitemapindex 구성, robots.txt 참조를 함께 확인합니다.