sitemap.xml es un archivo XML que lista URLs de un sitio para buscadores y crawlers. No garantiza indexación, pero facilita descubrir URLs públicas, señales de actualización y la estructura del sitio.
Una lista de URLs legible por máquinas
La navegación está pensada para personas. Un sitemap está pensado para crawlers. Es útil en sitios grandes, sitios que cambian con frecuencia y páginas difíciles de descubrir solo con enlaces internos.
urlset y sitemapindex
Los sitios pequeños suelen usar urlset para listar URLs directamente. Los sitios grandes pueden usar sitemapindex para apuntar a varios archivos sitemap.
- El sitemap se puede obtener desde una URL pública
- El XML se puede parsear
- loc coincide con la URL canónica
- Un sitio HTTPS no lista URLs HTTP por error
- No quedan URLs antiguas o 404
TOOLPOOL Sitemap Checker puede partir de una URL de sitio o de sitemap, encontrar sitemaps, contar URLs y revisar lastmod, sitemapindex y referencias en robots.txt.