sitemap.xml é um arquivo XML que lista URLs de um site para buscadores e crawlers. Ele não garante indexação, mas ajuda crawlers a encontrar URLs públicas, sinais de atualização e a estrutura do site.
Uma lista de URLs legível por máquinas
A navegação é feita para pessoas. Um sitemap é feito para crawlers. Ele é útil em sites grandes, sites atualizados com frequência e páginas difíceis de descobrir apenas por links internos.
urlset e sitemapindex
Sites pequenos costumam usar urlset para listar URLs diretamente. Sites maiores podem usar sitemapindex para apontar para vários arquivos sitemap.
- O sitemap pode ser obtido por URL pública
- O XML pode ser parseado
- loc combina com a URL canônica
- Um site HTTPS não lista URLs HTTP por engano
- Não restam URLs antigas ou 404
TOOLPOOL Sitemap Checker pode partir da URL do site ou do sitemap, encontrar sitemaps, contar URLs e revisar lastmod, sitemapindex e referências no robots.txt.