Operações // Artigos

O que é sitemap.xml

Uma explicação prática de sitemap.xml, sitemap index, entradas de URL e verificações antes de publicar.

sitemap.xml é um arquivo XML que lista URLs de um site para buscadores e crawlers. Ele não garante indexação, mas ajuda crawlers a encontrar URLs públicas, sinais de atualização e a estrutura do site.

Uma lista de URLs legível por máquinas

A navegação é feita para pessoas. Um sitemap é feito para crawlers. Ele é útil em sites grandes, sites atualizados com frequência e páginas difíceis de descobrir apenas por links internos.

urlset e sitemapindex

Sites pequenos costumam usar urlset para listar URLs diretamente. Sites maiores podem usar sitemapindex para apontar para vários arquivos sitemap.

  • O sitemap pode ser obtido por URL pública
  • O XML pode ser parseado
  • loc combina com a URL canônica
  • Um site HTTPS não lista URLs HTTP por engano
  • Não restam URLs antigas ou 404

TOOLPOOL Sitemap Checker pode partir da URL do site ou do sitemap, encontrar sitemaps, contar URLs e revisar lastmod, sitemapindex e referências no robots.txt.