Un fichier sitemap permet d’indiquer explicitement aux moteurs d’indexation les pages à prendre en compte sur un site Web. Vu de loin, c’est en quelque-sorte le plan ou sommaire de votre site que vous donnez aux robots.

Mais un sitemap est également un peu plus qu’un sommaire, puisqu’en plus des URL, seront ajoutées dans ce fichier des meta-informations sur les pages comme la date de dernière mise à jour ou l’importance de la page relativement aux autres pages du site.

Sur un site comprenant des niveaux imbriqués de pages et de sous pages, cela permet d’être sûr que les URL les moins accessibles seront repérées lors du crawl de votre site. Par contre, même si cela augmente les chances, ce n’est pas non plus une garantie d’indexation de tous vos contenus ! La présence d’un sitemap est malgré tout une des bases pour le bon référencement et la bonne indexation des contenus de votre site.

Structure d’un sitemap

Il existe une norme (ou protocole) qui défini la structure d’un fichier sitemap. Il peut être décrit en XML ou être au format TXT. Nous allons voir ici la version XML.

La balise qui encadre toutes les informations est la balise URLSET. Elle est obligatoire et référence le protocole officiel.

Ensuite, le sitemap est constitué de la liste des pages du site web (balise URL parent pour chaque entrée de la liste) avec à chaque fois les informations suivantes :

  • URL de la page : balise LOC obligatoire
  • date de dernière mise à jour : balise LASTMOD facultative
  • périodicité indicative de mise à jour de la page (de hourly à yearly +always + never) : balise CHANGEFREQ facultative
  • indicateur d’importance relative de la page dans le site : balise PRIORITY facultative
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
    <loc>https://creanet44.fr/</loc>
    <lastmod>2019-04-23</lastmod>
    <changefreq>monthly</changefreq>
    <priority>1</priority>
</url>
<url>
    <loc>https://www.creanet44.fr/comment-choisir-son-theme-wordpress/</loc>
    <lastmod>2014-03-20</lastmod>
    <changefreq>monthly</changefreq>
    <priority>1</priority>
</url>
...
</urlset>

 Générer un sitemap pour son site WordPress

Il existe plusieurs moyens de créer ce fichier :

  • on peut l’écrire à la main
  • on peut le générer sur un site tiers et le placer soi même sur son site (téléchargement du fichier par FTP par exemple). Attention, avec cette méthode, il faudra penser à regénérer le fichier sitemap à chaque nouvelle modification du site Internet.
  • on peut utiliser un plugin wordpress (comme Google XML Sitemaps) qui se chargera de générer le sitemap dynamiquement, au prix d’un paramétrage initial pour expliciter au plugin les éléments à intégrer ou à exclure. C’est généralement par ce biais que nous apprenons à ajouter un sitemap lors d’une de nos formations WordPress.

Indiquer la présence d’un sitemap aux robots

Le fichier sitemap est souvent attendu à la racine du site :

http://[www].[mon-nom-de-domaine].[monextension]/sitemap.xml

Mais il peut arriver également que ce fichier porte un autre nom ou ne soit pas stocké  à la racine du site. On va dans ce cas utiliser le fichier robotx.txt pour indiquer le chemin du sitemap aux robots. C’est un champ « Sitemap » qui permet cette fonctionnalité.

Accélérer l’indexation : soumettez votre sitemap à Google

Lorsque vous créez un site Internet, le processus d’indexation par Google des pages peut être long et surtout paraître dépendant du bon vouloir de votre moteur préféré.

Qu’à cela ne tienne, il vous suffit dans ce cas de soumettre à Google, via les Webmaster Tools, votre fichier sitemap.xml. Une fois votre sitemap soumis, vos pages seront parcourus dans les meilleurs délais. Vous disposez même de statistiques comparant les pages présentes dans l’index Google et les pages présentes dans le sitemap.xml