7 ème leçon de notre guide du parfait référenceur. Merci à Gnoztik pour leur aide.
Dans notre précèdent article, nous avons traité des freins à lever pour améliorer l’indexation de votre site web. Une bonne indexation est indispensable avant même d’espérer un bon positionnement dans les moteurs de recherche.
Aujourd’hui, nous abordons les facteurs positifs, ceux qui facilitent l’indexation de votre site web. Ils sont toujours un atout supplémentaire mais ne sont pas incontournables pour la plupart des sites web. Ils répondent souvent à des problématiques particulières liées à l’emploi de technologies spécifiques (flash, javascript, etc …) ou encore aux sites web de plusieurs milliers de pages.
Notre premier volet concerne le fichier sitemap, en attendant le second volet au sujet du fichier robots.txt.
Le sitemap, à quoi ça sert ?
En novembre 2006, Google, Yahoo et Microsoft se sont mis d’accord pour supporter le protocole sitemaps. Le protocole sitemaps est un standard qui peut vous aider à soumettre l’ensemble de vos pages web aux moteurs de recherche.
Ask.com a récemment rejoint Google, Yahoo et Microsoft. Désormais les 4 moteurs de recherche majeurs supportent le protocole sitemaps.
De plus, les moteurs de recherche peuvent désormais détecter automatiquement votre fichier sitemap.
Le sitemap, c’est quoi ?
Les fichiers sitemap sont un moyen facile pour les webmasters d’informer les moteurs de recherche sur les pages de leurs sites web qui sont prêtes à être crawlées.
Le sitemap, ça ressemble à quoi ?
Dans sa forme la plus simple, un sitemap est un fichier XML qui liste les urls d’un site web avec en plus quelques meta-données renseignant chaque url :
- la date de sa dernière mise à jour,
- selon quelle fréquence change l’url,
- son importance relativement aux autres urls du site,
Ces informations aident les moteurs de recherche à crawler votre site web intelligemment.
Ce qui donne dans votre fichier XML sitemap.xml ,
Code XML :
< ?xml version=’1.0′ encoding=’UTF-8′>
< urlset xmlns=”http://www.google.com/schemas /sitemap/0.84″>
-
< url>
-
-
< loc > http://www.votre-site-web.com < /loc>
-
-
-
< lastmod >2007-06-03< /lastmod>
-
-
-
< changefreq >weekly< /changefreq>
-
-
-
< priority >1.0< /priority>
-
-
< /url>
-
< url>
-
-
< loc > http://www.votre-site-web.com /une-page-web.html < /loc>
-
-
-
< lastmod >2007-05-15< /lastmod>
-
-
-
< changefreq >monthly< /changefreq>
-
-
-
< priority >0.1< /priority>
-
-
< /url>
-
< url>
-
-
< loc > http://www.votre-site-web.com /une-autre-page-web.html < /loc>
-
-
-
< lastmod >2007-06-06< /lastmod>
-
-
-
< changefreq >dayly< /changefreq>
-
-
-
< priority >0.1< /priority>
-
-
< /url>
-
…
< /urlset>
< /xml>
Urlset
Le tag urlset précise la version du standard XML sitemap utilisée. La valeur renvoie à une url qui décrit le format utilisé dans le fichier courant. Dans la mesure où le standard peut évoluer, ce tag permet de faire cohabiter des anciennes versions du standard avec la dernière sans que cela ne pose problème. Il est donc inutile de mettre à jour son fichier sitemap lorsque le standard évolue, à moins de vouloir profiter des nouvelles fonctionnalités que celui-ci propose.
Ce tag est obligatoire.
Url
Le tag url regroupe l’ensemble des informations concernant une unique url ou page web. Il en faut donc un par url ou page web décrite dans le fichier sitemap (sitemap.xml).
Ce tag est obligatoire.
Loc
< a href = ” http://www.votre-site-web.com ” >http://www.votre-site-web.com< / a >
Le tag loc précise l’url courante, ici http://www.votre-site-web.com.
Ce tag est, bien entendu, obligatoire.
Lastmod
< lastmod >2007-06-03< / lastmod>
Le tag lastmod précise la date de dernière mise à jour de l’url courante.
Cette date doit nécessairement être au format AAAA-MM-JJ, ici 2007-06-03, soit le 3 juin 2007.
Ce tag est optionnel. Il est donc possible de s’en passer parfois ou même toujours.
Changefreq
< changefreq >weekly< / changefreq >
Le tag changefreq précise avec quelle fréquence change l’url courante.
Il peut prendre les valeurs always, hourly, dayly, weekly, monthly, yearly, never pour respectivement toujours (à chaque nouvel accès à l’url courante), chaque heure, chaque jour, chaque semaine, chaque mois, chaque année, ou jamais (pour les urls archivées), ici weekly, soit chaque semaine.
Ce tag est optionnel. Il est donc possible de s’en passer parfois ou même toujours.
Priority
< priority >1.0< / priority>
Le tag priority précise l’importance de l’url courante relativement aux autres urls du même site (priority = 0.1, 1.0, etc…). Sa valeur varie de 0.0 (priorité faible) à 1.0 (priorité forte).
Ce tag est optionnel. Il est donc possible de s’en passer parfois ou même toujours. Si il est absent alors la valeur par défaut est 0.5. dans le cas présent, la valeur 1.0 indique une forte priorité.
Le format XML sitemap est un standard qui facilite la création d’un fichier sitemap compréhensible par tous les moteurs de recherche.
Comment le fichier sitemap aide votre site web ?
Habituellement, les crawlers du web découvrent les nouvelles pages web à partir de liens faits par d’autres sites web. Le fichier sitemap permet aux crawlers qui supportent ce protocole de collecter en une fois toutes ces informations ainsi que les meta-données associées.
Le fichier sitemap vous permet d’informer les moteurs de recherche à propos des pages de votre site web. Il est souvent plus facile pour les moteurs de recherche de trouver toutes vos pages web si vous utilisez un fichier sitemap.
Comment les moteurs de recherche trouvent mon fichier sitemap ?
Les 4 principaux moteurs de recherche Google, Yahoo, Live/MSN et Ask vérifient régulièrement les fichiers robots.txt des sites web. L’ajout d’une ligne dans ce fichier suffit alors pour indexer votre fichier sitemap.
Ce qui donne dans votre fichier robots.txt.
Sitemap: http:/www.votre-site-web.com/sitemap.xml
Attention, le fichier robots.txt doit se trouver à la racine de votre site web.
http:/www.votre-site-web.com/robots.txt
Est-ce qu’un fichier sitemap améliore votre positionnement dans les moteurs de recherche ?
Utiliser le protocole sitemap ne garantit pas que vos pages web seront intégrées aux index des moteurs de recherche, mais cela facilite grandement et améliore la qualité du travail des crawlers.
Un sitemap aide les moteurs de recherche à trouver vos pages web mais ne vous aide pas à obtenir un meilleur positionnement dans les moteurs de recherche.
Quand les moteurs de recherche indexent vos pages, ils doivent trouver des pages au contenu optimisé et de bons backlinks. Les moteurs de recherche vous positionneront bien uniquement si vous avez les deux.
Le protocole sitemap peut vous aider à informer les moteurs de recherche à propos de vos pages web. Vous trouverez davantage d’informations à propos du nouveau standard sitemap sur le site web officiel du sitemap (http://www.sitemaps.org /protocol.php ).
14 commentaires pour "Le petit guide du parfait référenceur : leçon N°7"
très bien mais comment on fait pour uploader le fichier sitemap dans le répertoire de sa boutique ?
Trés bien ce petit tutoriel
Les guides sont pratiques mais sont trés éloignés de “comment faire avec zlio?”.
La preuve en est de la question ci-dessus de lucie.
Ces guides devraient être adapté pour les zlionautes…
v’la.
Bon web à tous.
il me semble que le fichier site map est creer automatiquement avec zlio
Des informations très utiles pour ceux qui on créé un site en intégrant leur boutique dedans ou une zlio zone. Mais une boutique qui flot par elle même à peux de chance de se voir appliqué certain conseil.
Très bon cette explication du site map ! Très utile merci
je repete la question de Lucie
comment on peut le mettre dans notre zlio ces bien beau mais je ne comprend pas se qu’il faut mettre dans la case “Balise META de vérification Google (facultatif) ”
Est je ne sais meme pas si ca a a voir avec le sitemap
D’accord avec lucie,
Très bien, bon conseil mais pas très utiles pour nos boutiques!
Dans vos paramètres avancées de nouveaux champs sont disponibles
ah si, c’est extrêmement intéressant. Pour l’instant on ne sort pas trop des sentiers battus et de ce que tout le monde sait déjà, mais ça viendra certainement…
on peut en effet facilement intégrer le fichier sitmap car zlio le crée automatiquement (merci zlio) allez voir dans les paramètres avancées (référencement)
pour moi c’est cette url :
http://dora.shopmarking.com/sitemap.xml
ensuite il faut ouvrir un compte sur google et allez dans outils pour webmaster. Entrez votre url, google vous dira quand il l’a visité en dernier…et vous pourrez lui donnez l’url de votre sitemap. Le tour est joué…vous pourrez aussi faire examiner votre site par google en rajoutant une balise META…
Merci à ZLIO pour l’intégration du fichier sitmap et du conseil de REMY
Merci de ces conseils, mais voila j’ai bien indiqué mon fichier sitmap et Google me donne 4 erreurs:”Google n’a pas pu explorer l’URL en raison d’une restriction dans le fichier robots.txt. Ce problème peut avoir plusieurs causes. Par exemple, votre fichier robots.txt peut interdire totalement l’accès de Googlebot à votre site ; il peut interdire l’accès au répertoire dans lequel se trouve cette URL ou interdire l’accès à cette URL en particulier. Bien souvent, il ne s’agit pas d’une erreur. Vous pouvez avoir configuré le fichier robots.txt de manière à nous empêcher d’explorer cette URL. Dans ce cas, il n’y a pas lieu d’intervenir. Nous continuerons de respecter les paramètres du fichier robots.txt pour ce fichier.”
Alors je fait quoi ? puisque que nous ne pouvons agir sur le fichier.
Ce n’est pas moi qui l’est bloqué ce fichier, alors qui ? Zlio! Pourquoi ?
Bonjour, comment fait on pour introduire le fichier robot.txt puisqu’on n’a pas accès au code de notre site ?
j’ai un réel problème car après que mes pages aient été indexées sur google j’ai fait une mauvaise manipulation en ayant changé l’url de ma boutique, j’ai tout de suite remis l’url exacte mais le lendemain je n’ai trouvé aucune de mes pages indexées, sur google outils webmaster on me dit que le robot a bloqué toutes mes url alors je suis bien embetée ! savez vous comment je peux introduire de nouveau le bon fichier robot ?
merci
Poster un commentaire !