Les balises de référencement

Nommées "métas" ou "métas tags" par les fossoyeurs de la langue française, leur connaissance et la bonne compréhension de leur usage est indispensable à un bon référencement.

Beaucoup de choses sont dites à propos de ces balises ... mais les allégations, notamment dans des groupes de discussion, tendent finalement à provoquer des erreurs parfois difficiles à corriger par la suite. Contrairement à ce qui y est souvent affirmé, les balises de référencement sont encore utiles, surtout pour les annuaires, mais aussi pour les moteurs. Les premiers y trouvent, notamment, une description qui se retrouvera bien souvent telle quelle dans leurs listes à condition qu'elle soit bien rédigée et surtout exempte de fautes d'orthographe surnuméraires. Les seconds prennent encore en compte, du moins pour certains, l'occurrence des mots qui y sont insérés par rapport à ceux contenus dans le corps des pages.

Voici donc une liste des balises les plus courantes et leur usage :

Spécification du format et/ou de la norme utilisée :

<META http-equiv="Content-Type" content="text/html; charset=iso-8859-1">

Il s'agit ici de la norme utilisée sur les sites francophones, permettant de garder, notamment, les accents propres à l'alphabet latin qui se trouvent dans les textes des pages.


 Spécification de description du contenu du site OU de la rubrique visée :

<META NAME="description" CONTENT="Découverte de la nature et des animaux de la planète Mars">

Il ne faut pas dépasser une limite de 200 caractères pour la description du site ou de la rubrique : au delà de cette limite, la suite de la description n'apparaîtrait, de toute façon, pas sur les pages des moteurs de recherche. Comme vous pouvez, et je vous le conseille d'ailleurs, insérer d'autres balises dans vos autres pages, il est intéressant de réserver une partie de la description pour celles-ci, généralement les pages d'accueil d'éventuelles rubriques au sein même d'un seul et même site.


Spécification des mots-clés :

<META NAME="keywords" CONTENT="crapatodon, courzidon, taibaudidon, etc...">

L'extrême limite, dans ce domaine, est de 200 mots. Je vous conseille toutefois de rester dans un cadre plus restreint et de limiter la liste en fonction du nombre de caractères : 1000 caractères sont un maximum et doivent largement suffire pour obtenir un référencement correct. Il est important d'éviter la répétition des mêmes mots plus de 5 fois ! Certains sont, en effet, tentés d'ajouter le même mot en majuscules, avec ou sans pluriel, imaginant que le résultat sera favorable ... c'est faux ! La seule justification à la répétition peut être une série de mots ayant la même racine ou la même famille : des noms de villes ou villages par exemple (monvillage-sur-Seine, tonvillage-sur-Seine, etc) ou des noms propres. Il est toutefois inutile d'aller au delà du nombre précité car certains moteurs paraissent "bloquer" à 6, voire 5 répétitions ! Comme par ailleurs (comme pour la description) il vous est loisible, et même conseillé, d'installer des balises de référencement sur les pages d'accueil d'éventuelles rubriques différentes de votre site, voire sur toutes vos pages, cette limite n'est donc pas gênante.


Spécification d'indexage pour robots : cette balise indique aux robots des moteurs comment indexer la page et comment suivre éventuellement les liens.

<META NAME="robots" CONTENT="x"> ou x peut être :

- All : carte blanche au robot qui visitera la totalité des fichiers.

- None : pas d'indexage ni de suivi des liens : le robot se limite à la page d'accueil.

- Index : Uniquement indexage de la page d'accueil OU de la rubrique.

- NoIndex : pas d'indexage : au cas où un robot passerait "par hasard" sur le site.

- Follow : assure un suivi des liens ... à condition qu'ils ne soient pas brisés !

- NoFollow : ne réalise pas de suivi des liens.


Spécification de la langue utilisée sur les pages :

<META NAME="Content-language" CONTENT="french">


Spécification du nom de l'auteur :

<META NAME="Author" CONTENT="Docanski (pour ce site, évidemment !)">


Spécification de copyright s'il s'agit d'un site comportant des éléments couverts par droits d'auteur :

<META NAME="Copyright" CONTENT="Nom du copyright">


Spécification de la page de contact ou de l'adresse Email :

<META HTTP-EQUIV="Reply-to" CONTENT="monjolisite.com/formulaire.html">

ou

<META HTTP-EQUIV="Reply-to" CONTENT="moi@monjolisite.com">

ou

<META HTTP-EQUIV="Reply-to" CONTENT="moi@monhebergeur.com">

Spécification de publication ou distribution :

<META NAME="Distribution" CONTENT="x"> ou x peut être :

- Global : pour une diffusion large.

- Local : pour une diffusion restreinte.


Spécification du type de public visé par le site (protection éventuelle de publication pour des publics non avertis ou sensibles :

<META NAME="Rating" CONTENT="x"> ou x peut être :

- General : tout public

- Mature : public averti

- Restricted : site privé (généralement accessible par mot de passe uniquement)


Spécification de l'éditeur utilisé pour la réalisation des pages :

<META NAME="Generator" CONTENT="Mon éditeur de pages HTML">


Spécification de rafraîchissement automatique de la page affichée, utilisée pour une redirection, par exemple :

<META HTTP-EQUIV="Refresh" CONTENT="durée en millisecondes; URL=http://www.monsiteencoreplusjoli.com/">

Il est bon, dans ce cas, d'ajouter un bouton avec lien ou un lien simple que le visiteur pourra activer en cas de problème ou de lenteur de rafraîchissement : on n'est jamais trop prudent !


Spécification de non mise en cache des pages affichées ou indexées:

<META HTTP-EQUIV="Pragma" CONTENT="no-cache">


Spécification de la durée éventuelle (si limitée dans le temps) du site ou des pages :

<META HTTP-EQUIV="expires" CONTENT="31 février 2345. 23 :59 :59 GMT">


Spécification de la fréquence de revisite du moteur d'indexation :

<meta NAME="REVISIT-AFTER" CONTENT="1 month">

Inutile d'indiquer moins : les moteurs n'obéiront pas à une telle invite. Le mieux est d'indiquer un intervalle de revisite correspondant à celui de vos mises à jour : si vous forcez le moteur à revenir et qu'il ne "constate" pas de modification significative dans l'ensemble du site (notamment par le "poids" de celui-ci), il risque de se régler lui-même sur une fréquence limitée à un an ! Eh, oui ! les temps changent et la qualité d'automatisation de certains moteurs aussi !

Il existe d'autres balises mais dont l'usage, très limité, est plutôt destiné à des applications très spécifiques.

Il faut également savoir que si ces balises et la qualité de celles-ci sont des éléments importants pour le référencement, elles ne sont pas tout : beaucoup de moteurs (et surtout, évidemment, les annuaires !) vont "fureter" à l'intérieur des pages et les mots repris dans leurs textes ont donc autant d'importance. C'est souvent l'occurrence de ceux-ci avec ceux repris dans les balises qui assureront une bonne indexation ! Tricher ne sert à rien non plus : répéter volontairement des mots-clés en texte clair sera considéré comme du "spam". Dans le passé, certains moteurs ne "voyaient" pas ce genre de pratique lorsque la couleur de la police de caractères était la même que celle du fond de page. Ce temps-là est révolu ... Soyez donc "honnête" et dites-vous bien qu'une bonne indexation est le plus souvent la récompense d'un bon site !

Les conditions qui précèdent ayant été réunies, il en reste deux auxquelles les moteurs de recherche sont de plus en plus sensibles : la qualité d'écriture du code source mais aussi et surtout la structure des pages. L'élément fondamental de cette dernière est la bonne utilisation des balises du langage (X)HTML, notamment celles servant à insérer les titres et sous-titres dans les pages : la série des < h >. Correctement structurée, une page doit toujours comporter au moins un titre et, si utile ou nécessaire, des sous-titres. Le premier sera avantageusement écrit dans une balise < h1 > et les suivants dans leur ordre normal d'importance. Pour obtenir un résultat optimal, il est évident que ces titres doivent être "parlants" : ce sont le plus souvent ceux-ci qui constitueront la liste des mots-clés de votre référencement dans les bases de données des moteurs ! Les textes alternatifs ( alt="texte alternatif significatif" ) des images sont, eux aussi, des mots-clés potentiels. Ne les négligez pas ! Lorsque la rédaction de vos pages sera terminée, n'omettez surtout pas de les faire précéder d'une DTD valide et, pourquoi pas, faites-les même valider directement par le W3C : deux précautions valent mieux qu'une ! Vous trouverez l'adresse de ce service dans la page des "adresses utiles" accessible en retournant au sommaire général du site.

Si vous avez observé toutes ces recommandations, je gage que votre "oeuvre" sera très bien représentée dans le classement des moteurs et annuaires.

retour