Un bug joomla menant droit au blacklistage !


logo de Joomla!

Aujourd'hui j'ai pu me rendre compte qu'un bug Joomla avait failli mener mon site droit au blacklistage...

Un comble pour un référenceur...

Quel est-il ? Comment l'éviter ?


J'utilise la version joomla 1.5.14 sur un de mes sites, et pour rédiger mes articles, l'éditeur wysiwyg inclus dans Joomla natif.


J'ai voulu vérifier si l'article que j'avais tapé la veille contenait le nombre de mots que je trouve suffisant pour un bon référencement (environ 600).

Après avoir fait un copier-coller de la page de mon site sur Word, j'ai pu constater avec stupéfaction que mon texte faisait aux alentours de 1000 mots. En regardant de plus près le texte tapé, j'ai vu que le texte que je venais de coller contenait deux fois le même texte, en le répétant.


J'ai alors :

1/ examiné le code source de ma page : la page contenait en effet deux fois mon texte.

2/ examiné le texte de mon article : il ne contenait qu'une seule fois le texte

3/ examiné le code html de mon article (obtenu en cliquant sur html dans le wysiwyg) : effectivement, il contenait deux fois le texte.


Il y avait donc bel et bien deux fois le même texte sur ma page. Du point de vue du référencement, c'est grave, car les moteurs de recherche considèreraient certainement cela comme une duplication de contenu pratiquée pour gonfler artificiellement la taille de mes textes. Cela serait suffisant pour subir, non pas un blacklistage mais au moins une légère sandbox (disparition de mon site sur certains mots-clés). En tant que référenceur, cela aurait été le déshonneur !


Mais comment cela se fait-il que le texte en double n'apparaissait ni sur ma page ni sur mon article, seulement dans le code source de ceux-ci ?

Parce que, et c'est là l'aspect proprement machiavélique de ce bug, le deuxième texte avait été inséré de manière invisible, dans une div situé à moins 10000 pixels du bord gauche ! Le texte superflu n'apparaissait donc pas, parce qu'il sortait de l'écran.


Au problème de duplication de contenu s'ajoutait donc un second problème, rédhibitoire pour les moteurs de recherche : l'insertion de texte caché dans mes pages. On sait que cela est une manoeuvre classique de (mauvais) référenceur pour bourrer de mots-clés une page sans que ceux-ci apparaissent, dans l'espoir d'être plus visible sur ces mots-clés. Cette fois, la sandbox aurait été automatique, et je n'aurais plus eu qu'à abandonner mon métier ou me contenter de quelques campagnes de netlinking de temps à autres !


Voici une capture d'écran du code généré dans mon WysiWyg :


capture d'écran éditeur joomla


Comment ce bug est-il apparu ?


Je me souviens d'avoir utilisé Joomla avec Google Chrome, ce qui est déjà en soi source de bug. Par exemple : impossible de sauvegarder mes paramètres SH404SEF avec Chrome.

J'ai alors simplement rédigé un premier article sur mon bloc-note, et j'ai fait un copier-coller sur Joomla. Un premier copier-coller n'a rien donné, alors j'en ai fait un second. Puis j'ai sauvegardé, pour un résultat en apparence satisfaisant.


En apparence seulement, puisque je venais de donner en fait naissance à un monstre SEO : le bug du référencement Joomla !

Il était de ma responsabilité de contacter l'équipe Joomla et de leur signaler ce bug… qui est maintenant corrigé !