Google Images…
J’ai réalisé en 2008 que beaucoup des internautes qui trouvaient mes sites villiard.com et funny-potato.com le faisaient en cherchant des images dans Google. Cette info est difficile à avoir avec Google Analytics, je l’ai donc appris à la dure.
Comment ça ? Quand Google a désindexé toutes mes images, en septembre 2008. Ça s’est fait sur quelques jours, et je me demandais bien pourquoi mon nombre de visiteurs baissait constamment. Après quelques investigation, j’ai réalisé que le problème était que mes images et photos n’étaient plus « trouvables » par Google. Évidemment, le stress augmentait à chaque jour que le nombre de mes images disparaissaient de Google. Je n’étais pas le seul dans cette situation, mais on était pas nombreux. Les discussions les plus intéressantes auxquelles j’ai participé à ce sujet ont eues lieu sur WebmasterWorld, le meilleur des forums sur les engins de recherche, sur le « thread » juste ici. Finallement, les images se sont réindexées peu à peu, pour toutes revenir, sans que je n’aille à faire quoi que ce soit.
Je n’ai finalement jamais compris ce qui s’était passé.
Pour voir combien votre site a d’images indexées, la commande à faire dans Google est « site:www.example.com » à partir de l’onglet de Google Images. Attention toutefois, n’oubliez pas que les résultats de cette commande présentent aussi vos photos sur d’autre sites, parce que elles ont été « hotlinkées ». Mais ça, c’est un autre point dont je pourrai vous parler un autre jour…
Pourquoi je parle de ça aujourd’hui ? Et bien parce que le problème est revenu 1 an plus tard, le 25 septembre 2009. Cette fois, J’étais prêt, et j’ai vite su ce qui se passait, et presque à l’heure exacte. Peu à peu, Datacenter par Datacenter, mes images se désindexaient de Google. Encore une fois, d’autres discussions sur WebMasterWorld, juste ici cette fois. Encore une fois, ça affectait peu de gens. M’y connaissant pas mal plus en SEO pour les images cette années, j’ai investigué plus à fond (Aucun SEO à qui j’ai parlé ne s’y connaît bien en Google Images, ça semble rare comme expertise !) .
Voici les investigations faites :
- Robots.txt . Mon robots.txt n’était pas en problème. OK de ce côté là donc.
- Vérification des logs pour voir passer le robot des images de Google. Il s’appelle Googlebot-Image. Pas de problème de ce côté, le robot passait régulièrement sur mon site, et le serveur retournait un code de retour valide. J’avais déjà entendu dire que des sites avaient été désindexé de Google parce que leur hébergeur avait bloqué les robots qui prenaient trop de bande passante.
. Mais bon, ce n’était pas le cas, heureusement. - Google Webmaster Tools. Pas de message de problème venant de Google n’y était, et pas d’info indiquant que le robot avait des problèmes à indexer les images. Malheureusement, il n’y a pas d’info spécifique pour Googlebot-Image selon ce que j’ai pu comprendre.
- L’option Safe Search ne changeait pas le nombre d’images indexées. Donc le problème n’était pas que Google trouvait maintenant mes images « osées ».
Si le sujet vous intéresse, voici quelques liens utiles :

21 octobre 2009 à 9:18
et fialement, tu as une conclusion ou tu as toujours pas d’idée ce ce qui s’est passé
en passant, héhé c’est pas bête comme idée d’utiliser google image pour trouver qui nos «hotlink» nos images…
21 octobre 2009 à 14:03
Pas de conclusion Guillaume, à part que le problème étasit pas de mon côté, mais plutôt des changements dans Google. Bug de leur côté, Refresh de data, ou autre, je saurais pas dire…
8 février 2012 à 4:55
Bof, la conclusion est assez simple : Googlebot-Image ne fonctionne pas et n’a jamais tourné proprement. Le safesearch est une foutaise, j’ai vu des tableaux de chiffres classés X et des scènes de hardcore bypasser tous les filtres.
Le gens de chez Google sont des rigolos qui adoptent la méthode Coué : je les cloaque sans vergogne depuis des années sans qu’ils soient foutus de voir quoi que ce soit. Je me suis même offert le luxe d’un « bombing » à partir d’une petite dizaine de noms de domaines seulement et le résultat est à mourir de rire…
Mieux, j’ai ouvert un compte pour analyser ce bombing et à cette occasion, j’ai pu constater que ces andouilles ne sont toujours pas capables d’intégrer les mots composés dans la sémantique des mots-clés (mots-clefs = un mot clef « mots » et un autre « clefs » avec un classement différent).
Bon, personne ne m’en voudra si j’oublie de signer ;^_^)