GoogleSEO

Google veut indexer les CSS et Javascript

Par Guillaume Thavaud - Publié le 28 octobre 2014

Dans un article publié sur le blog Google pour les webmasters, Pierre Far explique que Google est capable d’analyser les CSS et Javascript, et qu’il faut qu’il ait accès à toutes les ressources :

Pour optimiser l’affichage et l’indexation de vos pages et de votre site, vous devez désormais autoriser l’accès de Googlebot aux fichiers JavaScript, CSS et image que vous utilisez. Le blocage de l’exploration des fichiers JavaScript ou CSS dans le fichier robots.txt de votre site nuit directement à la qualité de l’affichage et de l’indexation de votre contenu par nos algorithmes. Cela peut avoir un impact négatif sur le classement de votre site.

Tout ceci ressemble un peu à un ultimatum : livrez-nous les fichiers où nous déclassons votre site ! Mais pourquoi donc tant d’intérêt pour ces fichiers ?

inspecteur-loupe

Les CSS et JavaScripts sont des fichiers qui vont impacter la mise en forme du contenu et générer différents évènements sur la page (par exemple un menu déroulant, une fenêtre pop up, un envoi de formulaire…). Ce sont des éléments qui a priori n’ont pas d’intérêt pour le référencement naturel, puisque c’est le contenu qui prime (c’est à dire le texte qui est proposé aux internautes).

Laisser indexer le CSS et le JS : est-ce vraiment une bonne idée ?

Pourtant ces fichiers techniques sont scrutés avec attention par Google, et il aimerait bien savoir ce qu’il y a dedans. C’est justifié dans le contexte de la lutte contre les techniques de triche. Par exemple vous pouvez avoir un style CSS qui masque du contenu spammant aux internautes, ce qui est une technique sanctionnée par Google.

Autre point très intéressant pour Google, la vitesse à laquelle s’affiche le contenu d’une page web, vitesse qui dépend entre autres de tous les Javascripts et CSS qui moulinent (et qui peuvent rendre le temps de réponse beaucoup trop long).

Néanmoins, cela soulève quelques questions de confidentialité….

Imaginons par exemple que j’utilise un outil de tracking expérimental et que je ne souhaite pas que Google mette son nez dedans ? Ou imaginons que j’ai passé beaucoup de temps à créer des effets dynamiques en CSS et que je ne souhaite pas donner mon code au grand public ? Ce qui est indexé par Google risque tôt ou tard de se retrouver dans les résultats de recherche !

Jusqu’en 2013, Google possédait un service de recherche spécialisé, baptisé Code Search, qui permettait aux développeurs de trouver du code open source sur internet. C’est donc quelque chose de tout à fait réalisable (voir exemple ci-dessous)

recherche-code-google

 

Des CSS et JS bloqués dans WordPress

Les webmasters le savent, dans un robots.txt de base lié à un site wordpress, on bloque les répertoires wp-includes et wp-admin, de cette façon-là :

User-agent : * Disallow: /wp-admin/ Disallow: /wp-includes/

Or il y a pas mal de CSS et JS à l’intérieur de ces répertoires. Par exemple il y a bien une centaine de feuilles de style qui servent à mettre en forme l’interface d’administration WordPress (indépendamment du thème utilisé) : une paille !

Tous les utilisateurs de WordPress devraient donc déverrouiller leur site, pour permettre à Google de fouiner partout… J’imagine que le même problème se pose pour d’autres CMS, qui bloquent une partie des fichiers, pour des raisons de sécurité.

C’est donc une mise à jour des consignes Google qui est un peu problématique pour le moment !