Tests de référencement SEO

Stop le blabla, on veut des preuves !

Tests SEO | Mots-clés 1

Préambule : de la difficulté à tester les mots-clés en l’absence d’information complète

Les tests SEO sur les mots-clés comptent parmi les plus difficiles à réaliser.

Pourquoi ? Parce que personne n’a de sources fiables.

En effet, le principal moteur de recherche est Google, avec souvent plus de 90% de part de marché, or pour savoir sur quels mots-clés un site et une page rankent sur Google, il faut inscrire le site à la Google Search Console, et celle-ci ne nous donne jamais la totalité des requêtes ayant abouti à des clics.

Voici quelques exemples : je prends 4 pages différentes sur divers sites, je regarde combien elles ont reçu de clics d’après Google Search Console et combien de requêtes Google nous révèle :

PageClics selon Google Search ConsoleRequêtes révélées dans Google Search Console
Page 132 clics14 requêtes
Page 211 clics4 requêtes
Page 37 clics2 requêtes
Page 422 clics3 requêtes
Total des 4 pages72 clics23 requêtes

On n’a donc en moyenne pas plus de 30% des requêtes ayant généré du trafic depuis Google. A propos des 70% de clics restants, Google ne nous donne pas la requête qui a provoqué ce clic.

Les outils SEO comme Ahrefs, Semrush etc, ne nous seront d’aucune aide dès lors qu’ils n’ont absolument aucune donnée sur les sites qu’on teste – ils ne font que reconstituer par des moyens statistiques des données qu’ils n’ont pas ; leurs données peuvent être utiles pour diverses opérations SEO mais pas pour réaliser des tests fiables sur les mots-clés, ni même sur d’autres concepts (leur évaluation du trafic est souvent lourdement approximative).

Bref, notre seule source d’information concernant les données relative aux mots-clés est Google, et ses données sont majoritairement incomplètes.

On ne peut pas se consoler en se disant : « ok, Google nous donne les principaux mots-clés cherchés, et il ne nous donne pas les requêtes de longue traîne, ou rares, ou fautives… » : c’est possible, mais rien ne permet de le prouver ni de le tester. Google ne nous dit pas précisément comment fonctionne sa Console, ni pourquoi il nous cache une bonne partie de ce qui nous intéresse.

(On peut aussi faire l’hypothèse, invérifiable, que le géant américain nous prive de données précisément pour nous empêcher de faire du SEO et donc de manipuler ses résultats de recherche… mais là encore, rien ne permet de valider cette hypothèse.)

J’ai néanmoins pu réaliser des études (= analyse et interprétation de données existantes) et des tests (= changement de paramètres ou création d’un dispositif, puis observation, analyse et interprétation des données) pour en savoir plus sur les mots-clés malgré le « brouillard » généré par Google.

Etude n°1.1 : quel rôle joue la densité des mots-clés d’une requête dans un texte ?

SiteSites les mieux classés sur un mot-clé
Type de siteSites de services informatiques
Type de pages concernéesInformationnelles ou commerciales
Date de l’étudeOctobre 2022
Déroulement de l’étudeJ’ai essayé de savoir si on peut découvrir des informations sur la densité de mot-clés, à partir des résultats de Google.

La densité est le pourcentage d’occurrence d’un mot dans un volume de texte donné. Ainsi, si un mot est présent 1 fois dans un texte de 100 mots, sa densité est de 1%.

J’ai donc étudié les premiers résultats quand on cherche le mot-clé « création de site Internet pour salon de coiffure« .

J’ai découpé cette expression-clé en mots-clés : coiffeur, salon de coiffure, création de site, site Internet.

J’ai compté le nombre d’occurrences de chacun de ces mots, et leur densité en pourcentage par rapport au total des mots du texte.

Dans le tableau suivant, la colonne « Page » liste 6 pages apparaissant dans le top 10 sur cette requête, dans l’ordre donné (c’est à dire que la page A arrive devant la page B dans les résultats Google, et ainsi de suite).

Les colonnes suivantes représentent le nombre d’occurrences de chaque mot-clé, et leur densité dans le texte.

PageNombre de motsCoiffeur
DensitéSalon de coiffureDensitéCréation de siteDensitéSite InternetDensité
A1100121%151.5%10.1%151.4%
B3800421%190.5%230.4%652%
C2000150.75%241.2%40.2%311.5%
D240030.01%00%20.1%110.4%
E40082%10.25%20.5%140.3%
F100040.4%151.5%80.8%230.25%

La densité oscille entre 0 et 2%, avec une moyenne autour de 0.75%.

Faut-il conclure que 0.75% – soit 1 répétition du mot-clé tous les 150 mots – serait une densité idéale ?

Probablement pas, car trop d’autres facteurs jouent dans le classement de ces pages, et le critère de densité des mots-clés principaux n’est probablement qu’un critère parmi de nombreux autres.

Néanmoins, ce chiffre peut nous servir d’indicateur grossier.

Le résultat concernant la page D est intéressant : plutôt longue (2400 mots), elle ne mentionne presque pas les mots-clés recherchés :

  • 3 fois coiffeur
  • 0 fois salon de coiffure
  • 2 fois création de site
  • 11 fois site Internet

Et pourtant, cela ne l’empêche pas de ranker dans le top 10. Son contenu est pertinent même s’il ne coïncide pas exactement avec les mots-clés de la requête. Je pense qu’on peut y voir une trace des composants de l’algorithme de Google qui, comme BERT, s’occupent de créer des correspondances par synonymie entre les mots.

Le résultat concernant la page E est intéressant aussi : très courte (400 mots), il semble que sa forte densité sur le mot coiffeur ne l’aide pas à dépasser les 4 pages qui la précèdent dans les résultats. Evidemment, d’autres facteurs (autorité, volume de texte…) expliquent probablement sa place.

Résultat de l’étudeConclusion un peu vague, mais c’est toujours ça : la densité sémantique joue probablement un rôle, mais pas au point de faire qu’une page qui ferait du bourrage de mots-clés (cf la vieille technique SEO du keyword-stuffing qui marchait dans les années 2000) dépasserait ses concurrentes en dépit des autres facteurs de classement.

Etude n°1.2 : quel rôle jouent les mots-clés d’un titre H1 dans les requêtes provoquant des impressions sur Google ?

Type de siteSite informationnel à propos de décoration et de design de meubles.
Type de pages concernéesPage informationnelle
Date de début de l’étude25 décembre 2023
Déroulement de l’étudeJ’étudie les données Google Search Console de la page

Fauteuil Louis XV relooké : néo-classique, abstrait, kitsch, fantaisie, seventies…

Sur les 12 mois précédant l’étude, Google a affiché ma page dans ses résultats de recherche à partir de 635 requêtes différentes.

Si on étudie les 20 requêtes ayant généré le plus d’impressions, on constate que l’essentiel des mots-clés proviennent du titre H1 et sont à base de « fauteuil Louis XV » ou de variantes synonymes (15 au lieu de XV, chaise ou siège au lieu de fauteuil) :

RequêteClicsImpressionsPosition
fauteuil louis xv182278704.3
fauteuil louis 151740932.9
fauteuil louis xv relooké9329981.1
fauteuil louis xv moderne3924211.4
fauteuil bergère relooké8618061.1
fauteuils louis xv416206.7
fauteuil style louis xv1015088.1
fauteuil louis411564.3
chaise louis xv moderne211106.4
fauteuil louis 15 moderne159921.3
fauteuil louis philippe relooké249334.8
chaise louis 15190320.2
fauteuil louis 15 relooké267211
fauteuil relooké57161.3
chaise louis xv271524.9
fauteuil style louis 15067910.5
fauteuil louis xv design26301.5
tissu moderne pour fauteuil louis xv266211.4
siege louis xv049126.7
fauteuil louis xiii relooké54618,7

Encore plus clairement :

  • 382 mots-clés des mots-clés retenus contiennent le mot-clé « fauteuil »
  • 322 mots-clés contiennent le mot-clé « louis »
  • 159 mots-clés contiennent le mot-clé « XV »

Cependant, on remarque aussi que certains mot-clés de certaines de ces requêtes ne sont pas dans le H1 : par exemple les mots

  • chaise louis xv
  • chaise louis 15
  • siege louis xv
  • tissu moderne pour fauteuil louis xv
  • fauteuil louis xiii relooké

Où Google a-t-il trouvé ces mots-clés ?

Le mot-clé « chaise louis xv » n’est cité qu’une seule fois dans tout le texte ; sa variante « chaise louis 15 » n’est jamais citée. Pour expliquer la présence de ce mot-clé comme déclencheur d’impressions de cette page, on peut considérer probable qu’un des algorithmes d’analyse sémantique de Google, notamment BERT ou ses évolutions, ait identifié le terme chaise comme étant à peu près synonyme du terme fauteuil, et donc ces 2 mots-clés ne seraient que des variantes de mots-clés du H1, confirmant la règle.

Le mot-clé « siege louis xv » n’est lui aussi cité qu’une seule fois dans tout le texte, dans la légende d’une image. La même explication par la synonymie me semble plausible.

Le mot-clé « tissu moderne pour fauteuil louis xv » n’est jamais cité dans le corps de l’article, mais est cité 2 fois dans les meta descriptions / extraits d’articles similaires présentés à la suite de l’article.

Si je poursuis l’analyse des mots-clés, je constate que la plupart des mots retenus par Google sont des synonymes des mots utilisés dans le titre : par exemple les mots « bergère » et « crapaud », synonymes de fauteuil, ou encore les termes « louis philippe » ou « empire », possibles variantes du terme « louis XV » comme compléments statistiquement fréquents du terme « fauteuil ».

Si j’élimine de la liste des 635 mots-clés tous ceux qui contiennent un des mots du titre H1, à savoir « fauteuil », « fauteuils », « louis XV », « louis », « relooké », « kitsch », « seventies », « fantaisie », « abstrait », « néo-classique », alors il ne reste plus que 54 mots-clés : donc, moins de 10% des requêtes se font sur des mots qui ne sont pas contenus dans le titre H1.

Et si, sur cette liste, j’élimine ceux qui contiennent des synonymes des mots du H1, à savoir « bergere », « bergère », « chaise », « 15 », cette liste fond jusqu’à ne plus compter que 18 mots-clés avec peu d’impressions.

Résultat de l’étudeAu final, il apparait clairement dans la liste des 635 mots-clés que la très grande majorité d’entre eux proviennent directement du titre H1.

Ce constat réduit en miettes la théorie de la densité sémantique et du SEO sémantique – qu’on retrouve pourtant savamment exposée sur divers sites, et qui est à la base de tout un courant du SEO, illustré entre autres par Koray Tuğberk Gübür. Celui-ci affirme, en se basant notamment sur les études des brevets de Google par Bill Slawski, que Google fait une analyse sémantique très approfondie des pages web, et qu’il est possible de bien ranker en maximisant la pertinence des mots grâce à certaines techniques d’écriture.

Or, le fait qu’on puisse constater, simplement en observant les données de la Google Search Console, que Google ne prend PAS les mots-clés déclenchant des impressions sur l’ensemble du texte de la page, mais presque uniquement dans le titre H1, réfute la théorie sémantique.

J’ai l’habitude d’inspecter les données de la Google Search Console, et ce que je viens de démontrer se confirme encore et encore, quelle que soit la page, quel que soit le site et son domaine d’activité.

Test n°1.3 : quel est le lien entre les mots-clés d’un titre H1 et les autres mots-clés de la page ?

Type de siteSite informationnel à propos de décoration et de design de meubles.
Type de pages concernéesArticle informationnel
Date de début du test3 juillet 2023
Déroulement du testS’il est vrai, comme je viens de le démontrer dans l’étude 1.2, que Google prend les mots-clés qu’il fera correspondre aux requêtes des internautes, dans le titre H1 et non pas dans l’ensemble du texte ou du HTML d’une page donnée, on ne peut pas pour autant en conclure que ce texte ne sert à rien, ou qu’on pourrait y raconter n’importe quoi et que les mots-clés du titre suffiraient à faire ranker (= bien positionner dans les résultats de Google) un tel article.

J’ai une preuve que le texte d’une page est utilisé pour confirmer la pertinence et la force des mots-clés du titre H1.

Pour tester, j’ai procédé cette fois par diminution de la densité de mots-clés sur une page qui ranke sur ces mots-clés.

Il s’agit en l’occurrence d’un article intitulé

Chaise cantilever | Fauteuil cantilever | Définition et exemples célèbres

Cet article contenait les mots-clés « chaise cantilever » et « fauteuil cantilever » dans ses h3 : le 3 juillet 2023 j’ai supprimé 7 occurrences de « chaise cantilever » et 2 occurrences de « fauteuil cantilever ». Il reste 13 occurrences de « cantilever » dans ce texte de 500 mots. Il y en avait 22. La densité est donc passée de 4,4% à 2,6%.

Suite à ce changement, le trafic de la page a fortement diminué, d’environ 50% : 61 clics entre janvier et juin 2023, 36 clics entre juillet et décembre 2023.

Le 25 décembre 2023, je rétablis la version de la page d’avant les suppressions du terme « cantilever » : je rétablis donc 9 occurrences du mot-clé « cantilever ».  Que fera Google ?

Résultat du testRéponse le 29 février 2024 : conformément à mon hypothèse, le trafic de cette page a augmenté, ce qui me semble démontrer que les mots-clés du titre réemployés dans les titres H2-H6 et le corps du texte ont un impact sur la pertinence sémantique et sur le nombre d’impressions.

C’est ce qu’on voit sur le graphique suivant qui représente le trafic (courbe bleue : données réelles ; courbe noire : moyenne glissante pour lisser les données et mieux voir les tendances), sur la période du 2 mars 2023 au 29 février 2024 :

  • le premier graphique est celui de la page testée ; on observe que sur la période entre le 3 juillet et le 25 décembre 2023, pendant laquelle j’ai supprimé de nombreuses occurrences de mots-clés très pertinents, le trafic est considérablement plus faible qu’avant et après cette période
  • le second graphique est celui de tout le site et sert de référence pour comparer (car si le trafic global s’effondre ou explose, cela influe sur l’analyse du résultat de la page testée) ; on observe bien que ce trafic global baisse à certaines périodes de l’année (en été, et fin décembre), mais cela ne suffit pas à expliquer les piètres résultats de la page testée à l’automne 2023

image 3 e1709289973244

De ce test et du précédent, je pense qu’on peut conclure deux choses :

1/ La densité de mots-clés n’est pas un facteur en soi. Dès lors qu’un mot-clé n’est pas présent dans le titre, tel quel ou sous une autre forme comme une variante ou un synonyme, il y a fort peu de chance que Google affiche la page quand l’internaute cherche ce mot.

2/ MAIS, si le mot-clé est présent dans le titre H1, alors, et à cette condition seulement, la densité du mot dans le texte est probablement un facteur.

Conclusion : de la relative vanité du SEO sémantique

Ces tests et études montrent que la densité sémantique des mots n’est pas en soi un facteur important de référencement :

  • Google prend les mots-clés d’abord et avant tout dans le titre H1 des pages web.
  • Google utilise probablement la densité sémantique pour renforcer ou atténuer la pertinence des mots du titre H1.

Les gourous du SEO sémantique qui laissent croire qu’il est utile d’employer tout un champ sémantique même quand ces mots ne sont pas dans le titre, vendent du rêve.

Ces gourous sont :

Je sais ce que certains vont me rétorquer : « Mais t’es qui toi, pour contredire des stars, des références, des entreprises, des sites, des logiciels 1 million de fois plus connus que toi ? »

C’est vrai, je ne suis personne, mais l’argument d’autorité ne vaut rien en SEO. Ce n’est pas parce que le pape dit une connerie qu’il a raison.

La grande différence entre les tests que je viens de faire et le blabla publié par les stars que je viens de contredire, c’est que moi je publie mes données de manière relativement scientifique, donc en autorisant la contradiction.

Alors que les articles « de référence » de Semji, d’oncrawl, du Journal du SEO, de Gübür, de logiciels SEO employés par des dizaines de milliers de référenceurs, etc etc, ne contiennent, eux, pas l’ombre d’une donnée, d’un test, d’une étude. C’est affirmation sur affirmation, conseil sur conseil, et 0 preuve. Croyez, payez, circulez, y’a rien à démontrer !

Alors, faites comme bon vous semble, si vous préférez baser votre pratique sur la foi plutôt que sur la science. Les promesses n’engagent que ceux qui y croient !

Qu'avez-vous pensé de cet article ?

Cliquez sur une étoile pour donner votre avis

Avis moyen 4.3 / 5. Nombre d'avis donnés 4

Soyez le premier à donner votre avis



Besoin d'un hébergeur ?

Convivial, sympa, fiable, et pas cher,
O2Switch me semble être la meilleure offre actuellement sur le marché français.
C'est pourquoi j'y héberge tous mes sites. Hébergement O2Switch
Panier
//
Retour en haut