Table des matières
Le balisage en données structurées : mythe ou réalité ?
Depuis sa création en 2011 par Google, Bing et Yahoo, le balisage des pages web avec le « markup » de Schema.org fait l’objet de nombreuses affirmations dans le monde du référencement SEO : boostez votre trafic avec des petits bouts de code magique, disent-ils.
Mais comme d’habitude, les experts autoproclamés font plus de bruit qu’ils n’avancent de preuves.
Le boulot d’expertise SEO n’étant donc tout simplement pas fait à ma connaissance, je me dévoue pour sortir de l’obscurantisme et de la pensée magique, du charlatanisme et de l’escroquerie.
Si votre but est d’augmenter le trafic de votre site web, plutôt que de participer aux discours creux d’une secte qui se nourrit de votre attention et de votre argent, vous feriez bien d’entrer vous aussi dans une logique de vérification des discours dominants à propos du référencement, car ceux-ci sont truffés d’erreurs, de mythes, de croyances, voire de mensonges purs et simples.
Définition : les données structurées de Schema.org c’est quoi ?
D’abord, qu’est-ce que les données structurées de Schema.org ?
C’est un langage informatique conçu pour ajouter des informations dans une page web, de manière invisible pour les utilisateurs mais utile pour les moteurs de recherche.
L’enjeu principal pour les moteurs est d’afficher correctement les bonnes données au bon endroit pour chaque type de contenu.
Par exemple pour afficher une recette, il faut avoir une image du résultat, un nom, une liste d’ingrédients, une note moyenne donnée par les utilisateurs, etc.

Imaginons qu’un moteur de recherche cherche à analyser une carte d’identité : qu’est-ce qui lui permet de savoir que tel groupe de caractères est un prénom, un nom, une date de naissance, un lieu de naissance, ou un nom de préfet ?
Sur une fiche-produit, qu’est-ce qui permet d’être sûr que tel groupe de chiffres est bel et bien le prix actuel du produit, plutôt que le prix promo ou une marque ou tout simplement un texte quelconque ?
Sur un site web, comment le moteur peut-il savoir que telle partie du code est un menu de navigation principal et quel tel autre est un menu de navigation secondaire, tandis qu’une troisième est une liste d’articles complémentaires ?
Les données structurées ont vocation à régler ces problèmes.
Le principe est simple : le code Schema.org permet de déclarer « tel élément, c’est tel type d’information ».
Si je reprends mon exemple de la carte d’identité, le balisage Schema dirait d’abord « ce document est une carte d’identité », puis « ce mot est le prénom, ce mot est le nom, ces chiffres sont la date de naissance », etc.
Sur une fiche produit, le balisage Schema.org permet de déclarer que telle donnée est le prix de vente, telle autre le prix promotionnel, telle autre le pourcentage de réduction, et ainsi de suite avec le nom du produit, la marque, la description, la couleur, le matériau etc.
A l’échelle d’un site, le balisage Schema.org permet de dire qu’il existe un site web, qui appartient à une organisation, qui a une url, qui a des pages web, qui ont des menus de navigation, etc etc.
On comprend mieux le terme « données structurées » : il s’agit de types d’informations non seulement nommées, standardisées, mais aussi structurées comme des ensembles de propriétés d’objets cohérents : site web, produit, organisation, personne… et des dizaines d’autres (cours, livres, films, recettes, promos, lieux, entreprises locales…)
Intégrer des données structurées
Il existe différents langages pour déclarer des données structurées : Microdata, RDFa, JSON-LD.
Je ne vais pas vous faire un cours complet à propos de ces langages mais juste pour que vous puissiez avoir un exemple complet de comment ça se présente, voici un schéma de type Website au format JSON-LD, qu’il faudrait placer en bas de page dans les scripts avant la fin de la balise <body> :
- <script type=« application/ld+json »>
- {
- « @context »: « https://schema.org »,
- « @type »: « WebSite »,
- « url »: « http://example.com/ »,
- « potentialAction »: {
- « @type »: « SearchAction »,
- « target »: « http://example.com/search?&q={query} »,
- « query »: « required »
- }
- }
- </script>
Ce code n’apparaitrait nulle part sur la page aux yeux des internautes, mais les moteurs de recherche pourraient le lire et comprendre ce qu’il dit : qu’on peut faire une recherche sur ce site à telle url.
Apologie du balisage schema.org et des données structurées par d’innombrables sources SEO
Il suffit de chercher sur Google quelques expressions du type « preuves que le balisage schema.org améliore le trafic SEO » pour tomber, non pas sur des preuves évidemment (on ne va quand même pas s’embêter à vérifier ce qu’on dit !!!), mais sur une séries de titres putaclic, qui accumulent les promesses alléchantes :
- Balisage schema.org : comment l’utiliser pour votre site web ? (sous-entendu : ça aurait un sens et une utilité)
- Qu’est-ce que le balisage Schema ? Guide du débutant (sous-entendu : les débutants en auraient besoin)
- SEO bonnes pratiques de balisage pour un référencement réussi (sous-entendu : s’il y a de bonnes pratiques, c’est que cela sert à quelque chose)
- Comment ajouter le balisage Schema pour le référencement (et améliorer votre référencement) (ici, l’affirmation est claire ; même si l’article ne présente pas une seule preuve ni aucune stat de trafic)
- L’importance du balisage schema.org (ok donc c’est important ?)
- Top 10 meilleurs outils pour améliorer votre SEO (ok donc le balisage est dans le top 10 ! aucune preuve bien sûr dans ces 10 conseils formidables, qui a priori augmentent surtout le trafic du site qui les publie, c’est déjà ça)
- 10 secrets SEO que les experts cachent (l’article révèle que ces experts cachent aussi les preuves)
- Découvrez comment le SEO sémantique peut faire exploser votre trafic dès aujourd’hui ! (donc éloignez-vous de l’ordinateur après vos optimisations car ça va exploser ; pour info mes tests ont démontré que le concept de SEO sémantique est largement bidon, et qu’en tout cas la soi-disant optimisation sémantique ne change pas grand-chose au trafic)
- etc etc etc
On trouve aussi des propositions de services, du type :
- J’obtiendrai plus de trafic et de ventes avec le balisage schema.org
Bref, Google nous répond avec une longue, longue litanie de sources savantes, qui en sont sûres et qui vous l’enseignent : le balisage schema.org c’est super important ! la clé de votre réussite, meilleur que le cunni à la Chantilly.
Sauf qu’en voyant ça j’ai plutôt l’impression d’assister à un défilé d’otaries de cirque, jouant avec des ballons multicolores : c’est divertissant, certes, mais est-ce que ça améliore vraiment mon trafic, plutôt que le trafic des sites qui m’en parlent ?
Les données structurées boostent le SEO : vrai ou faux ?
Les avis sont très partagés à propos de l’impact réel de l’utilisation des balises Schema.org.
Certains expliquent qu’en aidant les moteurs de recherche à mieux comprendre de quoi parle une page, le balisage avec les données structurées Schema augmente la pertinence des contenus, évite les erreurs de compréhension, et améliore indirectement le trafic.
D’autres référenceurs affirment que l’utilisation de certains types de balisage schema.org permet d’apparaitre dans certains types de résultats notamment sur Google. Ainsi, le fait d’utiliser le balisage de type FAQ, favoriserait la sélection d’extraits de nos pages dans les résultats « People Also Ask » sur Google – vous savez, ces listes de questions que les gens ont posées à Google par le passé et que vous vous posez peut-être quand vous cherchez tels mots-clés.
D’autres enfin, affirment que les données structurées ne sont pas un facteur de classement et ne présentent pas d’intérêt.
J’ai lu ici et là des opinions diverses et variées sur ces sujets, par contre je n’ai pas vu l’ombre d’un test ni d’un graphique avant / après, prouvant que l’ajout d’un balisage Schema.org a effectivement « boosté le trafic », ni démontrant la thèse inverse.
Il est donc temps de passer les affirmations sans preuves du SEO à la moulinette de la science, celle qui base son savoir sur des tests, contestables et reproductibles.
Test sur l’utilisation d’un balisage Schema.org de type FAQ
Exemple de la page https://boutique-wp.fr/faq-sur-la-balise-meta-description-en-seo/
Cette page n’est constituée que d’une série de 8 questions et réponses, au format FAQ.
De plus, j’ai pris ces questions précisément sur les résultats de Google, dans la liste des « People Also Ask » (en français « Autres questions ») sur le mot-clé principal. Donc a priori les questions sont pertinentes aux yeux algorithmiques de Google et recherchées par le public humain.
J’ai bien entendu vérifié avec le validateur de Schema.org : mon code JSON-LD est correct.
En bref, j’ai fait ce que je pouvais pour « booster mon trafic avec un balisage Schema.org » et « répondre aux questions du public » : ces deux conseils sont des grands classiques du bullshit SEO.
Alors, est-ce que mes géniales stratégies ont marché et m’ont rapporté un trafic de ouf, un max de Google Love et du pognon par brouettes de billets de 100 ?
Eh bien absolument pas : cette page n’a reçu qu’1 clic en 12 mois. J’aurais probablement fait mieux en racontant une course de levrettes, par la magie de la polysémie.
Donc je pense que la thèse selon laquelle le formatage schema.org aiderait Google à sélectionner des extraits est probablement faux, car ce résultat est juste catastrophique, en termes de trafic mais aussi d’impressions (seulement 865 sur un an) et de positions (position moyenne ridicule, à 55).

D’ailleurs, cette remarque m’inspire une petite étude.
Etude : Google a-t-il besoin de données structurées pour choisir les extraits de ses « People Also Ask » ?
Est-ce que Google a besoin d’un balisage Schema pour aller choisir des extraits et nourrir ses People Also Ask ?
Là, pas besoin de mettre en place un test, il suffit d’aller étudier les résultats.
Pour rigoler, je vais googler « slicer en revers » (action qu’on peut faire aussi bien au tennis qu’au ping-pong, deux activités que mes bras aiment faire quand ils ne s’occupent pas de jouer du piano sur un clavier d’ordi).
Ensuite, je clique les questions du bloc People Also Ask un peu au pif, j’ouvre les pages d’où viennent ces extraits et j’en inspecte le code à la recherche de balisage Schema.org.

Au bout d’une poignée d’inspections, la réponse est évidente : aucun extrait retenu et affiché par Google dans ses résultats ne fait l’objet d’un marquage Schema.org en RDFa ou en JSON-LD. Et non seulement les extraits que cite Google sont, pour la plupart, de simples paragraphes <p> dans le code HTML des pages, mais en plus la plupart de ces pages ne contiennent tout simplement aucun Schema.
Donc la thèse précédemment évoquée, selon laquelle le balisage aiderait Google à choisir des extraits dans des pages est probablement tout à fait fausse.
Une remarque d’ailleurs : Schema.org est sorti comme je l’ai dit en 2011, or quelques années plus tard Google a commencé à ajouter à son algorithme des analyseurs sémantiques comme RankBrain (2015) et BERT (2019), des IA basées sur du machine learning, qui avaient vocation à aider Google à mieux comprendre les requêtes et les intentions de recherche des internautes.
Il est fort probable que ce type de technologie soit également utilisé pour analyser les pages web, et que donc le balisage sémantique, bonne idée du début des années 2010, soit progressivement devenu de moins en moins pertinent au fur et à mesure que l’intelligence artificielle faisait des progrès en matière de traitement automatisé du langage naturel.
Etude : les recettes de cuisine présentées en « featured snippet » sur Google, utilisent-elles un balisage Schema.org de type Recipe ?
Je vais vous la faire courte : la réponse est oui.
J’ai cherché « recette de chou rouge », j’ai ouvert 8 résultats présentés par Google en mode « featured snippet » (avec photo, titre de la recette, avis des gourmets, etc), et tous sauf un dont le code javascript n’est pas accessible, avaient le marquage Schema.org de type recette (Recipe), avec toutes les informations qu’il faut pour valider.
C’était le cas pour des ténors du secteur de la recette, comme Marmiton ou Chef Simon, autant que pour des sites bien moins connus.
Conclusion : si vous avec un site de recettes et que vous voulez que Google affiche vos recettes proprement dans ses résultats, je pense que vous ne devriez pas tortiller du fion trop longtemps : mettez illico en place un balisage en JSON-LD.
Sinon vos recettes n’apparaitront que dans la liste normale des résultats naturels – sous une forme moins attractive donc moins cliquée – et vous obtiendrez moins de trafic. Je ne suis pas 100% sûr de ce que je dis là mais j’ai tendance à penser que si le top 10 des résultats fait un truc, ça peut donner un avantage concurrentiel de le faire aussi.
Etude : les cours présentés sur Google, utilisent-ils un balisage Schema.org de type Course ?
Comme dit plus haut, un des schémas disponibles est celui de l’objet « Course » en anglais, c’est à dire « Cours » en français, au sens de tutoriel, leçon, enseignement.
Le schéma Course permet de déclarer des données structurées comme l’auteur, l’éditeur, le titre, le genre, la langue, etc etc.
A première vue, on se dit donc que quand on a un site qui publie des cours, le balisage avec ce schéma pourrait être utile.
Pour autant, une rapide étude de ce que présente la SERP de Google sur la requête « cours de PHP » montre que le balisage Schema.org n’apparait aucunement nécessaire et ne semble pas être un facteur de classement.
D’abord, première remarque sur un fait flagrant : les requêtes de type « cours de… » n’entraînent aucun affichage de « featured snippet » similaire aux recettes ou aux films, par exemple. On pourra trouver ça paradoxal voire carrément absurde : Google a promu un type de données structurées… qu’il n’utilise tout simplement pas. Et Bing non plus. Et Yahoo non plus. Super idée, donc.
Ensuite, voici les résultats, naturels, que présente Google sur « cours de PHP » :
- Position 1 : un cours d’OpenClassrooms, qui utilise le schéma Course (ha ! donc ça marche, c’est utile ?)
- Position 2 : un cours de l’université d’Orléans, au format PDF (incompatible avec un balisage schema, donc)
- Position 3 : un cours de Grafikart, sans aucun balisage (ni Course, ni Website, ni Person, ni Organization… pourtant ce mec que j’ai connu de loin est un expert en code, pour qui Schema est d’un niveau basique)
- Position 4 : un cours de Pierre Guiraud, qui utilise plusieurs schémas, mis en place avec le plugin Yoast SEO, mais… aucun schéma Course.
- Ensuite, une liste de 3 vidéos Youtube (avec l’habituel sens de la concurrence de Google… qui adore mettre en avant ce qui lui appartient et zapper le reste, sauf quand l’UE lui fait raquer des amendes astronomiques)
- Position 5 : encore un cours en PDF
- Position 6 : un cours qui n’a qu’un seul schéma, Article.
Bref, je m’arrête là car la conclusion est évidente : sur les 6 premiers résultats de type page web après une requête contenant le mot-clé « cours », je ne trouve qu’un seul schéma de type cours, et j’en conclus donc qu’un tel balisage n’est pas requis et ne permet pas de battre la concurrence.
Test sur l’utilisation d’un balisage Schema.org de type Service
Le langage de balisage de données structurées Schema.org, fondé par Google, Bing, Yahoo, rejoint par Yandex, propose un objet Service avec une longue liste de propriétés : https://schema.org/Service
Seulement, quand on cherche un peu, on découvre que Google ne semble pas l’utiliser. Et ce, alors qu’il utilise les objets Product et Offer, comme on peut le constater sur cette copie d’écran issue d’un test sur l’outil de validation des données structurées de Google :

Or, les propriétés des objets Product et Service diffèrent sensiblement, et logiquement on serait en droit de penser qu’il y a un intérêt à déclarer qu’une page produit vend en réalité un service – et qu’il n’est donc pas question, par exemple, d’adresse de livraison, de frais de port, de poids, de dimensions du colis, etc, toutes propriétés de l’objet Product.
On a donc un sacré paradoxe, une fois de plus : Google crée un langage… pour finalement ne rien faire d’une partie de ce qu’on peut dire avec ??? Apparemment la grande passion de Google consiste à violer la logique.
Pour tirer les choses au clair, j’ai donc écrit deux balisages Service en JSON-LD, que j’ai ajouté à deux de mes pages produit WooCommerce, le 21 mars 2024.
J’ai validé le code, avec le validateur de Schema.org, et avec celui de Google : parfait ! (alors que c’est carrément galère à écrire correctement).
Déjà, je note que l’outil de validation de Google n’identifie sur mes pages aucun objet Service, alors qu’il reconnait l’objet Product qui était déjà déclaré.
Est-ce que néanmoins, Google va trouver ma page plus précise, et en tirer une quelconque conséquence en terme de trafic ?
Mon balisage Service lui donne en effet des infos qu’il n’avait pas déjà dans l’objet Product ni dans d’autres balisages que j’utilise : Product, WebPage et Organization.
Il s’agit de :
- audience, le public : j’ai déclaré les micro-entreprises, les TPE et les PME, et je lui ai donné les urls précises de ces entités dans wikidata
- areaServed, la zone géographique à qui le service est destiné : j’ai déclaré France, Belgique, Suisse
- serviceOutput, ce que le service produit, crée : j’ai déclaré qu’il s’agissait de référencement SEO et d’un site web pour une profession particulière
- offer, l’offre détaillée : j’ai précisément décrit en quoi consiste le service
J’ai également donné le prix, la monnaie, l’Organization qui fournit le service (= mon entreprise), l’url du service et son logo.
A l’heure actuelle, Google affiche mes 2 services comme ceci – on voit qu’il reconnait un avis client et les prix :


Maintenant il n’y a plus qu’à attendre pour voir si le trafic ou l’affichage bougent.




