Table des matières

Les documents de l’API de Google (la « Google Leak ») contiennent énormément de termes obscurs, souvent poétiques et métaphoriques, et d’acronymes.

Pour les aventuriers du SEO et de l’ingénierie des moteurs de recherche, voici un répertoire des principaux termes utilisés dans l’API de Google, et de leur signification certaine ou probable.

La liste est classée par ordre alphabétique.

A

Alexandria

« pipeline d’indexation »

Asteroïd Belt

Ceinture d’astéroïdes = je n’ai pas encore la clé de cette métaphore.

C

CookBook

une collection de recettes ou de solutions pratiques pour accomplir des tâches spécifiques. Ces recettes peuvent inclure des exemples de code, des configurations et des conseils sur la façon d’utiliser certaines technologies ou API. Google publie souvent des cookbooks pour aider les développeurs à comprendre et à utiliser leurs services, comme Google Cloud, Firebase, ou les bibliothèques d’apprentissage automatique.

Craps

j’ai lu sur ce site que « selon l’ex-employé de Google Pedro Dias, CRaPS est un acronyme pour Clicks and Results Prediction System ».

Cwv

Core Web Vitals = les métriques que Google utilise sur Pagespeed Insights pour mesurer les performances techniques d’une page web. Se décline en MobileCwv et DesktopCwv.

F

Fg

Fingerprint = empreinte

G

Goldmine

mine d’or = concept qui semble lié à l’indexation et au stockage des données créées par Google

K

Kaltix

Kaltix est une jeune startup que Google a rachetée trois mois après sa naissance en 2003. Ses fondateurs avaient trouvé un moyen d’accélérer 1000 fois le calcul du PageRank de Larry Page, et de personnaliser les résultats en fonction des utilisateurs.

KG

KnowledgeGraph = le graphique des connaissance, immense répertoire d’entités (êtres, personnes, choses, concepts, entreprises, etc) qu’utilise Google pour savoir ce que signifient les mots – qui désignent ces entités.

Knex

module Node.js qu’utilise Google (pour faire quoi ?)

L

LSU

Last Significant Update = Dernière mise à jour significative

M

Mustang

un des systèmes d’indexation de Google, le plus rapide

N

NB

NavBoost = un des « twiddlers » de Google : un modificateur de classement qui intervient après un premier classement (sémantique et technique, je pense). NavBoost reclasse les résultats en fonction du comportement des utilisateurs pendant leur navigation.

NLP

Natural Language Processing = traitement automatique du langage naturel

NS

Nearest Seed = littéralement « la graine la plus proche ». Ce serait une nouvelle manière (par rapport au pagerank originel) de calculer l’importance ou l’autorité d’une page, en utilisant un graph du web.

NSR

Normalized Site Rank = Classement normalisé de site

O

Ocean

un des systèmes d’indexation de Google

P

PQ

Page Quality = qualité de la page

Proto

2 interprétations possibles :

Protocol Buffers (protobuf) : C’est un format de sérialisation de données développé par Google. Il est utilisé pour échanger des données entre différents services de manière efficace et extensible. Les fichiers « .proto » sont utilisés pour définir la structure des données de manière indépendante du langage de programmation.
Prototype : En JavaScript, le prototype est un mécanisme par lequel les objets peuvent hériter des propriétés et des méthodes d’un autre objet. Chaque objet en JavaScript a un lien interne vers un autre objet appelé prototype.

R

RS

Rich snippets = les extraits enrichis que Google affiche dans ses résultats (SERP)

S

Site2vec

Site to Vectors = il s’agit d’une technique de vectorisation sémantique. Imaginons un chat : il est roux, a les poils courts, les yeux noirs, il a 2 ans, c’est un mâle. Chacun de ces paramètres est une dimension – couleur et taille des poils, couleur des yeux, âge, sexe -, dans laquelle on peut représenter les données. On peut donc représenter ce chat en tant qu’objet vectorisé dans un espace multi-dimensionnel. De la même manière, l’IA sémantique de Google vectorise le sens d’un site, dans ses multiples dimensions.

Superroot

d’après ce que j’ai compris, Superroot est en quelque sorte le serveur principal de Google, qui agrège des données en provenance de plusieurs index (Mustang, TeraGoogle, Ocean, Segindexer…) pour servir les résultats de recherche

T

TeraGoogle

un des systèmes d’indexation de Google, plus lent et à long-terme (apparemment)

Twiddler

« torseur » (to twiddle signifie se tordre, se tortiller) = un modificateur de classement qui intervient après un premier classement algorithmique, et qui opère en fonction de données issues de l’analyse du comportement des utilisateurs, sur Google et sur les sites web

U

UAC

Universal App Campaign = une modalité de Google Ads

V

VOLT

probablement un Twiddler, un système de reclassement ; il semble être lié aux performances Core Web Vitals et au protocole https.

A