Définition
L’indexation est le processus par lequel les moteurs de recherche ajoutent des pages web à leur base de données (index). Une page indexée peut apparaître dans les résultats de recherche. Une page non indexée est invisible sur Google, même si elle est accessible via une URL directe.
L’indexation est l’étape entre le crawl (découverte) et le ranking (classement).
Le processus d’indexation
1. Découverte (Crawl)
Googlebot découvre une URL via :
- Liens depuis d’autres pages
- Sitemap XML
- Demande d’indexation manuelle
- Historique de crawl
2. Crawl
Googlebot télécharge le contenu de la page (HTML, CSS, JavaScript).
3. Rendu
Google exécute le JavaScript pour voir le contenu final.
4. Analyse
Google analyse :
- Le contenu de la page
- Les métadonnées
- Les liens
- La structure
5. Indexation
Si la page est jugée pertinente et de qualité, elle est ajoutée à l’index.
6. Disponibilité
La page peut désormais apparaître dans les résultats de recherche.
Vérifier si une page est indexée
Recherche site:
site:example.com/ma-page
Si la page apparaît, elle est indexée.
Outil d’inspection d’URL
Dans Search Console :
- Entrez l’URL
- Vérifiez “URL sur Google”
- Voyez le statut d’indexation
Rapport de couverture
Search Console > Indexation > Pages pour voir toutes les pages indexées et les problèmes.
Pourquoi une page n’est pas indexée
Raisons techniques
- Noindex : Balise meta ou header demandant la non-indexation
- Bloquée par robots.txt : Google ne peut pas crawler
- Canonical vers autre page : Google choisit la canonique
- 404/410 : Page inexistante ou supprimée
- Redirections : La page finale est indexée, pas l’origine
Raisons qualitatives
- Contenu dupliqué : Google choisit une version
- Contenu mince : Pas assez de valeur ajoutée
- Contenu de faible qualité : Google ne juge pas utile d’indexer
- Site trop nouveau : Pas encore assez de confiance
Raisons de crawl
- Crawl budget épuisé : Grandes sites
- Page trop profonde : Trop de clics depuis l’accueil
- Pas de liens : Page orpheline non découverte
Demander l’indexation
Via Search Console
- Allez dans l’outil d’inspection d’URL
- Entrez l’URL
- Cliquez sur “Demander une indexation”
Limitation : Quelques URL par jour.
Via sitemap
Soumettez votre sitemap à Google via Search Console. Google crawlera les URLs listées.
Liens internes
Liez vers la nouvelle page depuis des pages déjà indexées.
Accélérer l’indexation
Sitemap à jour
Mettez à jour votre sitemap avec les nouvelles pages.
Ping de sitemap
Informez Google des changements :
https://www.google.com/ping?sitemap=https://example.com/sitemap.xml
Maillage interne fort
Des liens depuis des pages importantes accélèrent la découverte.
Contenu de qualité
Google priorise le crawl des sites de confiance avec du contenu de qualité.
Publication régulière
Un site mis à jour régulièrement est crawlé plus souvent.
Empêcher l’indexation
Balise meta noindex
<meta name="robots" content="noindex">
Header HTTP X-Robots-Tag
X-Robots-Tag: noindex
robots.txt + noindex
Attention : Si robots.txt bloque, Google ne verra pas le noindex.
Bonne pratique : Pour désindexer, utilisez noindex et assurez-vous que Google peut crawler la page.
Index mobile-first
Ce que ça signifie
Depuis 2019, Google indexe principalement la version mobile des pages.
Implications
- Assurez-vous que le contenu mobile est complet
- Mêmes métadonnées sur mobile et desktop
- Mobile responsive ou site mobile équivalent
Problèmes d’indexation courants
Pages découvertes mais non indexées
Google connaît l’URL mais ne l’a pas indexée. Souvent un problème de qualité ou de duplication.
Erreurs de crawl
Problèmes techniques empêchant Googlebot d’accéder à la page.
Indexation lente
Site nouveau ou peu autoritaire : patience et construction de liens.
Désindexation soudaine
Vérifiez :
- Changements récents de noindex
- Pénalité manuelle
- Mise à jour algorithmique
- Problème technique
Métriques à surveiller
Dans Search Console
- Pages indexées vs soumises
- Pages avec erreurs
- Pages exclues et raisons
- Tendance dans le temps
Actions
Surveillez régulièrement et corrigez les problèmes signalés.
Conclusion
L’indexation est le prérequis à tout ranking. Sans indexation, votre page n’existe pas pour Google. Assurez-vous que vos pages importantes sont découvertes (sitemap, liens internes), accessibles (pas de blocage technique), et de qualité suffisante pour mériter une place dans l’index. Surveillez le rapport de couverture de Search Console et corrigez rapidement les problèmes détectés.