⚙️ SEO Technique
Duplicate Content
Le duplicate content (contenu dupliqué) désigne du contenu identique ou très similaire accessible via plusieurs URLs, pouvant nuire au SEO.
Définition
Le duplicate content (contenu dupliqué) désigne des blocs substantiels de contenu identiques ou très similaires accessibles via plusieurs URLs. Ce peut être sur un même site (duplication interne) ou entre différents sites (duplication externe). Le contenu dupliqué dilue l’autorité SEO et peut confondre les moteurs de recherche.
Pourquoi c’est un problème SEO
| Impact | Explication |
|---|
| Dilution de l’autorité | Les backlinks se répartissent entre plusieurs URLs |
| Gaspillage du crawl budget | Google crawle plusieurs fois le même contenu |
| Confusion de l’algorithme | Google ne sait pas quelle version afficher |
| Risque de mauvaise version indexée | Une URL non optimisée peut être choisie |
Types de duplication
Duplication technique (non intentionnelle)
Les causes les plus fréquentes :
| Cause | Exemple |
|---|
| HTTP vs HTTPS | http://site.com et https://site.com |
| WWW vs non-WWW | www.site.com et site.com |
| Trailing slash | /page et /page/ |
| Paramètres URL | /produit et /produit?color=red |
| Majuscules/minuscules | /Page et /page |
| Index files | / et /index.html |
| Paramètres de session | /page?sessionid=123 |
| Paramètres de tracking | /page?utm_source=email |
Duplication de contenu (même texte, URLs différentes)
| Situation | Exemple |
|---|
| Variations produits | Même fiche pour chaque couleur/taille |
| Pages de filtres | Catégorie triée par prix vs par date |
| Pagination | Contenus similaires sur plusieurs pages |
| Versions imprimables | /article et /article/print |
| Versions mobiles | m.site.com vs site.com |
Duplication externe (entre sites différents)
| Situation | Risque |
|---|
| Contenu syndiqué | L’original peut ne pas être reconnu |
| Scraping | Vol de contenu |
| Communiqués de presse | Publié sur plusieurs sites identique |
| Fiches produits fabricant | Tous les revendeurs ont le même texte |
Ce que Google fait
- Détecte les duplicatas via des signatures de contenu
- Choisit une version canonique (pas toujours la bonne)
- Consolide les signaux vers cette version
- Ignore les autres versions dans les résultats
Ce que Google ne fait PAS
| Mythe | Réalité |
|---|
| ”Pénalité pour duplicate content” | Pas de pénalité algorithmique directe |
| ”Google pénalise automatiquement” | Il filtre, il ne pénalise pas |
| ”Tout duplicate est mauvais” | Seul le duplicate manipulatif pose problème |
Attention : Cela ne veut pas dire que le duplicate content est sans conséquence. Les impacts indirects (dilution, mauvaise URL indexée) sont bien réels.
Solutions par type de problème
Redirections 301 (fusion de versions)
Pour les duplications techniques HTTP/HTTPS, WWW/non-WWW :
| Problème | Solution |
|---|
| HTTP accessible | Rediriger tout vers HTTPS |
| WWW et non-WWW accessibles | Choisir une version, rediriger l’autre |
| Trailing slash incohérent | Standardiser et rediriger |
Balise canonical (indiquer la version préférée)
<!-- Sur la page dupliquée -->
<link rel="canonical" href="https://www.site.com/page-originale" />
| Quand utiliser | Exemple |
|---|
| Variations produits | Toutes pointent vers le produit principal |
| Paramètres de tri/filtre | Pointent vers la page sans paramètres |
| Contenu syndiqué | Pointe vers l’article original |
Pour les pages qui ne doivent pas être indexées :
<meta name="robots" content="noindex, follow">
| Quand utiliser |
|---|
| Pages de recherche interne |
| Résultats de filtres combinés |
| Pages de pagination (parfois) |
| Pages d’archives |
Paramètres URL dans Search Console
Dans GSC > Paramètres d’URL, indiquer à Google :
- Quels paramètres ne changent pas le contenu (tracking, session)
- Quels paramètres trient/filtrent le contenu
Audit du duplicate content
Outils de détection
| Outil | Utilisation |
|---|
| Screaming Frog | Trouve les duplicatas internes |
| Siteliner | Analyse la duplication interne |
| Copyscape | Détecte le plagiat externe |
| Search Console | Signale les duplicatas dans Couverture |
Éléments à vérifier
| Check | Action si problème |
|---|
| Pages avec même title | Réécrire ou canonicaliser |
| Pages avec même meta description | Personnaliser chaque meta |
| Pages avec >80% de contenu identique | Fusionner ou différencier |
| URLs avec paramètres indexées | Canonical ou noindex |
Cas spécifiques e-commerce
Fiches produits similaires
| Situation | Solution recommandée |
|---|
| Même produit, couleurs différentes | URL unique + sélecteur couleur |
| Même produit, tailles différentes | URL unique + sélecteur taille |
| Produit dans plusieurs catégories | Canonical vers URL principale |
Pages de catégories avec filtres
| Filtres appliqués | Action |
|---|
| Aucun (page principale) | Indexer normalement |
| Tri (prix, popularité) | Canonical vers page sans tri |
| 1 filtre | Au cas par cas |
| Plusieurs filtres combinés | Noindex ou robots.txt |
Bonnes pratiques
Prévention
- Choisir une structure d’URL et s’y tenir
- Configurer les redirections dès le début
- Implémenter les canonicals systématiquement
- Paramétrer Search Console pour les paramètres d’URL
- Auditer régulièrement avec Screaming Frog
Pour le contenu
- Réécrire les fiches produits fournisseur
- Ajouter de la valeur unique (avis, guides, photos)
- Utiliser hreflang pour les versions internationales
- Citer la source et utiliser canonical pour le contenu syndiqué
Checklist de résolution
Technique
Contenu
Audit
Conclusion
Le duplicate content n’est pas une “pénalité” mais un problème d’optimisation qui dilue vos efforts SEO. La bonne nouvelle : c’est entièrement sous votre contrôle. Avec des redirections 301 bien configurées, des balises canonical appropriées et une architecture d’URL cohérente, vous pouvez éliminer la quasi-totalité des problèmes de duplication.