← Retour au lexique
⚙️ SEO Technique

Duplicate Content

Le duplicate content (contenu dupliqué) désigne du contenu identique ou très similaire accessible via plusieurs URLs, pouvant nuire au SEO.

Définition

Le duplicate content (contenu dupliqué) désigne des blocs substantiels de contenu identiques ou très similaires accessibles via plusieurs URLs. Ce peut être sur un même site (duplication interne) ou entre différents sites (duplication externe). Le contenu dupliqué dilue l’autorité SEO et peut confondre les moteurs de recherche.

Pourquoi c’est un problème SEO

ImpactExplication
Dilution de l’autoritéLes backlinks se répartissent entre plusieurs URLs
Gaspillage du crawl budgetGoogle crawle plusieurs fois le même contenu
Confusion de l’algorithmeGoogle ne sait pas quelle version afficher
Risque de mauvaise version indexéeUne URL non optimisée peut être choisie

Types de duplication

Duplication technique (non intentionnelle)

Les causes les plus fréquentes :

CauseExemple
HTTP vs HTTPShttp://site.com et https://site.com
WWW vs non-WWWwww.site.com et site.com
Trailing slash/page et /page/
Paramètres URL/produit et /produit?color=red
Majuscules/minuscules/Page et /page
Index files/ et /index.html
Paramètres de session/page?sessionid=123
Paramètres de tracking/page?utm_source=email

Duplication de contenu (même texte, URLs différentes)

SituationExemple
Variations produitsMême fiche pour chaque couleur/taille
Pages de filtresCatégorie triée par prix vs par date
PaginationContenus similaires sur plusieurs pages
Versions imprimables/article et /article/print
Versions mobilesm.site.com vs site.com

Duplication externe (entre sites différents)

SituationRisque
Contenu syndiquéL’original peut ne pas être reconnu
ScrapingVol de contenu
Communiqués de pressePublié sur plusieurs sites identique
Fiches produits fabricantTous les revendeurs ont le même texte

Comment Google gère le duplicate content

Ce que Google fait

  1. Détecte les duplicatas via des signatures de contenu
  2. Choisit une version canonique (pas toujours la bonne)
  3. Consolide les signaux vers cette version
  4. Ignore les autres versions dans les résultats

Ce que Google ne fait PAS

MytheRéalité
”Pénalité pour duplicate content”Pas de pénalité algorithmique directe
”Google pénalise automatiquement”Il filtre, il ne pénalise pas
”Tout duplicate est mauvais”Seul le duplicate manipulatif pose problème

Attention : Cela ne veut pas dire que le duplicate content est sans conséquence. Les impacts indirects (dilution, mauvaise URL indexée) sont bien réels.

Solutions par type de problème

Redirections 301 (fusion de versions)

Pour les duplications techniques HTTP/HTTPS, WWW/non-WWW :

ProblèmeSolution
HTTP accessibleRediriger tout vers HTTPS
WWW et non-WWW accessiblesChoisir une version, rediriger l’autre
Trailing slash incohérentStandardiser et rediriger

Balise canonical (indiquer la version préférée)

<!-- Sur la page dupliquée -->
<link rel="canonical" href="https://www.site.com/page-originale" />
Quand utiliserExemple
Variations produitsToutes pointent vers le produit principal
Paramètres de tri/filtrePointent vers la page sans paramètres
Contenu syndiquéPointe vers l’article original

Meta robots noindex

Pour les pages qui ne doivent pas être indexées :

<meta name="robots" content="noindex, follow">
Quand utiliser
Pages de recherche interne
Résultats de filtres combinés
Pages de pagination (parfois)
Pages d’archives

Paramètres URL dans Search Console

Dans GSC > Paramètres d’URL, indiquer à Google :

  • Quels paramètres ne changent pas le contenu (tracking, session)
  • Quels paramètres trient/filtrent le contenu

Audit du duplicate content

Outils de détection

OutilUtilisation
Screaming FrogTrouve les duplicatas internes
SitelinerAnalyse la duplication interne
CopyscapeDétecte le plagiat externe
Search ConsoleSignale les duplicatas dans Couverture

Éléments à vérifier

CheckAction si problème
Pages avec même titleRéécrire ou canonicaliser
Pages avec même meta descriptionPersonnaliser chaque meta
Pages avec >80% de contenu identiqueFusionner ou différencier
URLs avec paramètres indexéesCanonical ou noindex

Cas spécifiques e-commerce

Fiches produits similaires

SituationSolution recommandée
Même produit, couleurs différentesURL unique + sélecteur couleur
Même produit, tailles différentesURL unique + sélecteur taille
Produit dans plusieurs catégoriesCanonical vers URL principale

Pages de catégories avec filtres

Filtres appliquésAction
Aucun (page principale)Indexer normalement
Tri (prix, popularité)Canonical vers page sans tri
1 filtreAu cas par cas
Plusieurs filtres combinésNoindex ou robots.txt

Bonnes pratiques

Prévention

  1. Choisir une structure d’URL et s’y tenir
  2. Configurer les redirections dès le début
  3. Implémenter les canonicals systématiquement
  4. Paramétrer Search Console pour les paramètres d’URL
  5. Auditer régulièrement avec Screaming Frog

Pour le contenu

  1. Réécrire les fiches produits fournisseur
  2. Ajouter de la valeur unique (avis, guides, photos)
  3. Utiliser hreflang pour les versions internationales
  4. Citer la source et utiliser canonical pour le contenu syndiqué

Checklist de résolution

Technique

  • Une seule version accessible (HTTPS + WWW ou non)
  • Redirections 301 en place
  • Trailing slash cohérent
  • Paramètres de tracking ignorés (canonical ou GSC)

Contenu

  • Chaque page a un title unique
  • Chaque page a une meta description unique
  • Canonicals corrects sur toutes les pages
  • Pages de filtres/tri gérées (noindex ou canonical)

Audit

  • Scan Screaming Frog sans alerte duplicate
  • Pas de problème dans Search Console > Couverture
  • Test Copyscape OK pour les pages clés

Conclusion

Le duplicate content n’est pas une “pénalité” mais un problème d’optimisation qui dilue vos efforts SEO. La bonne nouvelle : c’est entièrement sous votre contrôle. Avec des redirections 301 bien configurées, des balises canonical appropriées et une architecture d’URL cohérente, vous pouvez éliminer la quasi-totalité des problèmes de duplication.