Les contenus dupliqués au menu du Panda (2/3)
Étiquettes : écriture web, référencement
Deuxième volet de notre triptyque consacré au duplicate content. Quels types de contenus dupliqués existe-t-il? Quelles solutions s’offrent à nous?
Duplicate Content, various versions
- Contenus dupliqués au sein d’un même site : articles de presse, pages produits des sites d’e-commerce, les versions imprimables de certaines pages web, les forums de discussion, etc. Dans ces cas précis, Google ne « sanctionne » pas, son cher Panda sait reconnaître les doublons pertinents. Concernant vos pages dédoublées (si tel est le cas), veillez à nettoyer vos DC. L’impact sera bénéfique sur plusieurs niveaux.
- Contenus dupliqués sur différents sites : en d’autres termes, il s’agit d’un vol de contenu pur et simple. Rien de plus rageant, vous en conviendrez. D’autant plus que la sanction ne s’abat pas sur le contenu le plus récent mais bien sur le moins « populaire ». D’où l’importance de mentionner votre contenu au maximum, de partager le lien et de faire en sorte que votre page soit bien référencée.
- Contenus dupliqués des balises Title et Meta description : ces zones sont les premières concernées en matière de référencement et d’optimisation. Les adeptes de SEO le savent, Google s’intéresse avant tout au contenu de ces balises. D’où l’importance d’avoir un Title unique pour chaque page. Vous penserez également à introduire des mots-clés pertinents. Les fainéants seront avertis: exit les copier-coller des titres et descriptions d’une page à l’autre de votre site/blog, faites preuve d’un peu d’imagination, vous serez récompensé!
- Contenus partiellement dupliqués: également appelés « scraped content », ces DC veulent donner l’impression d’être originaux. Il s’agit de copier un contenu et d’en changer quelques termes, signes de ponctuation ou architecture et ce, afin de paraître fraîchement sorti de l’imagination de son auteur. Ils représentent un réel problème pour les moteurs de recherche et se propagent de plus en plus. Que faire ? s’armer de patience et de son bâton de pèlerin, pour demander aux usurpateurs de bien vouloir mentionner leur source (vous).
Une solution pour satisfaire le Panda ?
Il en existe plusieurs, mais aucune n’est efficace à 100%. Dans un premier temps, vous devez être en mesure de vérifier l’authenticité de vos pages. L’outil www.positeo.com est une bonne base pour évaluer le pourcentage de DC sur un échantillon de texte ou une page complète.
Le site www.copyscape.com, que la plupart d’entre vous connait, recherche également des copies de votre page sur l’ensemble de la toile. C’est un bon outil pour tenter d’améliorer votre contenu et le rendre plus authentique.
Utilisez les redirections 301 lors de la restructuration de votre site. Cela renseignera vos utilisateurs, mais aussi les robots de Google.
Enfin, équipez vous des webmaster tools mis à votre disposition (certains sont gratuits, d’autres pas). Vous serez plus efficace dans la gestion de votre contenu. Certains plug-ins pour CMS ont vu le jour, ils se révèlent très utiles.
Google n’a pas dit son dernier mot
Dans la dernière partie de cette trilogie, vous découvrirez la toute dernière mise à jour de l’algorithme. Elle pénalisera les sites trop souvent cités pour non-respect des droits d’auteurs. Cela sonnerait-il le glas des contenus dupliqués?
Vous avez loupé le premier épisode? Aucun problème, retrouvez-le ici!
Commentaires