Het duplicate content probleem is een van de dingen die bij veel webmasters tot grote problemen kan leiden. Immers heeft Google een hekel aan duplicate contect en zal je daarvoor straffen door een legere tot geen ranking op de betreffende content pagina’s. Met E-commerce winkels en een blog heb je al snel duplicate content, je moet dan bijvoorbeeld denken aan het feit dat je nieuwste posts op de index verschijnen, maar ook op hun eigen pagina. In dit geval heb je dus al te maken met duplicate content. Hetzelfde geldt bij webwinkels die bijv. bij elk artiel een printvriendelijke pagina hebben van elk product, deze zal dan dezelfde content bevatten alleen dan zonder opmaak. Verder worden sommige artikelen in meerdere categorieen weergegeven.
Om dergelijke dingen tegen te gaan kan je er bijv. voor zorgen dat je aan dergelijke pagina’s een META tag robots = ‘NoIndex’ meegeeft, op die manier zal de pagina niet geindexeerd worden door Google. Je wilt immers ook niet op je printvriendelijke pagina geindexeerd worden, maar op de productpagina in je shop. Bij weblogs zou je dit probleem kunnen oplossen door bijv. op de idnex een verkorte versie van je verhaal te kunnen weergeven, waardoor het percentage dat overeenkomt met je echte post relatief laag is.
Naar mijn weten zijn er ook programma’s om duplicate content te detecteren, alleen kon ze niet zo gauw vinden. Heeft iemand een link voor me? Dergelijke programma’s zijn ook handig om klonen van je content te vinden bij andere sites.