SEO, Website De canonical-tag (2/3) in harde cijfers
Bij webpagina’s met gedupliceerde content krijgt Google via de canonical-tag de instructie om niet de pagina zelf te referenceren maar wel de originele webpagina waarvan de url in die canonical-tag staat. In de html-code van de pagina met gedupliceerde content met urlhttps://www.jewebsite.com/gedupliceerde-pagina.html/ staat dan bijvoorbeeld: <link rel=”canonical” href=”https://www.jewebsite.com/orginele-pagina.html/” />
Klik hier voor een uitgebreide theoretische benadering van de canonical-tag.
Dat is de theorie, maar komt die ook overeen met de werkelijkheid? Een analyse van een grote hoeveelheid webpagina’s met een ranking in Google levert verrassende conclusies op.
Een half miljard webpagina’s
We hebben ongeveer een half miljard webpagina’s(1) geanalyseerd die voor gemonitorde keywordseen ranking hebben in Google. In 1,8 % ervan staat in de html-code een canonical-tag met daarin een andere url dan die van de pagina zelf. Dat zijn in theorie pagina’s die de canonical-tag gebruiken waarvoor die bedoeld is. Pagina’s met een canonical-tag met daarin de url van de pagina zelf zijn buiten beschouwing gelaten.
(1) Meer bepaald 493.279.736. Daarvan bevatten 8.985.663 een canonical-tag met een andere url dan die van de desbetreffende pagina zelf.
Google ‘rondjes laten lopen’ lukt niet
5,3 % van bijna 50 miljoen pagina’s met een canonical-tag(2) verwijzen in de praktijk naar zichzelf, maar pas in 2e of 3e lijn.
2e lijn = pagina A verwijst in de canonical-tag naar pagina B, pagina B verwijst in de canonical-tag opnieuw naar pagina A.
3e lijn = pagina A verwijst in de canonical-tag naar pagina B, pagina B verwijst in de canonical-tag naar pagina C, pagina C verwijst in de canonical-tag opnieuw naar pagina A.
Pittig detail terzijde: 2 % van de url’s in die canonical-tag zijn er van niet-bestaande pagina’s.
(2) Hiervoor hebben we 47.796.436 pagina’s met een canonical-tag gecheckt. 5,3 % ervan (2.540.046) verwijzen via een omweg naar zichzelf. Bij 2 % (965.488) staat er in de canonical-tag een url van een niet-bestaande pagina.
Alarmsignaal 1: die pagina’s laten Google dus in een rondje lopen. In theorie worden die pagina’s niet gereferenceerd, waarom komen die dan überhaupt voor in de organische zoekresultaten van Google?
Wel een canonical-tag, toch in de zoekresultaten
Voor 13% van de meer dan 40 miljoen gemonitorde keywords(3) staat er op de eerste pagina met organische zoekresultaten in Google minstens 1 pagina die een canonical-tag bevat met een url die verwijst naar een andere pagina. Voor meer dan 6 miljoen gemonitorde keywords waarvan we niet alleen de top 10 maar ook een aantal volgende pagina’s met organische zoekresultaten checken, loopt dat percentage op tot 25%.
(3) Van 42.321.388 economisch interessante keywords checken we op regelmatige basis de top 10 van Google-resultaten. Voor 13% (5.526.679) ervan staat er in die top 10 minstens 1 webpagina met een canonical-tag.
(4) Van 6.163.422 keywordskijken we verder dan de top 10 in Google. Voor 25% (1.594.266) daarvan vinden we bij die resultaten minstens 1 webpagina met een canonical-tag.
Alarmsignaal 2: als die pagina’s via de canonical-tag aan Google de instructie geven om een andere pagina te referenceren, waarom staan ze dan zelf in de organische zoekresultaten en niet die andere pagina?
Google doet wat Google wil
Conclusie van deze analyse: in theorie zet je de canonical-tag in om Google een andere pagina te laten referenceren dan de desbetreffende, maar in de praktijk klopt dat niet. Google doet met de canonical-tag wat Google wil. Dat geven de mensen van Google ook gewoon toe op de webpagina ‘Dubbele URL’s consolideren’, in omfloerste bewoordingen:
https://support.google.com/webmasters/answer/139066?hl=nl
“Hoewel we u aanbevelen een canonieke pagina op te geven voor dubbele URL’s of versies, kan Google om diverse redenen, zoals prestaties of content, op algoritmische wijze een andere pagina kiezen dan de canonieke pagina.”
En:
“U kunt Google’s keuze voor de canonieke pagina niet afdwingen, maar u kunt de keuze wel beïnvloeden via een of meer van de hier getoonde technieken.”
Dat Google z’n eigen zin doet met de canonical-tag blijkt ook uit praktijkvoorbeelden. Klik hier om die te bekijken.