Expressens AutoRefresh och deras Canonical-miss
Jag har tidigare här på bloggen skrivit om vikten av tydliga URL:er, META-taggar och varför det inte är så bra att ha duplicerat innehåll. Det här är en väldigt viktig del att få en så tydlig struktur som möjligt och förhindra att sökmotorer indexerar “fel” sida och delar upp länkkraften på två eller flera sidor. Det är därför på sin plats med en uppföljningspost om detta och jag tänkte även här visa hur fel det kan gå – även för en av Sveriges största sajter, Expressen.
Jag och Binero har ingenting emot Expressen – snarare kan det här ses som ett lärdomsexempel och säkerligen någonting Expressen bör titta lite närmre på
.
What’s up with Expressen?
För ett tag sedan implementerade Expressen en lösning som är tämligen intressant – nämligen att autorefresha den sida du är inne på. Det här innebär att varje gång du är på startsidan eller en underkategori uppdateras sidan.
Inte någonting som är helt ovanligt för nyhetssajter då de vill visa upp den senaste versionen av sajten för besökarna. Men här har det gått lite snett för Expressen för det är inte samma sida som du kommer in på efter du “autorefreshats” utan du får upp en ny URL.

Det här är inte enbart implementerat på startsidan utan på varenda undersida på Expressen. Tar vi och kollar på undersidorna som exempelvis “Sport” är det exakt samma sak.
Varför gör Expressen så här?
Med stor sannolikhet gör Expressen så här för att kunna mäta all auto-refresh i deras webbstatistik så det blir tydligare att mäta samt även skicka med bättre data till sina annonsörer.
Tanken är alltså väldigt god från Expressens sida… om nu bara sökmotorerna ser det på samma sätt?
Har Expressen taggat det rätt så Google förstår det här?
För att undersöka detta närmre kan vi gå in på källkoden och se hur de har satt upp det här i koden:

Som ni kan se finns här refresh-funktion men det finns ingen rel=”canonical”-tagg som säger till sökmotorn vilken som är den rätta sidan, det finns inte heller någon annan tagg som säger till sökmotorn att den här sidan är ett duplikat och inte originalet.
Samtliga undersidor på Expressen har alltså två versioner av sin sida. På den ljusa sidan har Expressen gjort det rätt på sina artiklar, som exempelvis den här artikeln om Zlatan som vi direkt kan se i källkoden:
![]()
Ses då här som duplicerat innehåll av sökmotorerna?
Vi kan direkt konstatera att för varenda sida på sajten så finns det två versioner av sidan och det är precis det här som Google ser. Via en enkel Google-sökning kan vi se följande resultat av det här.

Det var inte alltför länge sedan Expressen implementerade den här lösningen men redan nu kan vi se att Google hittat över 1900 antal sidor.
Länkproblemet med detta
Eftersom det nu hela tiden finns två olika sidor av Expressen innebär det att det finns två versioner av en artikel som personer kan länka till. Länkar är en av de absolut viktigaste delarna när det gäller SEO och du sprider Expressen ut det på än fler sidor.
En “vanlig” användare som är inne på en undersida kommer kopiera den URL de ser i adressfältet, och har de varit på sidan ett tag kommer det vara en sida med just ?ar=true efter sig.
Om 10% av länkarna länkar till fel sida på en viktig underkategori kommer det här innebära att den kategorin inte får samma värde. Resultatet blir att man förlorar slaget mot konkurrenterna.
Så vad skulle Expressen göra för att göra det lättare?
Den enklaste lösningen för detta är att använda sig av rel=”canonical” och peka på originalsidan. Jag har skrivit om detta tidigare och det är en väldigt enkel implementation som det bara bör ta några minuter för en utvecklar på Expressen att fixa. De har redan löst det för sina artiklar så det borde inte vara några problem att lösa det för sina kategorier.
Vad är lärdomen av detta?
Duplicerat innehåll kan ibland existera och det här exemplet visar tydligt på att har man inte koll på sin tekniska lösning kan de innebära problem för sökmotorer.
Dessutom visar det att även de största sajterna kan göra fel – det är bara att lära sig av detta och se till att man inte gör samma misstag!
Relaterade inlägg:
Postad av Simon Sundén 21 oktober, 2011 i
Vi är prisade för vår goda support, höga funktionalitet och kontrollpanel.