Nettisivuilla on arkipäivää, että samaa sisältöä on saatavilla useasta eri osoitteesta, mikä hankaloittaa hakukoneiden indeksointia. Etusivun sisältö voi löytyä osoitteista www.domain.com ja www.domain.com/fin/index.html tai esimerkiksi yksittäinen saman sisältöinen tuotesivu usean eri osoitteen taakaa riippuen siitä miten tuotteet on lajiteltu. Ongelmaa kutsutaan tuplasisällöksi.
Tuplasisältöä on perinteisesti torjuttu ohjaamalla 301-metodilla useat saman sisältöiset sivut haluttuun osoitteeseen. Myös robots.txt tiedostolla voi ohjata hakukoneiden vierailua sivustolla ja estää yksittäisten tuplasisältösivujen indeksointia.
Uusia vaihtoehtoja
Tähän ongelmaan ovat Google, Yahoo! ja Microsoft yhdessä julkaisseet käytettäväksi uuden sivuston <head> osion <link> tagiin liitettävän rel="canonical" määreen, jonka tarkoituksena on ohjata hakukone halutulle sisältösivulle. Canonical liitetään jokaiseen tuplasisältösivuun ja sen kohteeksi määritetään url halutulle sisältösivulle.
Canonical linkki näyttää tältä:
<link rel="canonical" href="http://www.domain.com/tuotteet/kone.html" />
Kuinka määritän canonical linkin
Oletetaan, että haluttu sisätösivu on edellisen esimerkin mukainen:
http://www.domain.com/tuotteet/kone.html
Sama sisältö löytyy myös sivulta:
http://www.domain.com/tuoteluettelo/kone.html
Tässä tapauksessa tuoteluettelosta löytyvän sivun <head> osioon lisätään:
<link rel="canonical" href="http://www.domain.com/tuotteet/kone.html" />
Kun hakukone vierailee tuoteluettelon sivulla sille ilmoitetaan, että tälle haluttu vastine löytyykin /tuotteet/ kansiosta. Simppeliä!
Lisätietoa
Googlen verkkovastaavan ohjeissa on aiheesta lisää ohjeistusta sekä tuplasisällön estämisestä.
Uutta määrettä tukevien hakukoneiden tiedotteita löydät: Google, Yahoo!, Live, Ask.com
Kerro mielipiteesi