18 Feb 2005

Schoner in de zoekmachines

Categorie: Website ontwikkeling — lammert @ 0:15

Al eerder heb ik een aanpassing gedaan aan de WordPress broncode om er voor te zorgen dat de zoekmachines niet gevuld worden met onzinnige pagina’s van mijn weblog. Uit de weblog verwijderde pagina’s worden hierdoor gemarkeerd om ook uit de zoekmachines verwijderd te worden.

Recentelijk heb ik geconstateerd dat ondanks bovenstaande aanpassing er nog steeds dubbele pagina’s van mijn weblog in de zoekmachines aanwezig zijn. Dit komt voor in gevallen waarin ik op een dag één bericht heb geplaatst. Dit bericht komt zowel voor als het eigen bericht, als onder die specifieke dag. Beide pagina’s zijn op de titel na identiek en Google filterde in een aantal gevallen reeds automatisch één van de twee pagina’s uit de index. Helaas bleek dat vaak de verkeerde versie te zijn. Waarschijnlijk bepaalt Google het belang van een specifieke pagina op basis van het aantal inkomende links en de linkstructuur zoals die voorkomt in WordPress zorgt dat er naar de kalender pagina’s veel meer links wijzen dan naar de inhoudpagina’s.

Ik heb daarom zojuist een tweede wijziging doorgevoerd in de sourcecode m.b.t. het opgenomen worden in de zoekmachines. Alle pagina’s die niet een uniek bericht voorstellen krijgen automatisch de meta tag “noindex,follow” mee. Daarmee worden alle dag, maand en jaar pagina’s uit de lijst verwijderd maar blijft alle unieke inhoud toch vindbaar in de zoekmachines.

Het zal nog wel even duren voordag Google Elmira als slangenvanger weer in de index opgenomen heeft in plaats van dagpagina, maar dat zal op den duur wel gebeuren vermoed ik.

22 queries. 0.221 seconds.