20 Jan 2005

Google’s strijd tegen comment spam

Categorie: Column, Over webloggen, Website ontwikkeling — lammert @ 4:21

Dat internet een snel medium is waar ook snel beslissingen kunnen worden genomen blijkt wel uit de aankondiging van vandaag van Google dat ze een nieuwe functionaliteit in hun zoekmachine gaan inbouwen waarbij de website eigenaar de mogelijkheid krijgt om uitgaande links aan te geven als niet meetellend voor de page rank. Binnen 24 uur is dit voorstel omarmd door de twee grootste concurrenten Yahoo en MSN, iets waar in andere takken van de industrie jaren van commisies en rapporten voor nodig zijn.

Doel is om de grote hoeveelheid comment spam die nu op weblogs binnenkomt te beteugelen. Voor de mensen die van niets weten een korte achtergrond.

Een weblog—zoals deze—is een vorm van een website waarbij mensen van buiten gemakkelijk interactief mee kunnen doen door middel van het reageren op berichten. Dit gaat buiten de website beheerder om, de funtionaliteit om commentaren te geven staat direct op de site. Dit geeft een betere mogelijkheid van communiceren met een breder publiek dan met e-mail communicatie. Maar ook spammers hebben dit medium ontdekt.

Wanneer een website hoog in de resultaten van een zoekmachine wil komen—met name Google—dan is één van de belangrijke eisen, dat andere websites die site belangrijk vinden. Google heeft hiervoor een gepatenteerd systeem met de naam page rank. Dit is een algoritme dat berekent hoeveel links van andere websites naar die ene site verwijzen. Je kunt een link zien als een stem tijdens parlementsverkiezingen. Meer links betekenen meer stemmen en zo kan een site met voorkeursstemmen hoog in de zoekmachine zoekresultaten komen. Tot voor enkele jaren was dit een goed principe. Links konden toen (praktisch) alleen worden toegevoegd door de directe beheerder van sites zelf, dus een stem op een website kwam in de praktijk dus eigenlijk overeen met een persoonlijke stem van die beheerder.

Sinds de weblog is dat veranderd. Iedereen kan bij een weblog commentaar toevoegen, en vaak is daar ook de mogelijkheid om links naar andere websites in te voegen, bijvoorbeeld om iets te verduidelijken. Maar de sitebeheerder heeft geen directe controle meer over deze inhoud. De zoekmachines zien de link en denken dat het een legitieme stem is van de beheerder voor een specifieke website, maar in de praktijk is die link niet door hem geplaatst, mogelijk door de beheerder van die andere website zelf. Dit gaat zover, dat nu vele automatische programma’s actief zijn die het internet afstropen naar weblogs (waarvan er vele tienduizenden zijn) en willekeurige commentaren daar bij plaatsen. Google en andere zoekmachines kunnen slechts moeilijk het verschil zien tussen deze namaak commentaren en echte commentaren, dus worden alle links die er in voorkomen als normale stemmen geteld.

Dit is natuurlijk niet goed, en Google heeft nu bedacht dat in een link opgenomen kan worden dat deze niet als stem meegeteld wordt, door het rel=”nofollow” attribuut. Dit moet door een update in de blogsoftware worden toegevoegd. WordPress heeft al aangekondigd dit te willen doen en ook andere software fabrikanten gaan hiermee aan de slag. Zelfs Google concurrenten MSN en Yahoo gaan binnen enkele wegen deze nofollow tag implementeren.

OK, dit klinkt heel mooi, maar er zit een onbedoelde keerzijde aan deze nieuwe optie. Een webmaster kan nu namelijk ook zich onthouden van stemming door bij reguliere links deze optie toe te passen. Bij de berekening van de page rank—de relatieve waarde van een website—worden inkomende links namelijk als voorkeursstemmen meegeteld, maar uitgaande links gaan weer van dit saldo af. Door slim gebruik te maken van deze tag kan een webmaster dus zijn pagerank helemaal binnenboord houden en geen enkele waarde meer aan andere sites afstaan. Dit ondergraaft het directe principe van de Google ranking waarin alle links een gelijke waarde hebben, net als bij normale verkiezingen. Gewiekste webmasters konden vroeger alleen de ranking van hun site verhogen door meer links van buiten te vragen of in te kopen. Nu kunnen ze dat intern doen door alle uitgaande stemmen te blokkeren.

Het is dus maar afwachten in hoeverre dit uiteindelijk gaat uitwerken. In een blog bij xs4all heb ik al mijn vraagtekens gezet hoe dit op de korte termijn zal uitwerken op de hoeveelheid comment spam in de weblogs. De lange termijn kan wel eens heel interessant worden om te zien of de ranking mechanismen van Google en anderen nog overeind blijven staan, of dat zoekmachines—na de snelle opkomst van Google eind jaren negentig—een nieuwe revolutie te wachten staan.

Lammert

Aftellen tot mijn terugkeer

Categorie: Dagelijkse leven — lammert @ 2:41

Vandaag voor de telefoon weer een lang gesprek met Elmira gehad. Wanneer je zo ver van elkaar vandaan bent lijkt het wel of je meer met elkaar communiceert dan wanneer je op elkaars lip zit. Gelukkig dat het Russisch mij nu vrij goed af gaat, woordenboeken en vertaalprogramma’s op de computer werken zo moeilijk via de telefoon. We zijn aan het aftellen tot mijn terugkeer. Een beetje afhankelijk van mijn werk hier, beschikbaarheid van een voordelig ticket etc. zal het nog een week of drie duren voor we weer bij elkaar zijn. Toch wel een nadeel die grote afstand dat je niet eventjes voor een weekendje heen en weer komt.

De toestand in Jabagly is stabiel. Er ligt al dagen een pak sneeuw van dertig centimeter. Elmira’s tante uit Rostov is nu een week op bezoek. Komende zondag vertrekt ze weer met de trein, samen met baboeska, haar moeder. Het treinbiljet voor de terugreis is gekocht, dus baboeska is de koning te rijk. Ze loopt bijna als twee componenten lijm achter haar dochter aan om er maar voor te zorgen dat ze niet per ongeluk vergeten wordt.

Voor Elmira heb ik ook weer een doos klaar gemaakt met spullen die ze per post toegestuurd krijgt. Niet alles valt elke keer in 20 kg bagage te stoppen en zaken van niet al te veel waarde die toch die kant op moeten verstuur ik daarom periodiek per post. De post is betrouwbaar, alle pakketten en brieven zijn tot nu toe aangekomen, vaak al binnen 10 dagen en je kunt de pakketten ophalen bij het lokale postkantoor. Dit in tegenstelling tot UPS en DHL die wel zeggen dat ze in Kazachstan bezorgen, maar waar je het in de praktijk toch gewoon vanaf het vliegveld in Almaty moet afhalen.

Ja, en wat gaat er nu in zo’n doos. Een bloemlezing van wat er zoal in deze doos zit:

  • Een elektrische deken
  • Twee zakken honingdrop op speciaal verzoek van Elmira!
  • Een 25 tal potjes specerijen om het eten te kruiden naar Nederlandse normen
  • Enkele boeken
  • Kleren

Het zijn praktisch allemaal dingen die in Nederland normaal zijn, maar in Kazachstan niet te koop of ontzettend duur. Probeer er maar eens kleren in mijn maat te vinden in Kazachstan. Ik stuur daarom het liefst oudere kleren vooruit per post. Mocht de post zoek raken is er geen man overboord. De belangrijkere of duurdere spullen gaan in mijn koffer per vliegtuig mee. Kleren wegen al gauw een aantal kilogrammen en 20 kilo is zo vol.

22 queries. 0.127 seconds.