Een Amsterdamse rechter heeft bepaald dat een website-eigenaar verantwoordelijk kan worden gehouden voor de manier waarop Google delen van zijn site citeert bij zoekresultaten, meldde Tweakers donderdag. Vanwege het kennelijk extreem spoedeisende belang heeft de rechter alvast maar uitspraak gedaan maar de motivering laat op zich wachten tot 27 mei. Ik kan er dus maar bar weinig over zeggen, want ik houd niet van speculeren over wat er in een vonnis zou staan als dat er over twee weken gewoon is.
Kort gezegd ging het over aantasten van de reputatie van een bedrijf, autohandel Zwartepoorte. Wie op “Zwartepoorte failliet” zocht in Google, kon bij de resultaten het volgende lezen:
Volledige naam: Zwartepoorte Specialiteit: BMW … Dit bedrijf is failliet verklaard, het is overgenomen door het motorhuis Ik heb bij Boot Rialto gewerkt …
Het failliete bedrijf is echter dat Boot Rialto, maar Google knoopt die twee zinnen aan elkaar omdat ze allebei relevant zijn voor de zoekopdracht. Vervelend voor Zwartepoorte, maar in principe de schuld van Google zou je zeggen. Maar kennelijk vond deze Amsterdamse voorzieningenrechter het meer de schuld van Miljoenhuizen.nl waar de bovenstaande teksten stonden. Geen idee waarom, nogmaals. Ik ben dan ook heel benieuwd naar de motivering.
Update (14:20) Joost van dender Borg meldt in de comments dat mijn bedrijf ICTRecht volgens Google ook failliet zou zijn. Zie screenshot hieronder. Kennelijk zit er in de Googlesamenvattingsalgoritmen een optimalisatie die een zin met een bedrijfsnaam laat volgen door een zin met “failliet” ongeacht de onderlinge afstand.
Arnoud
Dus om juridisch veilig te zijn, mag je op Internet nooit meer “die”, “dat” en “deze” gebruiken?
Enkel omdat men niet snapt dat in de zoekresultaten de ellips “…” betekent dat de zinnen van elkaar af staan.
Als de redenering inderdaad vergelijkbaar is met die van dit vonnis ( http://zoeken.rechtspraak.nl/resultpage.aspx?snelzoeken=true&searchtype=ljn&ljn=BA3941&u_ljn=BA3941 ), namelijk dat Google niet verantwoordelijk gehouden kan woorden voor diens inhoud omdat die gegenereerd wordt aan de hand van een automatisch proces, ben ik benieuwd wie er verantwoordelijk is wanneer google ‘foutief’ een automatisch gegenereerde webpagina indexeert…
Btw, staan rechters er niet bij stil dat dat automatiseren toch echt mensenwerk is?
O jee, ICTRecht heeft nu hetzelfde probleem 😉
(Via google natuurlijk.Joost, wat een vondst! Ik heb gelijk een screenshot bij het artikel geplaatst. Dit zegt wel iets over het Google-algoritme, en daar is wel een verhaal van risico-aansprakelijkheid voor de zoekmachine bij te verzinnen.
Ter verklaring: Als je twee termen gebruikt in een zoekopdracht, en Google vind een webpagina waar die beide termen in voorkomen, dan knipt hij een stukje uit die pagina waar die beide termen voorkomen om ze in het voorbeeld te laten zien. En als ze te ver uit elkaar staan, dan tonen ze twee stukjes, met ieder ??n van beide zoektermen erin.
Als je zoekt naar ‘bedrijfsnaam’ ‘kwalificatie’ en Google vind geen pagina waar die bedrijfsnaam vlak naast die kwalificatie staat, maar wel eentje waar ze wat verder uit elkaar staan, dan krijg je een stukje zin met ‘bedrijfsnaam’, gevolgd door een stukje zin met die kwalificatie.
Het is dus niet zo dat er in de Googlesamenvattingsalgoritmen een optimalisatie zit die een zin met een bedrijfsnaam laat volgen door een zin met ???failliet???.
@6 Ik denk dat iedereen hier dat ook wel snapt (mag ik hopen tenminste). Echter is het probleem dat sommige mensen dit kennelijk niet in (willen) zien. Wat tegelijkertijd ook wel heel lachwekkend is als je ’t mij vraagt.
Heh, ik probeerde vanmorgen ook zo’n Arnoud/ICTrecht gerelateerde Google-samenvatting te vinden –volgens mij met onder meer exact dezelfde zoekterm– maar vond ‘m niet. Hij is erg leuk. 🙂
(Dankzij Google’s suggestie snapte ik ook eingelijk de woordspeling in ICTrecht.)
Het begint er op te lijken dat de strategie van Zwartepoorte als een boomerang terugkomt. Doordat allerlei nieuwssites en webblogs hierover schrijven is nu een groot gedeelte van de top 10 van de gewraakte zoekopdracht gevuld met de “misleidende” snippet.
Als ik zo eens rond kijk, zou het wel eens heel goed mogelijk kunnen zijn dat je als website(bouwer) de samenvatting wel kunt beinvloeden. Bij veel sites zie ik als samenvatting de zelfde tekst staan als de META-tag ‘description’ van de site/pagina.
@leen, dat klopt, je kan zelf de snippet in grote mate beinvloeden. De snippet wordt vestgesteld uit de a) DMOZ snippet, b) de eerste regels tekst op je site, c) citaten rondom trefwoorden op je site of d) de meta tag description.
Optie a kun je uitzetten met de metatag robots = noodp Optie b kun je voorkomen door zelf een meta tag op te nemen.
Blijft over optie c of d. Belangrijk hier zijn de trefwoorden die de zoeker gebruikt. Als deze niet in de meta tag description voorkomen heb je kans dat Google zelf een snippet maakt. Dat doet ze door het trefwoord plus enkele woorden daaromheen uit de inhoud van de pagina te halen.
IN het geval van zwartepoorte is sprake van optie d. Je typt de zoekwoorden zwartepoorte en failliet en google haalt enkele woorden uit de inhoud van de pagina rondom deze twee trefwoorden.
Wellicht had klup.nl de kans hierop kunnen verminderen door op haar site een unieke meta tag description op te nemen (optie d). Er is echter geen garantie hoe Google de snippet bepaalt dus de vraag blijft of je een waterdichte oplossing hebt als je zelf de meta tag opneemt, vooral als de gezochte trefwoorden niet voorkomen in jouw eigen meta tag description.
IN het geval van zwartepoorte is sprake van optie d.
Je bedoelt c, neem ik aan, type-/denk-foutje naar mijn vermoeden.
_
Er is echter geen garantie hoe Google de snippet bepaalt
Ook al zou het nu 100% van de tijd goed gaan, er is ook nog eens een grootte kans dat Google het in de toekomst anders gaat doen.
Je hebt gelijk, in het geval van zwartepoorte is nu sprake van optie c. En ook een heel terecht punt, google verandert regelmatig dingen in zijn algoritme en manier van presenteren.
De Google-omschrijving van snippetkeuze staat hier. Daar staat ook dat Google een voorkeur heeft voor de meta-description, niet dat ze hem ook daadwerkelijk zullen gebruiken.
Wat me trouwens opvalt is dat zowel Miljoenenhuizen.nl als Arnoud suggeren danwel openlijk beweren dat Google “schuld” heeft, en dat zie ik eerlijk gezegd niet zo. Het verschijnsel ellips (drie of meer puntjes) waarmee je een weglating aanduidt, bestaat al een hele tijd. Ik heb hier bijvoorbeeld een boek uit 1888 naast me liggen van letterkundige Jan ten Brink, Geschiedenis der Noord-Nederlandsche Letteren in de XIXe eeuw ([spam]soon in a Project Gutenberg near you![/spam], waarin hij citeert uit het debuut van Jan Frederik Oltmans: “Toen de Boodschapper …. zijn vriend in gevaar zag […]” Iedereen begrijpt dat in het werk zelf, Het Slot Loevestein, er iets tussen “Boodschapper” en “zijn” heeft gestaan. (Voor de BMW-rijders onder ons wil ik echter met nadruk beklemtonen dat Slot Loevestein naar mijn weten niet failliet is gegaan.)
@branko
Ik snap je argumentatie niet helemaal. Je geeft aan dat je het niet eens bent met de redenatie dat Google schuld zou hebben. daarna geef je als argument dat die 3 puntjes die Google gebruikt eigenlijk niet werken zoals bedoeld.
Dat is dan toch door Google niet handig gedaan?
Ach, de soep zal niet zo heet gegeten worden als hij wordt opgediend. Even los van dit geval heeft iedereen wel eens zoekresultaten gezien waarbij rare samenvoegingen van stukken tekst worden getoond.
Ik vind het wel interessant om te weten of dat autobedrijf eerst contact heeft opgenomen met de website eigenaar of dat er meteen een advocaat op is gezet.
Een zoekopdracht van meerdere woorden is dus een soort self fulfilling prophecy. Je vindt wat je zoekt… 😉
Ik wil best speculeren op de beslissing Vermoedelijk heeft het autobedrijf gevraagd om de betreffende pagina aan te passen of te verwijderen zodat de associatie in de google resultaten zou verdwijnen en heeft de siteeigenaar dat geweigerd.
Er zijn dat twee zaken die de rechter moet constateren: Ten eerste moet het autobedrijf schade aannemelijk kunnen maken want zonder schade geen onrechtmatig handelen. Ten tweede moet de rechter een weigering om dergelijke aanpassing te maken beoordelen als een “een doen of nalaten in strijd met een wettelijke plicht of met hetgeen volgens ongeschreven recht in het maatschappelijk verkeer betaamt”.
De siteeigenaar zou natuurlijk heel makkelijk iets aan de tekst op de site kunnen aanpassen zodat het Google samenvattingresultaat er anders uit zou komen te zien. Het zou mogelijk niet onredelijk geweest zijn als de betreffende site eigenaar bijvoorbeeld tegen vergoeding van kosten door de klagende partij de tekst op de site miniscuul had aangepast om het betreffende zoekresultaat aan te passen zonder dat dat de inhoud van de site inhoudelijk zou compromiteren.
Verder zou ik wel denken dat het voor een review site heel onhandig is om hetgeen wat je op de site reviewt (product, bedrijf, persoon) op 1 en dezelfde pagina te zetten als een set ongerealateerde reacties op een ander product/bedrijf/persoon zeker als je blijkbaar ook nog eens telkens dezelfde reacties koppelt en dus in een zoeksite telkens dezelfde koppeling van gegevens wordt gevonden.
@hAl, Dat het onhandig is voor een review site om ongerelateerde reacties op te nemen ben ik met je eens. Als het lijkt alsof de ongerelateerde reacties met de review te maken hebben dan moet je de review site daarop kunnen aanspreken. Dat is echter een onsite probleem en daarvoor lijkt de review site de juiste partij om aan te spreken. OVerigens is het nog maar de vraag of het op de site van klup.nl onduidelijk was dat de ongerelateerde reacties niet bij de review hoorden.
Een volgend probleem ontstaat als Google met haar automatisch algoritme citaten van een pagina haalt en deze gaat husselen en op een schijnbaar willekeurige manier bij elkaar zetten. Als je dit foutieve citaat wilt aanpakken dan moet je in mijn ogen naar Google.
Zwartepoorte ging in dit geval naar de reviewsite omdat het citaat op Google niet naar haar zin was. Ik vind dat een vreemde redenatie aangezien de reviewsite wel kan bepalen wat er op haar site staat maar niet wat Google in haar citaat opneemt. OP de site van klup stonden twee ongerelateerde berichten die door Google dusdanig gepresenteerd werden dat het leek alsof ze bij elkaar hoorden.
Ondanks de hierboven beschreven richtlijnen is de manier waarop Google een citaat maakt nog steeds niet vooraf 100% bekend en daarnaast ook aan verandering onderhevig.Het lijkt mij volledig de verantwoordelijkheid van Google hoe zij haar citaten inricht.
Stel je voor dat Miljoenenhuizen op haar site zet “zwartepoorte is niet failliet” en Google besluit om het citaat als volgt op te nemen “zwartepoorte … failliet” dan is dat toch iets waar je alleen Google op aan zou kunnen spreken?
@Erik Zou er voor Google een mogelijkheid zijn om van alle willekeurige sites te citeren en dan in 100% van de gevallen dit soort ongelukkige citaten te vermijden ? Dat lijkt me onwaarschijnlijk.
Het betreft hier een toevallige omstandigheid. Als iemand van zo’n toevalligheid schade ondervind is het normaal gezien niet onredelijk dat een partij die daar wat aan kan doen dat ook doet.
Hoewel ik de schade element hier niet echt heel erg zie kan ik wel in een redenatie komen dat er als die schade echt aanwezig is dat de betreffende site die ten gronde ligt aan de schade (ook al is dat een ongelukkig toeval) deze helpt op te lossen desnoods tegen vergoeding van onkosten.
Het weigeren van hulp bij het oplossen van een dergelijk probleem zou dan dus heel goed gezien kunnen worden als onrechtmatig.
Eigenlijk is het niet 1 citaat maar zijn het er 2 die door drie puntjes gescheiden worden. Het is niet zomaar een toevallig omstandigheid. Omdat je zoekt op het woord “zwartepoorte” en daarnaast “failliet” krijg je van elke trefwoord een citaat.
Zodra er een pagina is waarop ergens het woord failliet staat en daarnaast een bedrijfsnaam is er al potentie voor hetzelfde probleem. Gezien de grootte van het internet vind je deze combinatie van woorden bijna altijd. Je zoekt er immers naar dus Google geeft wat je zoekt.
Het is het Google systeem dat de problemen veroorzaakt doordat Google besluit twee willekeurige stukken van 1 pagina te pakken en die bij elkaar te zetten gescheiden door drie puntjes. Ten eerste is blijkbaar niet duidelijk dat die drie puntjes betekenen dat er een nieuw citaat ontstaat. Ten tweede neemt Google bewust een risico door twee willekeurige citaten in een snippet te zetten en daarmee de schijn te wekken dat ze bij elkaar horen.
En aangezien niet 100% duidelijk is hoe dit systeem werkt is nog maar de vraag of je altijd kan bepalen wat een website precies moet veranderen om de snippet te wijzigen. Ik vind het zelf nogal heftig als je een website kan vragen om zijn tekst te veranderen omdat een derde partij een vreemde interpretatie geeft. Sterker nog, eigenlijk zijn het de bezoekers die ten onrechte conclusies verbinden aan de snippet in Google zonder zelfs maar naar de betreffende pagina door te klikken.
Als bedrijf dat teksten publiceert wordt je zo een speelbal van willekeur. De vraag is of je verplicht kan worden daaraan mee te werken. Er zijn nog wel meer sites die inhoud van je site scrapen en het (zonder toestemming) herpubliceren met alle gevolgen van dien. MOet je daar allemaal rekening mee gaan houden?
Het gaat er niet of je daar rekening mee moet houden maar of je redelijkerwijs zou kunnen meewerken met iemand die schade ondervind door de aanwezigheid van jouw site. Er is ook geen sprake van willekeur maar van incidentele situaties die in enkele gevallen zouden kunnen leiden tot dergelijk verzoeken. En als je als site bijvoorbeeld de kosten vergoed krijgt is er weinig reden omder dergelijke incidentele situaties even onderling te regelen.
@hAl De reden om het niet aan te passen zou voor mij zijn “vrijheid van meningsuiting” en het recht om mijn site zo in te delen als ik wil. Als iemand anders besluit mijn site te scrapen of inhoud foutief over te nemen zou ik me daarvoor niet verantwoordelijk voelen en zou ik dus ook mijn tekst niet willen aanpassen.
Je noemt het incidenteel maar dat vraag ik me af. Er zijn zo ongelofelijk veel sites die inhoud scrapen dat dit soort problemen steeds vaker gaan opduiken. Daarbij, met deze uitspraak in de hand verwacht ik veel meer van dit soort verzoeken.
Ik kwam ze hiervoor al wel eens tegen maar zei dan altijd dat je er niet veel aan kon doen. Een toevallige samenloop lost zichzelf vaak al op (in het geval van miljoenenhuizen als er nieuwe reacties komen).
Ik ben nu vooral benieuwd naar de motivering van de uitspraak want vooralsnog blijft het speculeren op welke gronden deze uitspraak is gedaan.
Ik denk inderdaad dat het probleem ‘m zit in de (enigszins) onduidelijke wijze waarop Google citaten uit een tekst aan elkaar plakt. De ellips anders kleuren of […] gebruiken kan al veel schelen vermoedelijk. Nu kan ik (bijna) elk gewenst citaat genereren bij Google zolang de 2 woorden maar in een tekst voorkomen.
PS: Arnoud, bedankt voor de vermelding, maar spel je m’n naam nog even goed? 😉
Een late maar actuele reactie: inmiddels is een vergelijkbaar geval in de UK heel anders beoordeeld. Zie http://www.out-law.com//default.aspx?page=10881 “Publisher not liable for search engine summary, rules High Court” En hier ging het om een snippets uit nieuwsberichten die als nieuwsbericht wel degelijk schadelijk konden zijn, dus geen toevallig bij elkaar gevloeide woorden. De uitgever werd hier niet alleen op z’n eigen achief aangesproken, maar ook op de manier waarop de berichten in Google werden gepresenteerd. Volgens de Britse rechter moet echter steeds alles in zijn context worden beschouwd en in dit geval bleek er dan niets smadelijks aan de hand.