Joodse organisaties klagen Google aan om AutoComplete-suggesties

joods-auto-aanvullen.pngGoogle is door een aantal Joodse organisaties aangeklaagd omdat de Franse versie van de zoekmachine te vaak automatisch het woord ‘juif’ (jood) zou suggereren bij het zoeken naar naar joodse mensen. Dat meldde Nu.nl gisteren. De omschrijving “de wet die de samenstelling van een databank met etnische gegevens verbiedt” gaf me zó veel jeuk dat ik er op Koninginnedag over moest bloggen. Want het gaat gewoon over de Wet bescherming persoonsgegevens, laten we het niet enger maken dan het is.

Die wet verbiedt inderdaad het aanleggen van databanken (bestanden) met ‘bijzondere’ persoonsgegevens, waaronder ethische afkomst, religie of ras. Je mag dus niet zomaar bijhouden of een bepaald persoon een Jood of een jood is (ja, dat maakt uit). Uitgezonderd enkele nu niet relevante situaties heb je gewoon uitdrukkelijke toestemming nodig als je dat soort gegevens wil verwerken. En ja, de definitie van “verwerken” is zó breed dat Google’s bijelkaargooien en correleren er ook onder valt.

Er is één uitzondering die Google misschien kan helpen: als de gegevens door de betrokkene zelf duidelijk openbaar zijn gemaakt, is het verder verwerken daarvan minder snel een probleem. Zeggen dat de paus katholiek is, is dus niet verboden en je hoeft hem niet vooraf te vragen of je dat mag doen. Google haalt haar informatie uit openbare bronnen, en je mag in het algemeen denk ik wel aannemen dat als die bronnen tot een autocomplete-suggestie leiden, die bronnen legitiem zijn en dus zich op de betrokkene zelf baseren. Ik kan me moeilijk voorstellen dat iemand zijn Joodse/joodse identiteit geheim houdt terwijl Google het wél weet, en voldoende zeker van z’n zaak is om er een AutoComplete suggestie van te maken. Maar ik geef wel meteen toe dat het zeker geen gelopen race is met dit argument.

Als Google dit argument niet kan gebruiken en ook geen toestemming kan laten zien, dan hebben ze inderdaad een probleem. Het verweer “het is een automatisch proces” zal ze echt niet helpen, want het is hún automatisch proces en dat moeten ze maar privacytechnisch op orde krijgen dan. Ja, zo rolt de privacywet.

Ook het verweer dat zij slechts informatie van anderen doorgeven, zal niet opgaan. Bij een snippet met een zoekresultaat waarin staat dat iemand Jood is, zal dat wellicht nog helpen, want Google heeft geen controle over wat mensen op webpagina’s zetten. Maar over de AutoComplete-suggesties hebben ze wél controle. Dat hebben ze al vaak genoeg laten zien wanneer er weer eens “aanstootgevende of anderszins bezwaarlijke” termen geblokkeerd werden. Van porno tot torrent, er is heel wat waarbij de zoekmachine ineens geen suggesties meer heeft.

Dat mag, en zakelijk gezien is het verstandig voor Google (want tieten en piraterij zijn niet goed voor het imago), maar het leidt wél tot aansprakelijkheid voor hetgeen ze dan nog doorlaten. Zo werd het bedrijf in 2011 in Italië veroordeeld voor een autosuggestie van “oplichter” bij iemands naam. Ook in Japan werd gevonnist dat het automatisch suggereren van negatieve termen smaad opleverde (of privacyschending, het artikel is niet helemaal duidelijk).

Ik snap het punt van de aanklagers dus, en juridisch hebben ze zeker een goede kans. Ik blijf alleen wel steeds meer zitten met het gevoel dat de privacywet zo de innovatie wel érg in de weg gaat zitten.

Arnoud<br/> PS: dat nummer rechtsonder is op veler verzoek toegevoegd als referentie. Wie geen lange URL wil noemen in een paper of scriptie, kan volstaan met het AE-nummer en/of datum.

43 reacties

  1. Ergens vraag ik me heel erg sterk af of dit het verwerken van de persoonsgegevens van die ene persoon is. Want hoewel je zegt dat die persoon een jood is, zeg je niet of het wáár is. Eigenlijk heb ik zelf altijd het idee dat het gaat om hoeveel mensen er zoeken naar die woordcombinatie. Dus als heel veel mensen zoeken naar informatie over het geloof van Pietje en ook heel er specifiek willen weten waarom hij jood is geworden, dan zoek je al snel naar ‘Pietje jood’.

    Google pakt dat op en gaat ermee aan de haal. Dat leidt soms to grappige situaties (zoek maar eens op internet – met AutoComplete aan – naar grappige automatische suggesties), maar ik durf te beweren dat het in dit geval niet per se gaat om het verwerken van persoonsgegevens, maar meer het automatisch aggregreren van zoektermen. Zoektermen an sich (dus ook zonder een unieke ‘anonieme’ identifier) zijn geen persoonsgegeven, dus het weergeven van een lijst van zoektermen ook niet, toch? (Want je zegt nergens dat het ‘waar’ is, je zegt alleen dat er anderen ook naar zoeken – een zoekterm als ‘Paus jood’ zou ook in de suggesties kunnen komen, en dat is dan weer geen persoonsgegeven.)

    Daar tegenover staat natuurlijk wat er gebeurt als iedereen opeens gaat zoeken naar ‘Pietje Janssen, Dorpsstraat 32b, 1232 BL Duiven aan Zee’. Dan geeft iemand anders persoonsinformatie aan Google en dan wordt het weer lastig. Die gegevens zijn wel vrij duidelijk persoonsgegevens, maar wat moet Google daaraan doen? Het gaat allemaal automatisch, dus er is niemand die gaat denken “goh, dat lijkt wel heel erg op een adres, zullen we die filteren?”

    Moraal van het verhaal: wat zou Google hier redelijkerwijs aan kunnen doen? De informatie die Google in zijn suggesties heeft is niet noodzakelijkerwijs door die persoon op internet gezet, dus weet Google ook niet of het openbare of privé-informatie is. Moeten ze een methode maken om makkelijk een klacht in te dienen over een suggestie? Of filteren op woorden als ‘jood’ en ‘christen’? Ergens lijkt het wel alsof Google niets meer mag gaan suggereren. En dat is jammer.

  2. Het maakt niet uit of het wáár is. Waar het om gaat is dat je de combinatie legt, waardoor je een waardeoordeel over een persoon geef of informatie over die persoon vastlegt. “Ralph schrijft een uitgebreide tekst” is dus een persoonsgegeven, en wel over jou want jij bent (te herkennen aan de naam) Ralph.

    Het is dus niet zo dat iets pas een persoonsgegeven is als de NAW er bij staan. Bij de vorige alinea kun jij op grond van de Wbp correctie of verwijdering eisen, en ik moet dan bewijzen dat ik echt een absolute noodzaak heb om jouw naam in die alinea te laten staan.

  3. @arnoud:

    Ik blijf alleen wel steeds meer zitten met het gevoel dat de privacywet zo de innovatie wel érg in de weg gaat zitten.
    Ik draai het liever om: De privacy wet is er ook niet om innovatie te bevorderen.

  4. Wetten behoren in het algemeen innovatie niet tegen te houden. Onmogelijkheid tot innovatie is slecht voor de maatschappij. Hooguit zou je onwenselijke vormen van innovatie willen inperken zodat de dilemma’s zichtbaar worden, maar een categorische onmogelijkheid om iets nieuws te doen (want oh de privacy of ach het auteursrecht) vind ik volstrekt verwerpelijk.

  5. @1 Het is geen persoonsgegeven want er staat niet of het waar is? Ik kan wel wat combinaties verzinnen waar dat niet door de giecheltoets komt, hoor. “Jan Klaassen pedofiel”, “Jan Klaassen oplichter”, “Jan Klaassen pornokoning”, ik denk niet dat Jan Klaassen dat weg kan lachen op zijn sollicitatiegesprek, of het nu waar is of niet.

  6. Voor de duidelijkheid: Google autocomplete werkt op basis van de meest populaire searches van de gebruikers. Het is dus niet dat Google de link legt tussen een naam en een term als “juif” (Google weet waarschijnlijk niet eens dat het een naam is), maar dat veel mensen (in die regio) hebben gezocht op die combinatie.

  7. Ad 2:

    Dan zou je dus ook nooit meer een recensie kunnen schrijven, over zeg een cabaretvoorstelling of muziekuitvoering. Want die wordt gemaakt door een persoon of personen, en als de recensent schrijft “in het midden van dat ene stuk van Chopin speelt Arthur Rubinstein veel te snel, dat moet niet zo, vind ik”, dan zou dat de verwerking van een persoonsgegeven zijn en daar moet de recensent dan eerst toestemming voor vragen? (Aan de erven, ook nog, want hij leeft niet meer: http://en.wikipedia.org/wiki/Arthur_Rubinstein ).

    En hij is nog Joods ook, vermoed ik heel sterk, als ik die naam zo zie. Maar als ik dat zeg verwerk ik een persoonsgegeven? Ik zeg het normaal niet, want het doet er niet toe.

    Gaan die privacywetten niet veel te ver en doorstaan ze wel de giecheltoets?

    PS. Dat over die te snelle passage is geloof ik echt, ik heb ergens een notitie liggen over zo iets, die ik ooit (als ik 83 of 93 ben?) nog eens ga uitwerken tot een echte recensie. Mag niet zomaar, dus?

  8. Volgens de privacywet is dat inderdaad een punt, Ruud. Je mag persoonsgegevens alleen verwerken met toestemming of met een eigen noodzaak die zwaarder weegt dan meneers privacy.

    Je eigen noodzaak is in dit geval de vrije meningsuiting, zodat de vraag neerkomt op “was het nieuwswaardig dat je zijn naam noemde”. En die vraag kennen we al uit de journalistiek. Zie het Satamedia-arrest over het publiceren van belastingaangiften en de nieuwswaarde daarvan en het Kleintje Muurkrant-arrest over de belangenafweging in een journalistieke publicatie (smaad versus nieuws).

  9. @6: Inderdaad hoe auto complete altijd is uitgelegd. Als jij het beginin typt van een veel gebruikte zoek opdracht dan krijg je suggesties van waar anderen naar gezocht hebben. Google doet waarschijnlijk gewoon een pattern match op wat jij typt.

    Probleempje is dan dat dit dus geen openbare informatie is, alleen google weet deze!

    Als deze klacht gegrond wordt verklaard is dat einde verhaal voor autocomplete. Ik zie niet hoe google alle zoek opdrachten kan controleren op dit soort combinaties. Wellicht kunnen ze nog autocomplete uitschakelen als er een naam in voorkomt. Maar dat lijkt me ongewenst bij het zoeken naar historische gegevens. Terechte opmerking van Arnoud denk ik dat de wbp hier de vooruitgang in de weg zit. En @sjoerd, bevorderen is heel wat anders als niet in de weg zitten.

    Het is allemaal best nuttig, maar wetgeving zit de innovatie danig in de weg. Software patenten die niet worden gebruikt om inkomsten te krijgen, maar om concurrenten uit te schakelen. Copyrights die worden gebruikt om bedrijven die een opname functie aanbieden aan te pakken. (Waarom mag ik wel op mijn eigen DVR opnemen en afspelen, maar als die dvr bij een bedrijf staat die het in feite gewoon host voor mij, desnoods in de cloud, dan mag het niet. En nee het is niet openbaar toegankelijk) En nu dus de wbp die innovatie remt.

    Kunnen we dan concluderen dat deze wetgeving niet geschikt is voor de digitale wereld?

  10. Je eigen noodzaak is in dit geval de vrije meningsuiting, zodat de vraag neerkomt op ???was het nieuwswaardig dat je zijn naam noemde???.

    Dus een recensie mag alleen over een recent concert? Ik kocht laatst de Woodstock-dvd. Dan mag ik dus geen verhaaltje schrijven waarin ik schrijf dat ik Richie Havens daarin erg goed vind, omdat dat geen nieuws is??

    Mijn stukje http://rudhar.com/recensie/2100305b.htm over o.a. Free as a Bird van de Beatles, dat had dus eigenlijk niet gemogen? Daar moet ik eerst Yoko Ono over mailen?

    Dit gaat volgens mij echt veeeel te ver.

    Er zal ook wel een regel zijn van “als je zelf met iets in de openbaarheid treedt, dan moet je tolereren dat anderen er iets over zeggen”? Privacy alleen over wat je zelf privé houdt? Hoge bomen vangen veel wind? O ja, dat staat al in je artikel:

    Zeggen dat de paus katholiek is, is dus niet verboden en je hoeft hem niet vooraf te vragen of je dat mag doen.

  11. Waarom denk je dat ik zo’n hekel heb aan hoe die kaartenbakwet werkt op internet?

    Ik had alleen wel “vrije meningsuiting” moeten zeggen als noodzaak en niet zozeer “nieuwswaarde”. Dat is iets breder. Maar het kan wél uitmaken: het oprakelen van oude informatie kan inderdaad een privacyschending opleveren.

  12. Ik denk dat Google in de problemen kan komen door de manier waarop data met elkaar geassocieerd kan worden. Bijvoorbeeld doordat een bepaalde voor- of achternaam onder Joden erg vaak voorkomt. Idem met Moslims, eigenlijk. Zeg je Abdul dan denken de meeste mensen meteen aan een moslim, hoe onjuist dit ook moge zijn…

    Bepaalde namen zijn gekoppeld aan een bepaalde ethniciteit, een bepaalde cultuur, of zelfs familie. De naam Kennedy komt ook best vaak voor en lang niet alle Kennedies zijn familie van die ene bekende Amerikaanse president. (Hoewel, zoals die familie bezig was…) En ook de naam “Ten Brink” komt vaak voor en nee, ik ben geen familie van die bekende Robert.

    Google maakt gewoon associaties. Doordat er een Ten Brink een bekende Nederlander is, en ik Ten Brink heet, kan het zijn dat ik door Google in verband word gebracht met een of andere liefdes-show…

    Moet ik daar boos om worden? Ik snap hoe het werkt, maar is dat een reden om te zeggen dat Google mijn persoonsgegevens vervalst?

    Bij mij zou deze kwestie niet door de giecheltoets heen komen maar helaas heeft de rechter minder gevoel voor humor…

  13. De vraag of iets een ‘verwerking’ van persoonsgegevens is, staat los van of de persoonsgegevens juist zijn. “Wim ten Brink – géén familie van presentator Robert” is net zo goed een persoonsgegeven als “Wim ten Brink, de broer van”. In beide gevallen moet ik een wettelijke grondslag hebben voor die verwerking (toestemming, contract, eigen noodzaak die boven de privacy gaat). Bij onjuiste gegevens is die grondslag er waarschijnlijk nooit.

  14. Ik denk dat het probleem is dat er helemaal geen verwerking aan te pas komt. Google onthoudt gewoon de meest gebruikte zoektermen per regio, zonder daar enige verdere waarde of verwerking aan te verbinden. Het resultaat van de zoekopdracht zal dus moeten uitwijzen of Wim ten Brink wel of geen familie is van Robert.

  15. @14: Je verwerkt al gegevens, zodra je opslaat, dat ‘Wim’ en ’ten Brink’ vaak samen voorkomen op blog.iusmentis.com. Omdat dat persoonsgegevens zijn (namelijk de naam van een bezoeker), verwerk je persoonsgegevens. Iemand die op internet zoekt op ‘Wim’ en dan direct ’ten Brink’ ziet, wordt dus boos, want er zijn persoonsgegevens van iemand genaamd ‘Wim ten Brink’ ten onrechte vergaard (door Google, voor de autocomplete).

    Ik ben zelf behoorlijk zorgvuldig met mijn persoonsgegevens, maar dit is toch wel heel erg paranoide. Daarnaast: Niet alleen de autocomplete, ook de zoekresultaten zelf worden via caches en indexen aan elkaar gekoppeld. Natuurlijk is het indexeren van persoonsgegevens uit openbare bronnen ten behoeve van een zoekmachine iets anders dan ten behoeve van een autocomplete functie. Of is dat onderscheid niet relevant?

  16. Ook leuk: ik voer in Google in: “ten brink” en de autocomplete toont mij een drukkerij, foodretail, meppel en aannemer. 🙂 Plaats ik er nog “wim” voor dan komt Bouw en fysiotherapeut er voor in de plaats. (En een ‘e’ achter ‘brink’.)

    Toch ook de vraag of het uitmaakt hoe algemeen iemands naam is als zijnde een persoonsgegevens. Maakt het verschil als Google suggereert “Jan Jansen blog” of “Arnoud Engelfriet blog“? Beiden zijn persoonsgegevens, maar de eerste hangt aan veel meer personen dan de tweede.

  17. @ 12: Volgens mij werkt Google inderdaad zo en dat lijkt me inderdaad géén gebruik van een persoonsgegeven. Ik heb het niet op de Franse Google geprobeerd, maar als ik in Google bijvoorbeeld “Cohen” intik en Google suggereert daar ‘juif’ bij, dan doet Google niets fout. Want algemeen is bekend, of blijkt uit door anderen ingetikte zoekopdrachten, dat er een associatie tussen de woorden Cohen en juif kan zijn. Wellicht is dit anders als het gaat om een identificeerbaar persoon waarbij op internet géén relatie met het geloof e.d. te vinden is. Dus als ik ‘Sybrand van Haersma Buma’ in Google intik en daarbij wordt ‘Nederlands Hervormd’, ‘Sneek’ of ‘CDA’ gesuggereerd, dan is dat géén persoonsgegevens, maar gewoon het resultaat van een zoekopdracht van Google of door anderen ingetikte zoektermen naast het woord Buma.

  18. Ik zoek zelf regelmatig op bedrijven en/of produkten in combinatie met de term “problemen” om uit te vinden of iemand problemen heeft gehad. Het zoekresultaat bepaalt dan of die problemen er wel of niet waren. Het feit dat Google mijn zoekterm dus aanvult met problemen betekent hooguit dat er meer mensen zijn die hierop hebben lopen zoeken en niet of er wel of geen problemen met dat bedrijft/produkt zijn.

  19. Ik vind het wel erg ver gaan om het gebruiken van een naam (met nadruk, niet ‘het noemen van een persoon’) het verwerken van persoonsgegevens betreft.

    Als ik zeg ‘Ik vind Marlies een mooie naam’ gaat dat toch helemaal niet om een persoon. Ok, daar wordt geen achternaam gebruikt. Maar: “‘Marlies Kip-Haan’, dat zou grappig zijn.”, daar noem ik ook geen persoon.

    Google gebruikt namen als woorden, niet specifiek als namen van personen. Bovendien is er een grote kans dat mensen een naam delen. Het gebruiken van een naam verwijst dus ook niet per se naar een persoon. Hoewel dat beide een beetje kort door de bocht is.

  20. @benrd: Waarom is dat geen persoonsgegeven? Je wéét nu toch dat Sybrand van Haersma Buma(*) een Hervormde CDA’er is uit Sneek? Die kennis is voor jou informatie en dus heb jij nu de beschikking over dat persoonsgegeven.

    (*) Ik moet me inhouden om er niet Stemra achter te typen elke keer.

  21. @19: Even opgezocht, valt inderdaad onder de definitie van persoonsgegevens. Maar betekent dit dat dit soort openbare gegevens onder de Wbp valt? Het zou wel erg ver gaan als van Google geëist kan worden dat dit soort gegevens niet getoond mag worden (als suggestie of als zoekresultaat). Wat zou ik dan als zoekresultaat krijgen als ik Sybrand van Haersma Buma in de zoekbox van Google intik?

  22. Misschien moeten we Mevrouw Rook-Worst ook eens om haar mening vragen, wanneer ze in verband wordt gebracht met de Hema. 🙂 Om over Borrel-Worst, Van ’t Blik-Worst de overige aangetrouwde leden van de familie Worst.

    Ik vind alleen een naam wel veel tekort schieten om als persoonsgegeven gezien te worden. Veel namen zijn veel te generiek of worden door veel te veel personen gedragen. Grote kans dat ieder Nederlands woord wel ergens voor kan komen als voornaam of achternaam, eventueel met een klein verschil in spelling.

    In ieder geval, ik vind “Wim ten Brink” niet echt een persoonsgegeven omdat er diverse personen in Nederland voorkomen met dezelfde naam. Het zijn er minder dan Jan Jansen, maar toch meer dan genoeg om mijn naam online te kunnen gebruiken zonder al te veel vrees voor mijn privacy.

  23. Ik blijf het een lastige materie vinden.

    Stel: je heet Anders Breivik. Kan je dan van Google verwachten dat een search op jouw naam geen autocomplete geeft naar het bloedbad op Utøya? Mag je straks onder het “right to be forgotten” verwachten dat de zoekresultaten dit bloedbad ook niet meer weergeven of dat zelfs de nieuwssites hun berichten uit die periode ontoegankelijk maken?

  24. Probleem is natuurlijk dat Google ook honderden zo niet duizenden dubieuze sites gebruikt waar de associaties tussen gegeven die daar gelegd worden vaak ongepast zijn.

    Stel dat het op islamitisch franse blog gebruikelijk is om politici waar ze het niet mee eens zijn uit te schelden voor vuile jood (zou zo maar kunnen). Dan kun je snel vele duizenden posts met associaties in google’s database hebben tussen de namen van Franse politici en het woord jood.

    Omdat de meeste mensen nooit op dergelijk blogs komen is het vreemd dat ze op de zoekpagina door de autocomplete functie met dit soort associaties worden geconfronteerd.

    Auto complete is handig voor sommige situaties maar niet voor alles. Google filtert bijvoorbeeld allerlei pornografische associaties al uit hun autocomplete omdat kinderen anders met vreemde suggesties worden geconfronteerd bij het zoeken op huisdieren. Misschien moeten ze bij zoiets persoonlijks als persoonsnamen geen autocomplete toepassen.

  25. @23,

    Het idee is aardig, maar op basis van welke criteria moet Google selecteren of een term een persoonsnaam is? Het filteren van een (klein) aantal woorden uit het woordenboek is nog wel te doen, maar dit idee lijkt me vrij lastig te implementeren.

    Bovendien: nogmaals: autocomplete is niet gebaseerd op de indexering van websites, maar op de zoektermen die door andere gebruikers zijn gebruikt. Pas als veel mensen zouden zoeken op de naam van die politicus in combinatie met de termen “vuile” en “jood” zou dit als autocomplete optie naar voren komen.

  26. Ik heb een iets diepzinniger, meer filosofische vraag:

    Wanneer wordt het bewerken van willekeurige teksten “verwerken van persoonsgegevens”?
    Bij het ledenbestand van een vereniging is het duidelijk dat het om verwerken van persoonsgegevens gaat; maar Google search begint met (openbare) teksten over allerlei onderwerpen, waar slechts nu en dan namen in voorkomen. Is alleen de voornaam “Jan” een persoonsgegeven, los van identificatie van een persoon? Is “Arnoud, juridisch blogger” genoeg? Ik roep “MathFox op Iusmentis”, moet Arnoud nu naar het CBP om zich als persoonsgegevensverwerker te melden?

    Vergeet niet dat Google begint met gegevens waarvan zij, noch haar algoritmen weten dat het over identificeerbare personen gaat. Een groot deel van de gegevens is niet-persoonsgerelateerde informatie.

  27. Een gegeven is een persoonsgegeven wanneer daarmee een persoon te onderscheiden is van een ander persoon. De naam “Jan” is niet genoeg, want dat identificeert niemand. “Mathfox” is wél genoeg, zeker in de context van deze blog, want die is er in deze context maar eentje en dat ben jij.

    Bovenstaande reactie bevat dus persoonsgegevens. Ik verwerk die, want volgens de wet is verwerken

    elke handeling of elk geheel van handelingen met betrekking tot persoonsgegevens, waaronder in ieder geval het verzamelen, vastleggen, ordenen, bewaren, bijwerken, wijzigen, opvragen, raadplegen, gebruiken, verstrekken door middel van doorzending, verspreiding of enige andere vorm van terbeschikkingstelling, samenbrengen, met elkaar in verband brengen, alsmede het afschermen, uitwissen of vernietigen van gegevens

    Dus ja, alles dat je kunt doen met gegevens.

    Er is natuurlijk de journalistieke exceptie, die zegt dat de Wbp niet geldt op journalistieke uitingen. Nou ja, niet geldt behalve artikelen 6 tot en met 11 , 13 tot en met 15 , 25 en 49. En ja dat is dan weer stiekem best veel – artikel 8 dat toestemming of noodzaak eist valt eronder en artikel 13 dat beveiliging eist valt eronder. Maar aanmelden bij het Cbp is artikel 27 en dat valt er dus niet onder.

    Een krant hoeft dus zijn uitgaves niet aan te melden. (Het abonneebestand wél want dat is geen journalistieke verwerking, maar er is een vrijstelling voor abonnementen.)

  28. Als ik praat over “Johann Strauss, Weens componist” of “Hank Williams, Amerikaanse gitaarspeler” zijn dat dan voldoende onderscheidbare aanduidingen zodat de WBP van toepassing kan zijn?

  29. Dat lijkt me wel ja. Iedere lezer van deze blog kan die verwijzingen duiden als zijnde twee individualiseerbare personen.

    Het hoeven geen namen te zijn. Eerder in deze draad reageerden ‘benrd’ en ‘hAl’, hoewel jij en ik niet weten hoe zij werkelijk heten zijn die aanduidingen tóch persoonsgegevens.

  30. Ik vind wel dat iedereen zich hier erg makkelijk achter de techniek verschuilt. Op het moment dat jouw naam door de autocomplete geassocieerd wordt met pedofiel of oplichter dan wordt je daar toch echt door benadeeld en zou dat verboden moeten kunnen worden. Google is uitstekend in staat om 98% van de persoonsnamen te filteren uit z’n autocomplete lijst.

    Dit heeft, m.i., niets te maken met het tegenwerken van innovatie maar alles met het beperken van negatieve gevolgen van die innovatie.

  31. @30,

    Het feit dat Google die naam autocomplete met het woord pedofiel of oplichter, betekent enkel dat vele gebruikers voor jou gezocht hebben op die combinatie. Daar zal ook wel een reden voor zijn, denk je niet? Het is natuurlijk altijd vervelend als je een naam deelt met een pedofiel, oplichter, massamoordenaar, etc. maar om dat probleem dan maar bij Google in de schoenen te schuiven lijkt me ook een vreemde gang van zaken. Mensen zullen, met of zonder die autocomplete, blijkbaar toch wel naar die combinatie op zoek gaan, want anders was het uberhaupt nooit in de autocomplete terecht gekomen.

  32. @Arnoud: opmerking 27 was een strikvraag: Wanneer vader en zoon in hetzelfde beroep terecht komen, kan heel makkelijk verwarring optreden. Vader Johann was het hoofd van een bijzonder muzikale familie en drie van zijn zoons (Johann, Josef en Eduard) schopten het ook ver als componist; daarnaast was er ook nog een neef Johann… Bij Hank Williams moet je je afvragen of ik de vader, de zoon of de inmiddels overleden grootvader bedoel.

  33. @31: Dat is natuurlijk niet helemaal waar. Als ik wil zoeken naar de garage van Jan Jansen en ik tik Jan Jansen in en Google vult dat aan met Pedofiel dan geeft Google mij die suggestie en dat ligt dan ook terecht op het bordje van Google. Google hoeft dat namelijk niet te doen, en sterker nog, Google kan dat makkelijk filteren. Dat ik toch wel zou zoeken naar Jan Jansen Pedofiel is natuurlijk onzin, en ook al doen miljoenen mensen dat wel, als ik dat niet van plan was, hoeft Google mij die suggestie niet te geven.

    Als ik zelf zoek op Jan Jansen Pedofiel en Google geeft mij hits met de combinatie Jan Jansen en Pedofiel dan is dat prima, en kan je Google daar (m.i.) niet op aanspreken.

  34. @33,

    Autocomplete is een functie die je in veel tools (zoals zoekmachines, textverwerkers, sms programma’s, etc.) terugvindt. Op basis van eerder getypte tekst worden dan suggesties gedaan over hoe je de zin/zoekopdracht af kan maken. Het feit dat je pedofiel toegevoegd krijgt aan de termen jan jansen groningen betekent enkel dat er heel veel mensen voor jou naar die combinatie van termen op zoek zijn geweest. Google doet daar niet aan informatieverwerking en is zich waarschijnlijk niet eens bewust van dat jan jansen hier een naam betreft.

    Dat er redenen zijn om deze functionaliteit in te willen perken vanwege bijvoorbeeld privacy redenen kan ik me voorstellen, maar leg Google dan maar uit wat de reguliere expressies zijn op basis waarvan ze deze informatie zouden moeten filteren en waar de grenzen liggen.

  35. De grens ligt bij (natuurlijke) personen. Dat je dat niet met een regexp eruit kan filteren is duidelijk maar er is meer in de wereld dan reguliere expressies. Google heeft heel erg veel informatie (denk aan het eigen Google+ netwerk maar ook namen uit LinkedIn, Facebook, etc) waardoor het echt niet zo moeilijk is dit te filteren.

    Maar dan nog, ik hoef dat Google helemaal niet uit te leggen. Dat het geautomatiseerd is, betekent niet dat dan alles maar mag. Google heeft het geautomatiseerd gemaakt, en kan het dus ook anders maken als het resultaat onwenselijk is. Jij draait de verantwoordelijkheid zo wel heel makkelijk om…..

    Als ik morgen een geautomatiseerde pagina maak met daarop alle informatie die gevonden kan worden over Jan Jansen dan is dat nog steeds niet rechtmatig alleen maar omdat het geautomatiseerd is.

  36. Als ik jouw voorstel goed begrijp zouden we dus geen autocomplete meer mogen hebben zodra er in de zoekterm een woord voorkomt dat ook als persoonsnaam kan gelden? Ok, dat is een verdedigbare visie.

    Ik denk dat de discussie iets dieper ligt. We hebben het hier tenslotte over handige features van een systeem tegenover de wet. Als die twee botsen, dan kunnen we twee dingen doen: 1. De maker (in dit geval Google) dwingen om de feature uit te schakelen. 2. De wet aanpassen.

    Dat is natuurlijk de ellende met moderne wetgeving: vaak kunnen de wetgevers niet overzien wat de gevolgen zijn van de manier waarop ze deze wetten opschrijven en soms worden we ook gewoon door de ontwikkeling van de techniek ingehaald. Ik denk dat het in veel gevallen verstandig zou zijn om te kijken naar de toepassing, een beslissing te nemen over de gewenstheid van die toepassing en op basis daarvan beslissen of we de wet willen aanpassen.

    Persoonlijk hecht ik weinig waarden aan autocomplete functies (in bijna alle tools die ze gebruiken), maar ik zie ook weinig problemen met de gegeven informatie. Uiteindelijk bepaalt toch het zoekresultaat hoe de mening zal verschuiven. De problemen van het delen van een naam met een pedofiel zal je dus niet kunnen voorkomen met het illegaal maken van de autocomplete functie.

  37. Oh, het is ook zeker niet een bedoelde feature van de Wbp dat je dit soort dingen moet kunnen aanpakken. Het ding is opgezet als een kapstokwet om in álle gevallen toepasbaar te zijn, vandaar al die open normen en vage eisen. En dan krijg je ook dit soort claims.

    Maar je kunt de context ietwat verschuiven: stel ik maak een variant hierop die niet autosuggestie/autocomplete doet maar “wat denkt de gemiddelde Google-gebruiker over persoon X”. En dan vul je een naam in (voornaam/achternaam) en pakt ie de autosuggestie-woorden in een mooi lijstje (eventueel met percentages: 83% probability this is a man; 23% this is a Jew). Dan krijgt het toch een wat andere toon.

  38. Dan kom je toch meer op het vlak van dataverwerking lijkt mij. Waar autocomplete gewoon een lijst is van de meest gebruikte zoektermen is het bij zo’n functie als jij nu omschrijft nodig om aan de termen betekenis te geven. Het resultaat “25% probability this is a problemen” bijvoorbeeld zou al nergens meer op slaan, net als “40% probability this is a jansen” bij de zoekterm “jan”.

  39. Ik denk dat de discussie iets dieper ligt. We hebben het hier tenslotte over handige features van een systeem tegenover de wet. Als die twee botsen, dan kunnen we twee dingen doen: 1. De maker (in dit geval Google) dwingen om de feature uit te schakelen. 2. De wet aanpassen.

    Wat jij een handige feature vindt, vinden sommige mensen (waaronder ik) een ongewenste feature zodra mijn naam daarin wordt aangevuld met (negatieve) woorden. Om daar de wet dan maar voor aan te passen lijkt mij niet echt zinvol.

    Google hoeft de feature ook niet uit te zetten, ze moeten deze alleen aanpassen.

    Ik zou het ook een handige feature vinden als ik alle informatie die de staat over mijn buren heeft, in zou kunnen zien. Omdat mijn buren die feature waarschijnlijk niet zo’n goed idee vinden zijn er regels opgesteld.

  40. De vraag is of de autocomplete wel aangepast kan worden zoals jij wil. Dat zou namelijk betekenen dat er een wettelijke voorgeschreven lijst zou moeten zijn met negatieve woorden (valt “juif” daar bijvoorbeeld onder) in alle talen en een lijst die door Google moet worden herkend als persoonsnamen. Wie gaat deze lijst opstellen en is deze voor elke regio weer anders? Ik vermoed dat het eindresultaat zal zijn dat de feature simpelweg uitgeschakeld wordt voor die landen die hier moeilijk over doen.

    Ook zal het niets veranderen aan de resultaten van de uiteindelijke search. Als een naam wordt geassocieerd met een bepaalde term zullen veel hits daar ook wel naar verwijzen. Met of zonder autocomplete.

  41. Natuurlijk kan het aangepast worden, als er een persoonsnaam in staat moet het uitgeschakeld worden. Punt. Hoe Google dat moet bepalen is niet mijn probleem en ook niet het probleem van de wetgever.

    Technisch gezien is het niet zo lastig om namen lijsten aan te maken en die te filteren. Als er dan toch iemand ABC of fiets heet, dan kan dat best onder overmacht vallen.

    Als Google morgen zijn Google bril maakt met een feature waardoor je een huis binnen kan kijken dan is dat niet gewenst omdat het een inbreuk op de privacy is. Ik hoef dan niet te bedenken hoe Google moet weten dat dat bij mijn huis niet mag.

    Let wel, het gaat hier niet over de zoekresultaten en als iemand wil zoeken op Jan Jansen Pedofiel dan mag dat, maar als iemand zoekt op Jan Jansen Garage en Google biedt als suggestie Pedofiel aan, dan is dat ongewenst.

  42. Natuurlijk is dat het probleem van de wetgever. Op basis waarvan moet Google bepalen wat wel en niet als naam mag worden aangemerkt en op basis waarvan moet Google bepalen welke termen wel en niet als autocomplete mogen worden gebruikt? Mag “pedofiel”? Mag “jood”? Mag “politicus”? Mag “sexy”? Mag “bangalijst”?

    Als het volgens de wet niet toegestaan is om persoonsnamen te koppelen aan bepaalde termen, dan mag je toch hopen dat er ook criteria zijn die bepalen welke termen dat zijn? Zo niet, dan betekent het inderdaad effectief het einde van de feature. Niet dat ik er een traan om zal laten, maar anderen denken daar wellicht anders over.

Geef een reactie

Handige HTML: <a href=""> voor hyperlinks, <blockquote> om te citeren, <UL>/<OL> voor lijsten, en <em> en <strong> voor italics en vet.