Mag Equens pintransactiegegevens doorverkopen?

hier-pinnenGrote ophef vrijdag: Pinbetaalprovider Equens wil de database van 2,2 miljard pintransacties per jaar te gelde maken, meldde onder meer Webwereld. Het zou gaan om geaggregeerde gegevens op postcodegebied, dus juridisch geen probleem en waar maakt u zich druk om. Dat kwam niet goed aan: diezelfde middag werd bekend dat men de verkoop had afgeblazen (huh, dus ze deden het al?). Maar had het nou gemogen?

De NOS meldt in een uitgebreid artikel dat ABN en Rabobank al juridische twijfels hadden. De crux zit hem in dat ‘herleidbaar’; gegevens die niet herleidbaar zijn tot een enkele persoon, vallen buiten de Wet bescherming persoonsgegevens oftewel de privacywet. Het is dus bijvoorbeeld toegestaan je bezoekerslogs te aggregeren en dan op dat niveau in het openbaar uitspraken te doen over bezoekers op je site: 94.3% van mijn bezoekers heeft een Nederlands IP-adres, bijvoorbeeld. Dat mag ik zeggen van de Wbp.

Aggregeren moet je wel goed doen, want de kans dat er tóch nog herleidbare informatie in zit, blijft altijd aanwezig. Het beruchtste voorbeeld is dat van de AOL query logs. In 2006 publiceerde het bedrijf voor wetenschappelijk onderzoek bestemde geanonimiseerde zoekdata – dacht men. De zoekopdrachten zelf bleken toch aardig persoonsgebonden, bijvoorbeeld omdat mensen zichzelf googelden, eh, aol’den.

De vraag is dus: als Equens zo’n pakket met data gaat verkopen, zijn er dan tóch mensen individueel te herkennen? Er zijn wellicht postcodes met slechts een paar inwoners (nieuwe wijken, grote landelijke stukken, etc) dus dan zou een pintransactie op wijkniveau ineens toch maar één persoon herkenbaar maken. En patronen in het koopgedrag maken mensen ook herkenbaar. In 2012 wist Amerikaanse supermarket Target dat een meisje zwanger was puur vanwege haar veranderde koopgedrag. Iets dat haar vader nog niet wist toen de toegesneden kortingsbonnen op de mat vielen.

Het is me niet duidelijk hoe ver Equens wil gaan. Ik lees “informatie leveren over welke winkels klanten bezoeken en hoeveel ze daar uitgeven” maar ook “alleen naar de wijk waarin de klant woont te herleiden”. Maar is dat zinnig, op wijkniveau? “In wijk 5 gaan meer mensen naar de Dirk”, hoe nuttig is dat? Heb je niet liever statistieken als “mannen van 50+ uit wijk 5 kopen hun wijn bij de Gall&Gall, terwijl jonge vrouwen dit bij de Dirk doen”? Daarmee kan de G&G eens een stunt voor rosé gaan doen bijvoorbeeld. Maar als je op dát niveau van aggregatie stopt, dan loop je toch weer de kans informatie te lekken – hoe veel mannen van 50+ wónen er in die wijk, en van wie dachten we toch al dat het een drankorgel was?

We zullen het wel nooit weten want dankzij de bliksemophef is het van tafel. Maar intrigerend is het wel.

Arnoud