“Politie mag niets doen met datamining van eigen bestand”

data-mining-mijnen-graven-downloadenLekker tendentieus, dachten ze bij Webwereld:

Veel veroordeelde én potentiële pedofielen verraden zich door hun profiel en gedrag op Hyves, blijkt uit datamining-onderzoek. De politie mag officieel niks doen met de resultaten.

De bevindingen uit de eerste zin komen uit het proefschrift Algorithmic Tools for Data-Oriented Law Enforcement van onderzoeker Tim Cocx. Cocx analyseerde politiedatabanken met gegevens over alle Nederlanders die sinds 1998 zijn veroordeeld voor een misdrijf, of in de afgelopen zes maanden zijn verdacht van een misdrijf. Hiermee legde hij “talloze significante en onbehaaglijke verbanden bloot tussen bepaalde bevolkingsgroepen en crimineel gedrag.” Zo blijken vrouwen in de database zijn significant vaker verslaafd aan drugs dan mannen, en is er een correlatie tussen verdenking van doodslag en veroordeling wegens racisme. En, het onderwerp uit de openingszin, veroordeelde pedofielen blijken meer minderjarigen in hun Hyves-netwerk te hebben dan gemiddelde volwassenen (18% tegen 10%).

Maar hoezo “de politie mag niets doen met de resultaten”? Volgens Cocx in het hoofdartikel over zijn onderzoek:

Ik kan me voorstellen dat in sommige situaties er alarmbelletjes gaan rinkelen bij de politie. Je kunt er ook beleid op gaan baseren. Maar voorlopig wordt er niets mee gedaan omdat het niet toegestaan is. Je mag data wettelijk alleen gebruiken voor het doel waarvoor ze zijn verzameld. Dit heeft geen prioriteit.

Maar waar dan dat “niet toegestaan” vandaan komt? Ik vermoed dat Cocx heeft gekeken naar de Wet Bescherming Persoonsgegevens, die in artikel 9 verwerking verbiedt voor doelen die niet verenigbaar zijn met het oorspronkelijke doen. Maar de Wet Bescherming Persoonsgegevens geldt niet voor bestanden met persoonsgegevens die de politie aanlegt (art. 2 lid 2 sub c Wbp). Daar is de Wet Politiegegevens voor bedoeld. En die zegt:

Politiegegevens worden slechts verwerkt voor zover dit noodzakelijk is voor de bij of krachtens deze wet geformuleerde doeleinden.

waarbij “politiegegevens” dan synoniem is voor “persoonsgegevens waar de politie mee werkt”. Eén van die doelen is (artikel 8, leden 1 en 2 WPol):

1. Politiegegevens kunnen worden verwerkt met het oog op de uitvoering van de dagelijkse politietaak gedurende een periode van één jaar na de datum van de eerste verwerking.
2. Voor zover dat noodzakelijk is met het oog op de uitvoering van de dagelijkse politietaak kunnen politiegegevens ten aanzien waarvan de in het eerste lid genoemde termijn is verstreken geautomatiseerd worden vergeleken met politiegegevens die worden verwerkt op grond van het eerste lid teneinde vast te stellen of verbanden bestaan tussen de betreffende gegevens. De gerelateerde gegevens kunnen verder worden verwerkt met het oog op de uitvoering van de dagelijkse politietaak.

En dit lijkt me nu precies wat Cocx heeft gedaan: oude en nieuwe gegevens met elkaar combineren om vast te stellen of er verbanden bestaan. Die verbanden mogen dan worden gebruikt voor de dagelijkse politietaak.

Kortom, “niets doen” lijkt me niet juist. Wel vraag ik me af wat de politie kàn doen met deze gegevens. Want het is vast wel interessant als borreltafelfeitje dat “joyriders het ook niet zo nauw nemen met de arbeidswetten en alcohol” maar wat moet je daarmee als agent?

Arnoud

8 reacties

  1. Linkje naar het proefschrift is helaas stuk.

    Wat ik me afvraag is hoe de goede man aan de gegevens van bijvoorbeeld hyves-gebruikers komt. Ik maak zelf geen gebruik van hyves, maar ik neem aan dat er wel een ‘private profile’ vinkje is. Of is er een wet die hyves verplicht om dergelijke profielen open te stellen voor de politie? Hoe dan ook, beleid baseren op dergelijke gegevens kan nuttig zijn, maar is wel riskant. Dat zegt de onderzoeker zelf ook wel;

    Cocx zou er, op grond van zijn resultaten, ook voorzichtig mee omspringen: “In marketing is een succespercentage van 85 procent hoog en met succes toe te passen in campagnes. Maar voor opsporing is een foutenpercentage van 15 procent tegenover mensen die je onterecht verdenkt niet aanvaardbaar.”

    Trouwens,

    1. Politiegegevens kunnen worden verwerkt met het oog op de uitvoering van de dagelijkse politietaak gedurende een periode van ??n jaar na de datum van de eerste verwerking. 2. Voor zover dat noodzakelijk is met het oog op de uitvoering van de dagelijkse politietaak kunnen politiegegevens ten aanzien waarvan de in het eerste lid genoemde termijn is verstreken geautomatiseerd worden vergeleken met politiegegevens die worden verwerkt op grond van het eerste lid teneinde vast te stellen of verbanden bestaan tussen de betreffende gegevens. De gerelateerde gegevens kunnen verder worden verwerkt met het oog op de uitvoering van de dagelijkse politietaak.
    Hoe kan je gegevens na het verstrijken van de termijn nog gebruiken? Het staat hier wel niet letterlijk, maar ik neem aan dat deze gegevens na de aangegeven termijn verwijderd worden? Als dat niet zo is heeft het eerste lid van het bovenstaande weinig nut, lijkt me, omdat je onder lid 2 alsnog alle gegevens mag verwerken. Of lees ik het nu verkeerd?

  2. Ik vermoed dat ie die link heeft weggehaald omdat WW ernaar dieplinkte. Zal wel even te veel verkeer veroorzaken. Op dit moment kan ik er nergens een link naar vinden, ook niet via zijn overzicht van publicaties.

    Hij heeft zo te zien namen uit de politiebestanden gebruikt als zoekopdracht in Hyves. Daar heb je geen bijzondere toegang voor nodig: je kunt bij wijze van spreken in Google “Rens Heijden site:hyves.nl” doen en zien of jij een profiel hebt. (Hoe je dan precies het aantal vrienden achterhaalt, weet ik niet.)

    Politiegegevens mogen langer worden bewaard maar mogen na een jaar niet meer voor de “dagelijkse politietaak” worden ingezet. Dus oudere gegevens liggen nog wel ergens maar zijn alleen onder lid 2 nog te gebruiken.

  3. Priv? profielen zijn ook niet meegenomen, alleen zij die hun eigen naam gebruikten in hun profiel op Hyves.

    Ik sluit me aan bij Arnouds laatste opmerking “wat moet je er daarmee?”. Ik vind het een behoorlijk nutteloos onderzoek, want wat wil je er mee zeggen? Wat is het doel achter het onderzoek? En wat is je volgende doelgroep? “Dieven blijken meer winkels in hun profiel te hebben staan” of iets dergelijks?

    Voor mij is dit onderzoek (en vooral de publicaties) het inspelen op de toch al heftige klopjacht die er momenteel gemaakt wordt. Pedofielen lijken de heksen van 2010 te gaan worden. Doet me denken aan Mc Carthy uit de jaren 50……

  4. Als hij inderdaad op basis van WBP art 9 heeft besloten dat de politie niets met de resultaten van het onderzoek zou mogen doen vraag ik me af op welke basis hij besloten heeft dat gebruik van de betreffende bestanden voor dit onderzoek wel toegestaan zou zijn ?

  5. @-Herman-, ook die van 2009 had ik de indruk. Overgens denk ik dat het nut van het onderzoek vooral in het veld van data-mining zelf ligt en niet zo zeer in het bestrijden van misdaad. Maar om zoiets te weten is een kopie van het proefschrijf zelf handig.

    @Arnoud, bedankt voor de toelichting.

  6. Geef het wat tijd, Arnoud. Nu bekend is dat zulke gegevens bstaan vind ergens een politicus wel een mogelijkheid om er een wet van te maken. Significante relatie tussen joyriders, het schenden van arbeidswetten, en alcohol? Dan verbieden we toch het alcohol gebruik voor, tijdens en na werktijd. Maar thuis mag nog wel wat drinken, hoor, als je tenminste dan niet aan het werk denkt.

  7. Ik weet niet precies wat er achter de bewering zit, maar het lijkt me niet meer dan normaal dat dergelijke statistische verbanden geen reden kunnen zijn om iemand die aan een bepaald profiel voldoet van zijn bed te lichten. En ook niet om zijn telefoon te gaan tappen of in de toekomst zijn kilometerkastje door te pluizen.

    Maar goed, wat nu normaal is zal dat in de toekomst niet meer zijn. Voldoende is een paar vette berichten in de media en dan hebben we weer een nieuwe wet.

Geef een reactie

Handige HTML: <a href=""> voor hyperlinks, <blockquote> om te citeren, <UL>/<OL> voor lijsten, en <em> en <strong> voor italics en vet.