Politiek wil waakhond op algoritmes, maar ik heb liever een keurmerk voor de trainingsdata

| AE 11336 | Innovatie | 14 reacties

De Nederlandse politieke partijen D66 en CDA roepen het kabinet dinsdag in een motie op toezichthouder op te zetten die het gebruik van algoritmes bij de overheid in de gaten houdt. Dat las ik bij Tweakers maandag. De macht van algoritmes is een steeds grotere angst aan het worden: ze zijn niet transparant, ze kunnen al snel discrimineren of oneerlijk behandelen en ambtenaren voelen zich vaak verplicht om te doen wat het algoritme zegt in plaats van hun eigen afwijkende opvatting over de zaak door te zetten. Een loffelijk idee, alleen vergeten ze weer waar het eigenlijk om gaat: it’s the data, stupid.

Aanleiding voor het voorstel is eerdere berichtgeving van de NOS over de macht van algoritmes. Schokkend vond ik vooral dat niet duidelijk was waar en hoe men geautomatiseerde besluitvorming toepast, de NOS had vele wob verzoeken nodig om een en ander een tikje inzichtelijk te krijgen. De richtlijn moet duidelijk maken in welke gevallen gebruik van algoritmes wel of niet gerechtvaardigd is. Of er een volledig nieuwe toezichthouder moet komen of dat bijvoorbeeld de Autoriteit Persoonsgegevens extra bevoegdheden krijgt, moet nog worden besloten.

Een algoritme is een reeks instructies die door een computer wordt uitgevoerd, zo meldt de NOS netjes. Alleen hebben we het hier niet over algoritmes in klassieke zin, zoals in het stroomschema hier rechtsboven. Een klassiek algoritme is als een taartrecept: doe eerst dit, als de temperatuur hoog genoeg is doe dan dat, doe daarna zus tenzij X want dan zo. En computers gaan dat dan rechtlijnig uitvoeren. (Kennen jullie die van de programmeur die totaal uitgeput uit zijn douche werd gehaald? Op de shampoofles stond namelijk: haren natmaken, shampoo aanbrengen, uitspoelen, herhalen.)

Dergelijke algoritmes worden top-down ontworpen. Begin met de hoofdlijnen, zoek de simpele randgevallen en voeg daar uitzonderingen voor toe, draai het een paar keer en voeg extra uitzonderingen of bijzondere regels toe. Dat groeit door de tijd heen, maar in principe is elke stap bewust genomen en iedere uitbreiding weloverwogen. In theorie is daarmee iedere stap uit te leggen.

De algoritmes waar dit voorstel over gaat, zijn echter geen klassieke algoritmes. Ik zou dit haast kunstmatige intelligentie noemen maar het is gewoon machine learning: het zoeken naar trends en verbanden op basis van grote bakken met data. Eigenlijk gewoon statistiek: in deze bak data zijn dit de fraudeurs en dit niet, en dan flink doorrekenen wat die gemeenschappelijk hebben om zo een voorspellende functie te bedenken die voor een nieuwe aanmelding zegt of deze fraudeur is.

Die voorspellende functie, geladen met die data, is dan een algoritme in de zin dat het een reeks instructies is – maar praktisch gezien is het onvergelijkbaar met die klassieke algoritmen. Sterker nog: ik durf wel te zeggen dat die functie an sich totaal niet interessant is. Daar zijn er genoeg van, en hoewel ieder deep neural net vast zijn eigen prachtige theorie en implementatie heeft, is dat niet waar het om gaat. Laad datzelfde net met nieuwe data en je krijgt iets compleet anders.

Het gaat dus om die data en niets anders. Welke data gaat erin, hoe is die samengesteld en hoe wordt geborgd dat dit een eerlijke en objectieve samenstelling is? Want dáár komt al die ellende van. Vaak is data uit beperkte bron geselecteerd, of ergens aangekocht, en in ieder geval is ‘ie niet getest op representativiteit en actualiteit. Daar gaat het dan meteen mis, want met slechte brondata ga je natuurlijk nooit goede voorspellingen doen. Maar het enge is, het lijken bij het testen best goede voorspellingen want je houdt altijd een stukje van je brondata apart om eens mee te testen. En ik geloof onmiddellijk dat je dan goede uitkomsten krijgt. Logisch, het is dezelfde bron en op dezelfde manier gecategoriseerd.

Ik zou er dus hard voor willen pleiten om geen tijd te verspillen aan die algoritmes, maar juist de problemen bij de bron te bestrijden: geen data de overheid in tenzij met keurmerk. De data moet kloppen, eerlijk zijn en volledig. Dáár een toezichthouder voor lijkt me een prima idee.

Arnoud

Overheidssites scheppen verwarring met cookies van Google Analytics

| AE 11206 | Privacy | 19 reacties

Maar liefst 20 procent van alle sites van de rijksoverheid maakt gebruik van de analysesoftware van Google, las ik in de Volkskrant. Alex Bik van zakelijke internetprovider BIT onderzocht de bijna 1.200 websites van de Rijksoverheid op het gebruik van Google Analytics, de software van Google waarmee sitebeheerders het bezoek aan hun sites kunnen analyseren, en vond dat 236 sites deze dienst inzet. Dat is opmerkelijk, omdat er genoeg privacyvriendelijke alternatieven zijn die zelfs door de overheid worden gepromoot. Maar is het verboden?

In de kern komt de zorg van Bik erop neer dat er áltijd data naar Google gaat als je hun Analytics-dienst inzet, en dat is raar als het gaat om overheidswebsites. Als ik als burger de Nederlandse overheid bezoek, hoort niets van mijn bezoek bij een commerciële Amerikaanse partij terecht te komen, zou je zeggen.

Natuurlijk mag de overheid best meten hoe hun sites worden gebruikt, zodat ze deze kunnen verbeteren of leren waar mensen tegenaan lopen. Maar daarvoor is het hele geweld van Google Analytics niet nodig, er zijn genoeg alternatieven. Er is zelfs een standaard platform gebouwd dat met het vriendelijker, first-party analytics systeem Piwik werkt. Maar dat wordt slechts zeer beperkt ingezet, mede vanwege de wildgroei aan webbouwers die voor de overheid aan de slag is gegaan.

In theorie kan het best legaal zijn, ook wanneer de website geen toestemming vraagt voor de Analytics-cookies. Wanneer je als dienstverlener Analytics privacyvriendelijk configureert, voldoe je aan de richtlijnen van de Autoriteit Persoonsgegevens (en de uitzondering uit de cookiewet) en wordt je Analytics als “geen of geringe inbreuk op de privacy” aangemerkt. In dat geval is geen toestemming nodig – en is, althans op papier, Google niet toegestaan om die gegevens verder te gebruiken.

Het is precies dat “althans op papier” waar Bik terecht bezwaar tegen maakt. Want hoe zien wij dat? Er is bijvoorbeeld een vinkje in het Google Analytics dashboard nodig dat bepaalt dat data niet met andere Google diensten mag worden gedeeld. Van buitenaf is het onmogelijk om na te gaan of dat vinkje is gezet. Je moet de opsteller van de privacyverklaring maar geloven dat dit werkelijk zo doorgevoerd is. Ik vind dat best wel een grote stap, zeker bij een overheidsdienst.

Arnoud

Rechter oordeelt dat Trump op Twitter geen gebruikers mag blokkeren

| AE 10610 | Informatiemaatschappij | 40 reacties

President Donald Trump mag op Twitter geen gebruikers blokkeren, omdat dit in strijd is met de Amerikaanse grondwet. Dat meldde Nu.nl vorige week. “Op die manier wordt de vrijheid van meningsuiting daadwerkelijk, hoewel bescheiden, ingeperkt. Meer is er niet nodig om de grondwet te schenden.” aldus de rechtbank. Wanneer de overheid immers de burger toegang tot informatie weigert, is óók sprake van een stukje censuur. Een Amerikaanse ambtenaar die Twittert, mag dus geen mensen blokkeren vanwege hun opvattingen of reacties. En ja, dat zou in Nederland ook zo uitpakken, zij het via een iets andere route.

Zoals ik in augustus al blogde, wij hebben het Grondwettelijk recht van petitie: “Ieder heeft het recht verzoeken schriftelijk bij het bevoegd gezag in te dienen.” Dat recht geldt ongeacht het kanaal en er vallen ook vragen en kritiekpunten onder. Die moet je te allen tijde kunnen uiten.

Twitter is een elektronisch medium en dus een geschrift in de zin van dit artikel. Daarmee heeft iedereen dus het recht om via Twitter verzoeken, vragen, klachten en complimenten bij het bevoegd gezag in te dienen. Dat laatste begrip betekent zo veel als de overheid, maar dat iemand politicus is, betekent nog niet dat hij “bevoegd gezag” is. Hij moet echt aan de overheid verbonden zijn, maar zitting hebben in een gemeenteraad, de Eerste of Tweede Kamer of minister/staatssecretaris zijn is daarvoor al genoeg. Wanneer een Nederlandse overheidsfunctionaris mensen zou blokkeren, zou dat dus strijd met dit artikel opleveren.

De Amerikaanse route komt erop neer dat Twitter gezien wordt als een “designated public forum”, een plek waarvan de overheid zegt, hier praten wij met de burger. En wanneer de overheid dat doet, mag ze vervolgens niet zeggen “maar jij moet je mond houden”. Je bent een publiek forum of niet, in die visie. Je mag hooguit mensen uitsluiten voor wangedrag dat ongerelateerd is aan de inhoud van wat ze zeggen.

Het is nog niet bekend of en zo ja wanneer Trump de blokkade gaat opheffen.

Arnoud

Steeds meer Nederlanders lezen aanmaningen en berichten in MijnOverheid niet

| AE 9667 | Informatiemaatschappij | 61 reacties

Steeds meer Nederlanders lezen de berichten in de Berichtenbox van MijnOverheid niet, meldde Tweakers afgelopen woensdag op gezag van de Ombudsman. Daardoor krijgen die mensen waarschuwingen en aanmaningen niet onder ogen, wat tot gevolg kan hebben dat rekeningen oplopen en ze in de schulden belanden. Maar hoera, er komt een app dus alles wordt beter…. Lees verder

Mogen onze politici mensen op social media blokkeren?

| AE 9575 | Uitingsvrijheid | 17 reacties

Amerikaanse politici mogen van een rechter in de staat Virginia geen mensen blokkeren op sociale media, las ik bij Nu.nl. Dit is strijd met het 1st Amendment, de vrijheid van meningsuiting, omdat politici in een openbaar forum niet zomaar mensen mogen verbieden hun mening te uiten. En daaronder valt ook het als politicus jezelf afschermen… Lees verder

De overheid gaat mijn privacypolicygenerator kapodtconcurreren!

| AE 7550 | Privacy | 24 reacties

Het ministerie van Economische Zaken komt halverwege 2015 met een online dienst waarmee bedrijven hun privacyvoorwaarden kunnen versimpelen en transparanter kunnen maken, las ik bij Nu.nl. De dienst wordt ingezet omdat veel Nederlanders aangeven voorwaarden en het privacybeleid van online diensten die zij gebruiken niet lezen, met name (36%) omdat de tekst te lang is… Lees verder

Rijscholenvergelijker wil overheidsalternatief laten verbieden

| AE 7046 | Ondernemingsvrijheid | 18 reacties

De online rijscholenvergelijker Rijschoolregister.nl is van plan juridische stappen te ondernemen om een soortgelijk project van de overheid, de site Rijscholenkiezer.nl, te verbieden. Dat meldde Nu.nl onlangs. Het overheidsproject werd in september 2013 opgezet, toen Rijschoolregister.nl al ruim een jaar bestond. “We moeten het hier als twee studenten afleggen tegen een project dat 15 miljoen… Lees verder

Foto’s door twitterende agenten mag je wel degelijk overnemen!

| AE 6950 | Intellectuele rechten | 24 reacties

Wanneer agenten foto’s maken en op Twitter plaatsen, nemen de media die nogal eens over. De politie maakt daar opmerkelijk genoeg nu bezwaar tegen met een verwijzing naar haar auteursrechten. In een persbericht meldt men namelijk: Regelmatig duiken foto’s van twitterende agenten op in landelijke en regionale media. Volgens Niels Nijman is het niet toegestaan… Lees verder

Kan een tweetverzameling als publiekdomeindownload worden aangeboden?

| AE 6111 | Intellectuele rechten | 15 reacties

Intrigerende via Twitter: van een recent overheidscongres (Open data next 27 september 2013) werden alle tweets gebundeld en beschikbaar gesteld als .csv download. Mag dat? En vooral: mag er dan “Licentie: Publiek domein (CC0)” bij staan? Het is op zich een heel leuk idee om alle tweets van je congres of dergelijke gebeurtenis te bundelen…. Lees verder

Administratiekosten van het CJIB bij verkeersboetes

| AE 2246 | Informatiemaatschappij | 22 reacties

Niet echt internetrecht, maar ik krijg hier héél veel vragen over: mag het Centraal Justitieel Incassobureau die zes euro administratiekosten in rekening brengen als je een boete opgelegd krijgt? Dit met de discussie over administratiekosten bij bedrijven (mag het nu wel of niet) in het achterhoofd. Ja, het CJIB mag die administratiekosten in rekening brengen…. Lees verder