Mag je klantgegevens voor een interne training gebruiken?

adresboek-gids-lijst-databank.pngEen lezer vroeg me:

Bij een interne training (ik ben software engineer) kregen we de opdracht een web-based CMS te ontwerpen inclusief klantendatabase. Prima, maar ik ontdekte dat de database échte gegevens bevatte. Er stond zelfs een familielid van me in! Mag dat zo maar, klantgegevens gebruiken voor trainingsdoeleinden?

Antwoord: Het gebruiken van klantgegevens mag eigenlijk altijd alleen als de Wet bescherming persoonsgegevens (Wbp) daar ruimte voor biedt. Er is geen letterlijk verbod op testen met productiegegevens. De eis is dat je de gegevens mag gebruiken voor het doel waarvoor je ze krijgt, en voor doelen die in duidelijk direct verband daarmee staan (art. 8 en 9 Wbp).

Het testen van de omgeving waarbinnen je persoonsgegevens wilt gaan gebruiken, lijkt mij zonder meer voldoende verband te hebben met het daadwerkelijk (productie) gebruik van die omgeving. Maar veel verstandiger is fictieve gegevens inzetten, en een ander artikel uit de wet (art. 11) eist dat je gegevens alleen gebruikt als dat “toereikend, ter zake dienend en niet bovenmatig is”. En daar is dan niet aan voldaan.

Bij dit doel gaat het nóg een stapje verder dan testen van een productieomgeving, namelijk een training van medewerkers met een fictieve omgeving. Dan is er geen enkele manier waarop het gegevensgebruik “toereikend, ter zake dienend en niet bovenmatig” zou kunnen zijn.

Soms vraag ik me af welke gedachtenprocessen er ten grondslag liggen aan “geef even een kopietje van alle klantgegevens want we gaan een training doen met IT”.

Arnoud

12 reacties

  1. Er is zelfs best goede software voor handen (voor een paar honderd euro) waarmee je in no-time een database kan vullen met fictieve data, waarbij je op kan geven wat voor gegevens er gebruikt moeten worden. (Rekening houdend met vulpercentages, foreign keys en noem maar op.)

  2. Soms vraag ik me af welke gedachtenprocessen er ten grondslag liggen aan “geef even een kopietje van alle klantgegevens want we gaan een training doen met IT”.

    Luiheid c.q. gemakzucht, lijkt me. “Geef me even de klantgegevens” (of een selectie van de klantgegevens) is sneller voldaan dan “Creëer even een verzameling fictieve klantgegevens”.

    1. Inderdaad deels luiheid en gemakzucht maar ik vermoed voor een groot deel ook dat “men” zich niet bewust is van dergelijke zaken. We foeteren met ons allen op de privacyproblemen bij de facebooks en googles van deze wereld, maar in ons eigen werk mogen we ook best wat kieskeuriger zijn. En als je dit probeert aan te kaarten, heb je grote kans dat dat weggewuifd wordt door een bobo die zich niet of niet voldoende bewust is van dit soort zaken. mompelt iets over splinters en balken

  3. Ik heb wel eens een generator geschreven voor fictieve persoonsgegevens. Bij de Amerikaanse census de meest voorkomende achternamen en voornamen gedownload, die random gecombineerd, geboortedatum er bij verzonnen volgens een redelijke verdeling, en dan nog wat gegevens automatisch gefingeerd.

    Daarna eens wezen Googlen op die fictieve namen: voor vrijwel elke fictieve naam was wel een (Amerikaanse) rechterlijke uitspraak te vinden (van echte personen).

  4. Misschien zijdelings gerelateerd: als je naar een callcenter belt (bv klantenservice van een postorderbedrijf) krijg je vaak een bandje te horen dat het gesprek kan worden opgenomen “voor serviceverbetering en trainingsdoeleinden”. Wat moet ik me daar dan bij voorstellen en mag dat gewoon?

    1. Volgens mij mag dat en is de voorwaarde dat één van de twee partijen op de hoogte is van de opname (in dit geval zijn beide partijen op de hoogte). Wat ik me echter wel afvraag: moet er een alternatief geboden worden waarbij dat niet het geval is (bijvoorbeeld schriftelijke correspondentie)?

  5. Voor dit soort doeleinden heb ik een klein setje van fictieve klantgegevens die ik overal voor kan inzetten en die redelijk realistisch overkomen. Deze fictieve gegevens staan gewoon in een notitieboekje en hebben daarnaast een email account onder mijn domeinnaam voor als dat nodig is. Daarnaast heb ik ze ook een Twitter, Facebook, Google+ en een LinkedIn account gegeven zodat deze fictieve klanten via deze providers kunnen inloggen. (Via OpenID.) Deze personages hebben ieder ook een goede voorgeschiedenis, netjes uitgewerkt, plus de nodige relaties en familieleden. Dit setje fictieve klanten komt dan ook realistisch over en dat is prima voor testdoeleinden waarbij het testmateriaal ook voor demo’s gebruikt kan worden. De vraag is nu eigenlijk iets anders: mag ik deze fictieve personen ook voorzien van willekeurige BurgerServiceNummers en bestaande adressen? 🙂

      1. Tja, een BSN is simpel te genereren maar hoe weet je of deze echt is of niet? De postcodes die het genereert zijn lang niet altijd bestaande postcodes en dat maakt het lastig als je een echt adres wilt gebruiken. Het moet immers redelijk realistisch overkomen. Het doel is namelijk om bij een demo het gevoel te geven dat er echte klantgegevens worden gebruikt terwijl dat dus niet het geval is. Als erom wordt gevraagd wordt toegegeven dat het om fictieve accounts gaat maar verder zou het niet van echt te onderscheiden hoeven te zijn.

        1. Het lijkt me dat je best werkelijke adressen en postcodes kunt pakken als dat voor de test nodig is. Hang er fictieve namen boven en willekeurige telefoonnummers binnen het toepasselijke netnummer en je bent er. Het is lastiger als je inderdaad ook Twitteraccounts nodig hebt van die mensen.

          1. Een fictieve twitter-account aanmaken is geen probleem. Misschien niet conform de voorwaarden van Twitter maar het proces zelf is heel simpel. Het doel van dergelijke, realistische data is om bij demonstraties een zo’n realistisch mogelijk beeld te geven. Je kunt dan laten zien dat je begint met een Twitter of Facebook account en hoe de informatie van die account kan worden overgenomen door de eigen website nadat deze gebruiker inlogt en hier toestemming toe geeft. Hoe er vervolgens statistieken over tweets weergegeven kunnen worden of de foto-sectie van de bezoeker die worden gekopieerd naar een beeldbank in de website. Het scheelt vooral omdat je dan niet de accounts van jezelf, je collega’s of van klanten te hoeven gebruiken en toch tijdens een demo een realistisch beeld te kunnen geven.

Geef een reactie

Handige HTML: <a href=""> voor hyperlinks, <blockquote> om te citeren, <UL>/<OL> voor lijsten, en <em> en <strong> voor italics en vet.