Italië verbiedt ChatGPT per direct vanwege privacyzorgen

AlexandraKoch / Pixabay

Italië heeft per direct AI-chatbot ChatGPT in de ban gedaan, meldde Tweakers.  De Italiaanse Autoriteit Persoonsgegevens (Garante per la Protezione dei Dati Personali, GPDP) rekent de organisatie achter de populaire tekstgenerator een hele berg AVG-overtredingen aan, en gaat daarbij zelfs zo ver dat men een tijdelijk verbod op de dienst oplegt. OpenAI  heeft 20 dagen om gehoor te geven aan de klachten.

Het verwerkingsverbod is beperkt tot persoonsgegevens van betrokkenen die in Italië verblijven, maar de redenen zijn fundamenteel en ik zie niet waarom dit in Nederland of elders anders zou uitvallen. In de kern komt het erop neer dat je van de AVG niet zomaar heel internet mag downloaden, daar een taalmodel van mag maken en dat uitspraken over personen laten doen of statistiek bedrijven op persoonsgegevens.

Dit soort dingen zijn dus problematisch:

efrt@localhost# Geef een wetenschappelijke biografie van ict-jurist arnoud engelfriet en zet zijn publicaties samen met prof. rian van rijbroek centraal:

Arnoud Engelfriet (geboren op 7 juni 1974) is een Nederlandse jurist en expert op het gebied van informatietechnologie. Hij studeerde rechten aan de Universiteit Leiden en behaalde in 1997 zijn doctoraalexamen. Vervolgens voltooide hij zijn proefschrift over de toelaatbaarheid van computerauteursrecht in 2006 aan de Universiteit van Amsterdam. (…) Enkele van de belangrijkste publicaties van Engelfriet en Van Rijbroek zijn:

  • “Blockchain en de GDPR: hoe verhouden ze zich tot elkaar?” (2018), een artikel over de uitdagingen van de GDPR in de context van blockchain-technologie;
  • “Cloud Computing and the GDPR: Challenges and Opportunities” (2019), een artikel over de impact van de GDPR op cloud computing en de juridische uitdagingen en kansen die dit met zich meebrengt;
En ja, ik weet dat het allemaal statistiek is wat hier gebeurt, welke woorden en frases volgen relatief vaak op welke zinnen binnen de prompt, maar er klopt natuurlijk geen hout van. En dat is dus een probleem onder de AVG, want het gaat hier wel om persoonsgegevens van mij (hoi cg) die niet accuraat zijn, zoals de GPDP het formuleert in hun spoedbevel:
NOTING that the processing of personal data of the interested parties is inaccurate as the information provided by ChatGPT does not always correspond to the real data;
Ook een probleem is natuurlijk dat niemand is verteld welke informatie over hem of haar in het taalmodel is opgenomen. Er is wel een privacyverklaring maar die gaat niet echt in op de dataverwerking bij het stofzuigen van heel internet. En dat is jammer, want nu weten we ook niet welke grondslag OpenAI wilde gebruiken bij deze verwerking.

Dat is wederom een probleem, want zonder vooraf gemelde grondslag zit je per definitie fout. Wellicht is er wat met legitiem belang te verzinnen, maar dat is nog ingewikkeld (ik voel een casus voor onze opleiding aankomen) en loopt onder meer tegen het probleem aan van doelbeperking: je moet bij alles ook specifiek zijn over je doelen. “We maken een taalmodel dat uitvoer over jou/op basis van jou produceert waar mensen van alles mee doen” is hoe je het ook wendt of keert geen AVG-compliant uitspraak.

Dan heb ik het nog niet eens gehad over het kunnen intrekken van toestemming (als ze dat als grondslag zouden kiezen), het recht van vergetelheid in de dataset (machine unlearning is niet echt een ding), inzage in wie je data opvraagt of de toegang van de dienst door minderjarigen zonder enig toezicht of waarborgen.

Inderdaad, dat is een vrij fundamenteel ding en ik zie niet meteen een oplossing. Ja, ze hadden een Ierse vertegenwoordiger moeten stellen want de toezichthouder daar laat je met alles wegkomen. Maar die is zelfs voor mij aan de cynische kant.

OpenAI heeft nu twintig dagen om te reageren:

OpenAI, which does not have an office in the Union but has designated a representative in the European Economic Area, must communicate within 20 days the measures undertaken in implementation of what is requested by the Guarantor, under penalty of a fine of up to 20 million euros or up to 4% of the annual global turnover.
Ik ben erg benieuwd en ga alvast popcorn inslaan.

Arnoud

31 reacties

  1. LOL Was wat archery related vragen aan het stellen waarbij gesteld werd dat “Schloesser has competed in the Olympic Games, representing the Netherlands at the 2012 London Olympics”, wat niet klopt. prompt: Mike Schloesser never competed in the olymic games! “I apologize for my mistake in my previous response. You are correct that Mike Schloesser has never competed in the Olympic Games. […]” Prompt: So what other mistakes did you make? Lange tijd een knipperende cursor “The server had an error while processing your request. Sorry about that! You can retry your request, or contact us through our help center at help.openai.com if the error persists.” Hahahahaha

  2. ja maar ja maar ja maar….

    Ik heb ik hen verleden al betoogd dat verzonnen gegevens geen AVG persoonsgegevens zijn, dat ga ik niet herhalen.

    Maar nu komt er nog bij: uit een bron waarvan iedereen weet, en die dat ook eerlijk zelft toegeeft, dat die van alles bij elkaar verzint. Een soort random generator, maar dan met een sausje ervover. En dan zijn het nog steeds persoonsgegevens?

    OK dan, waar is de limiet? Een echte randomgenerator die namen, geboortedata, geslachten, adressen random bij elkaar verzint? Genereert die nog steeds persoonsgegevens (99.9% foute persoonsgegevens, maar toch…)?

    En vraag 2: is dit wel wenselijk? Schiet een dergelijke brede interpretatie van de wet zijn doel niet voorbij ?

    1. We hoeven de discussie ook niet te herhalen, mijn punt is vooral dat AVG toezichthouders dus zeggen dat het wél persoonsgegevens over mij zijn als je verzonnen feiten over mij verspreidt. Uiteraard moet duidelijk zijn dat het over míj gaat. Deze blog van Nieuwspaal bevat een nepbericht met ene jurist Frietengel. Gaat dat over mij? Het is natuurlijk een parodie op een Nu.nl artikel waarin ik werd geciteerd.

      Het lijkt me wenselijk dat er geen onzin over mensen wordt verspreid op een manier die anderen serieus nemen. Nieuwspaal is niet serieus te nemen. Ik heb een paar keer gehad dat ik ‘advocaat’ werd genoemd, dat is onjuist dus daar wil ik wat tegen kunnen doen. Ook een onjuiste geboortedatum lijkt me fijn om aan te kunnen pakken.

      Tegenvraag: waarom vind jij het onwenselijk dat dergelijke onjuiste gegevens aangepakt kunnen worden? Neem concreet die lap tekst uit de blog die ChatGPT gemaakt heeft. Als dat in een of ander boek komt over “de top 100 juristen van Nederland”, moet dat kunnen of heb ik dan een recht daar bezwaar tegen te maken?

      1. Ik weet wel niet of ik AVG toezichthouders als volledig onafhankelijk en belangloos beschouw. Het zou me niet verbazen als er veel zijn die oogkleppen ophebben en coute-que-coute alles onder ‘hun’ wet willen beschouwen, ongeacht of dat wel lekker past en wat andere maatschappelijke belangen zijn.

        Natuurlijk wil je niet dat dat stuke in een serieus boek terecht komt.

        Maar in mijn optiek is het niet de generator (chatgpt) die verkeerd bezig, maar de persoon/uitgever die pretendeert dat die onzin correct is. Je wilt dus de verkeerde aanpakken.

        Verder vraag ik me af ‘Waarom AVG’? Die is er juist voor om echte, correcte, informatie te beschermen en het aantal kopieen daarvan te beperken. En natuurlijk hoort daarbij: onjuiste gegevens corrigeren. Maar onjuiste beweringen in boeken komen al eeuwen voor en er is een arsenaal aan juridische middelen voor. De AVG is goed om mensen te dwingen om voorzichtig met je gegevens om te gaan, maar past als een tang op een varken om bewust gegenereerde onzin en fantasien tegen te gaan.

        Kortom: De onzin is wel vervelend/schadelijk, en je hebt ook wel een belang om er iets tegen te doen, maar is de AVG nu echt het aangewezen middel?

        En dan is er nog altijd de wetenschap bij ieder verstandig mens dat je sowieso voorzichtig moet zijn met wat je hoort/leest, want er gaat altijd onzin rond. Over jou, over mij, over iedereen. Als mensen onzin willen geloven, geen kristisch vermogen hebben, dan ga je dat toch niet veranderen met een beroep op welke wet dan ook. En dat is vervelend, maar dat is nu eenmaal al een fact of life zolang er mensen zijn. Als jij denkt dat serieuze mensen alles zonder meer geloven wat ze lezen of horen, dan onderschat je ze.

  3. Ik wist van de feitelijke onjuistheden uit ChatGPT, maar deze insteek had ik nog niet geprobeerd. Nu maar eens wel.

    Vraag: Welke rol speelt de beeldend kunstenaar Ruud Harmsen in de Esperanto-beweging en in de ICT?

    Antwoord: Voor zover ik weet heeft de beeldend kunstenaar Ruud Harmsen geen specifieke rol gespeeld in de Esperanto-beweging of de ICT. Er zijn echter wel een aantal personen met de naam Ruud Harmsen die actief zijn geweest op deze gebieden, dus het is mogelijk dat er enige verwarring is ontstaan.

    Er is bijvoorbeeld een Nederlands esperantist met de naam Ruud Harmsen, die actief is geweest in de Esperanto-beweging. Hij heeft verschillende Esperanto-boeken vertaald en was lid van de redactie van verschillende Esperanto-tijdschriften. Hij heeft ook deelgenomen aan internationale Esperanto-congressen en andere bijeenkomsten.

    Wat betreft de ICT, is er een Nederlandse Ruud Harmsen die werkzaam is als softwareontwikkelaar en consultant. Hij heeft gewerkt voor verschillende grote bedrijven en heeft expertise in onder meer Java en Agile-softwareontwikkeling.

    Er is echter geen bewijs dat deze personen dezelfde zijn als de beeldend kunstenaar Ruud Harmsen. Dus als je meer specifieke informatie hebt over de context van je vraag, kan ik je mogelijk verder helpen.

    === Allemaal kolder. Ik ben geen beeldend kunstenaar, ook geen talent voor, maar er is wel een naamgenoot ergens die zich kunstenaar noemt. Ik heb me nauwelijks met Esperanto beziggehouden, en voor zover wel vrijwel niet in het openbaar, maar wel met Interlingua. Maar ik heb nooit een boek in het Interlingua vertaald. Wel korte verhalen, staat gewoon op Internet. Met Java heb ik vrijwel niets, en met Agile echt helemaal nul nul komma gedaan. Ik weet dat het bestaat, daar stopt het mee. Wel andere dingen in de ICT, maar niet meer professioneel, want met pensioen.

    Kortom hij zwamt allerlei halve dingen door elkaar en verzint de rest erbij. Ik vind dit echter vooral komisch, en zie er persoonlijk geen privacyprobleem in. Het laat wel zien hoe taalkundig briljant, maar ook beperkt dit tool is. Want een computer lopende zinnen in een mensentaal laten generen is echt niet makkelijk.

  4. het stofzuigen van heel internet

    Dat is kennelijk toch ook niet wat ze gedaan hebben. Ik heb hem net doorgezaagd over wat weetjes rond Interlingua, dingen die al decennia op internet staan, maar hij stapelt de ene onjuistheid en puur verzonnen flauwekul op de andere.

    Maar hij kan wel in en uit de kunsttaal Kotava vertalen, een taal die gauw honderd à duizend keer onbekender is dan Interlingua. En Interlingua spreekt en verstaat hij, op een enkel foutje na, uitstekend. Maar de basale feiten erover, waaronder persoonsgegevens, kent hij helemaal NIET, zonder dat zelf te onderkennen. Hoe kan dat nou?

      1. Ik hou het op verbluffende statistiek. Heel vaak staat deze frase na deze frase, althans in de context van die en die frase wat hoort bij dit cluster keywords. Het omzetten naar een andere taal is dan niet zo moeilijk, vertaalsites genoeg. Maar als je dan vraagt over de beeldend kunstenaar Ruud Harmsen dan krijg je frases die statistisch goed passen bij die term. Er zit geen factcheck in zoals dat hij even bij Wikipedia kijkt of jij dat wel bent.

        Een privacyprobleem is het niet, maar de grip op je persoongegevens wordt een stukje minder zo. Want straks zit dit in Bing Search en haalt een toekomst opdrachtgever jouw naam daar doorheen “is die Ruud Harmsen wel te vertrouwen” en varen ze blind op het antwoord.

        1. Het omzetten naar een andere taal is dan niet zo moeilijk, vertaalsites genoeg.

          Nou, ze zijn daar al zo’n 50 jaar mee bezig, en er kwam altijd brakke troep uit, tot DeepL, en sinds zo’n drie jaar maakt Google Translate ook voor het eerst correcte zinnen. Dat is wel echt een revolutie volgens mij.

          En ik had de indruk dat die slechte zinnen juist waren toen GT nog statistisch werkte. Pas toen ze Deep Learning gingen toepassen, net als DeepL, ging het dramatisch beter. En nu dus ChatGPT. Briljant indrukwekkend toch wel, nooit eerder zo goed gezien, maar ook met beperkingen die veel mensen niet beseffen. Daar zie ik het gevaar, de feitelijke onjuistheden die mensen gaan slikken als waar. Niet bij de privacy.

          1. Het punt is voor juristen dat feitelijke onjuistheden een kwestie van gegevensbescherming zijn, het recht van correctie (art. 16 AVG) gaat erover dat je dingen moet kunnen laten rechtzetten die niet kloppen. Dit geheel los van of ze je privacy schenden. Zeg maar als ik op het NOS journaal wat zeg over ChatGPT dan moet mijn achternaam correct gespeld zijn. En mijn geboortedatum in de basisregistratie personen moet kloppen, anders krijg ik problemen.

              1. Nog even over statistiek of Deep Learning. Kwam ook op Mastodon ter sprake. Chat GPT zelf erover:

                Statistical Machine Translation (SMT) and Neural Machine Translation (NMT), which is a type of Deep Learning, are two different approaches to machine translation.

                SMT is an older approach that relies on statistical models to translate languages. It uses algorithms that analyze a large corpus of bilingual texts to identify patterns and relationships between words and phrases in different languages. Based on these patterns, SMT generates translations that attempt to match the structure and meaning of the source text.

                NMT, on the other hand, uses deep neural networks to learn the patterns and relationships between words and phrases in different languages. It does not rely on pre-defined rules or patterns, but rather learns from large amounts of training data to generate translations that are more natural and fluent than those produced by SMT. NMT is considered a more advanced approach to machine translation, as it is capable of handling more complex language structures and producing translations that are more accurate and contextually appropriate.

                In summary, SMT relies on statistical models, while NMT uses deep neural networks to generate translations. NMT is considered a more advanced and accurate approach to machine translation, but requires more training data and computational resources than SMT.

  5. Garante zegt: Stop per direct met het verwerken van persoonsgegevens van burgers uit Italie.

    OpenAI: Prima, dan blokkeren we gewoon alle accounts van Italianen op IP.

    Lijkt me “hardball” spelen, zoals Google dat ooit eerder deed met klachten van kranten over overnemen nieuwsberichten in snippets. Je kan toch stoppen met verwerken van persoonsgegevens, en Italianen prima door laten werken? Heel die meuk blokkeren maakt Garante natuurlijk niet zo populair (Je ziet al dat Italiaanse ministers zeggen dan Garante te ver is gegaan).

    Garante zegt ook: Er is geen leeftijdscheck voor kinderen beneden de 13 jaar. Hierdoor kunnen kinderen blootgesteld worden aan zeer ontoepasselijke en schokkende inhoud bedoeld voor volwassenen.

    Dit is ook een raar aspect aan het verhaal. Je moet bij ChatGPT je geboortedatum opgeven, en een mobiel telefoonnummer hebben. Dus 12-jarigen moeten liegen om een account aan te maken. Ik geloof niet dat leeftijdsverificatie middels biometrie of paspoortscan nu zo’n verbetering is. En liegt je kind, dan liegt het natuurlijk overal op internet (gemakkelijk als het een eigen mobieltje heeft waar je geen zicht op hebt). Ik denk dat het op Google Image Search gemakkelijker is om inhoud te vinden die schokkend en schadelijk is voor kinderen, dan op ChatGPT (ik als volwassene kan daar nog geen scheldwoord of erotisch woord uittrekken).

    Voorts klaagt Garante over een security incident, waarbij gebruikers tijdelijk de berichtentitels van andere gebruikers konden lezen. Maar security is nu juist een legitieme grond om persoonsgegevens te verwerken niet? Er zijn 6 legitieme legale gronden in de GDPR, en vrijwel alle zijn relevant en toepasbaar op OpenAI. Maar Garante claimt dat er geen legitieme grond is?

    Klinkt alsof Garante een beetje hyperactief is, en zich wil laten gelden, en meteen maar de baby met het badwater weggooit. En OpenAI kaatst de bal terug, en trekt meteen de nieuwe economie van Italie onderuit voor 3 weken, door een blanket-ban te doen.

    1. OpenAI: Prima, dan blokkeren we gewoon alle accounts van Italianen op IP.

      GPDP: Er zitten nog steeds persoonsgegevens van Italianen in je dataset. Twee weken om die te verwijderen onder toezicht van een accountant, boete van 20 miljoen indien niet gehaald. CONSOB: U mag niet discrimineren in Europa. Of alle Italianen krijgen toegang of je gaat uit heel Europa weg. EDPB: Wij nemen de opinie van de GPDP over en bevelen aan dat alle gegevensbeschermingsautoriteiten dezelfde uitspraak doen.

      De wet kan al zesduizend jaar hardball spelen. Ik heb niet het gevoel dat OpenAI nu zó essentieel voor de maatschappij is dat de politiek daar werkelijk voor gaat liggen als het erop aan komt. Bij Facebook misschien wel gezien het belang om de achterban tevreden te houden.

      1. OpenAI: Prima, dan gaan we weg uit heel de EU. Veel succes met het innen van je boete, en ondertussen bouwen we lekker verder aan de technologie, die geeft ons een gigantisch concurrentievoordeel. De VS, China en andere landen die het niet zo nauw nemen met de privacy vinden het prachtig en met al die opgeslurpte persoonsgegevens kunnen ze zeer gericht de publieke opinie manipuleren op een manier waarbij het gerommel rond de Brexit of de verkiezing van Trump verbleekt.

        Vijf jaar laten is Europa een chaotisch toneel waar populisten elkaar de tent uit vechten, en lachen ze zich elders in de wereld krom over onze naïviteit. Maar ja, Fiat justitia et pereat mundus.

        Wat we hier waarschijnlijk veel beter mee kunnen doen is de technologie uitbreiden met “adjunct AI’s” die de chat monitoren, en ingrijpen als er foute dingen gebeuren. We moeten hier eens serieus kijken hoe we hier Azimov’s drie wetten van de robotica kunnen implementeren; en ook hoe we dezelfde technologie kunnen gebruiken om allerlei malversaties te herkennen en tegengaan.

  6. Het is lang geleden dat ik de vraag stelde.. ergens in 1999. Kunnen we informatie die op het internet staat wel toetsen als alle informatie die we nodig hebben om te toetsen uiteindelijk alleen maar op het internet te vinden is ?

    En wie is dan authoriteit cq specialist en wordt die dan serieus genomen. Ik zag bijvoorbeeld allerlei stellingen rond medische zaken in de corona tijd – heel veel vreemde stellingen en ideeën – en wie gaat deze allemaal uitzoeken en onderzoeken – wie heeft de tijd daarvoor ?

    Heeft Wikipedia nog de status als authoriteit en als het niet past.. wordt het aangepast.

    Ik heb nog een Leopold Encyclopedie uit 1939-1940 prachtige antieken – architectuur Is dit werk betrouwbaar : kijk eens onder CONC

  7. NOTING that the processing of personal data of the interested parties is inaccurate as the information provided by ChatGPT does not always correspond to the real data;

    Mijn inziens doelt dit op het security incident (caching bug), waarbij gebruikers tijdelijk de berichtentitels van andere gebruikers in konden zien, en ook de betaalgegevens als men betaalde voor ChatGPT plus.

    Als dit werkelijk betekend: Soms krijg je verkeerde informatie in een antwoord over personen, met persoonsgegevens, dan klopt daar helemaal niets van. ChatGPT is niet getrained op persoonsgegevens, maar filtert dit er allemaal uit. Er zitten wel persoonsgegevens in, maar alleen dingen als de namen van bekende personen (Ja, als er parodieen op je naam worden gedaan, dan ben je een bekend persoon). En dan nog is het heel erg lastig zulke gegevens eruit te halen (ChatGPT wil bijvoorbeeld de namen van Elon Musk’s kinderen niet geven, alhoewel die in nieuwsberichten staan en bij GPT bekend zijn).

    Nog een technisch dingetje (als Italie’s privacy mopperkont werkelijk doelt op foute antwoorden): Het is onmogelijk om een statistisch systeem (dus geen database) op te zetten dat nooit fouten maakt. Dit is een AI-hard probleem. Als OpenAI dit op kan lossen, dan heeft het AGI gemaakt. Dus, of Italie privacy waakhond snapt er de ballen van, of Italie mag nog een paar jaar wachten voordat het mee mag doen in de nieuwe kennis-economie.

    Ik denk dat ze om te tafel gaan, zich belangrijk mogen voelen, OpenAI uitleg kan geven dat het zeker wel een legitieme grond heeft om persoonsgegevens te verwerken (let wel, van gebruikers, niet “op internet”), en dat Italie snel weer volledig toegang krijgt. Je zal maar consent hebben gegeven, een bedrijf hebben dat gebruikt maakt van de API, en dan komt er een IP-ban, omdat de waakhond denkt dat OpenAI schokkende content serveert aan 12-jarigen. Ben je lekker klaar mee.

    1. Nee, dit gaat echt over het gegeven dat ChatGPT feitelijk onjuiste informatie over personen produceert met een air van echtheid. Zie het geciteerde voorbeeld uit mijn blog. Wat daar staat, is een bak persoonsgegevens die onjuist zijn en dus voor correctie vatbaar moeten zijn.

      Hoe bedoel je “filtert [persoonsgegevens] eruit”? Het voorbeeld beschrijft expliciet gegevens over mij en Rian van Rijbroek. Dat zijn toch persoonsgegevens?

      Ik geloof best dat het systeem nooit foutloos kan zijn. Niemand eist dat het foutloos moet zijn. Maar dit is té erge onzin. Een systeem dat zonder enig alarmbelletje dit oplepelt over mij of andere personen, werkt verkeerd.

      1. Enerzijds zeg je dat het statistiek is, anderzijds zeg je dat het persoonsgegevens zijn.

        Voor mij is dat niet verenigbaar.

        Als het statistiek is, gaat het niet over JOU, maar lijkt dat alleen maar zo. Het is eigenlijk alleen ‘de naam Arnoud Engelfriet komt vaak voor in combinatie met de volgende kenmerken:…..’ en dan in de vorm van een mooi verhaaltje gegoten, meer is het niet. Het gaat niet over de persoon Arnoud Engelfriet, maar over die lettercombinatie.

        Storend: Ja. Persoonsgegeven: Nee, IMHO

        1. Het citaat hierboven is een letterlijke uitvoer van ChatGPT. Dat is op basis van statistiek, toch zijn de uitkomst uitspraken over mij. De wijze van presenteren is wel degelijk relevant, anders hadden ze het wel als een serie Excel-grafieken gedaan lijkt me. Er is een reden dat het als chatbot gepresenteerd wordt en dat er leesbare teksten opgelepeld worden.

      2. Nee, dit gaat echt over het gegeven dat ChatGPT feitelijk onjuiste informatie over personen produceert met een air van echtheid.

        Dan is die dienst van Italie echt een oelewapper. Het kan mijn inziens alleen op die betaalgegevens doelen. ChatGPT kan dit immers niet in 20 dagen oplossen.

        Hoe bedoel je “filtert [persoonsgegevens] eruit”?

        Emails, niet vaak voorkomende namen, telefoonnummers, IPs, etc. deze worden eruit gefilterd, alvorens hierop te trainen. Heb je artikels met namen van beroemde personen als onderwerp (zoals Frietengel, en Rijbroek) dan is dit nieuws- en leer-waardig, en kun je erop trainen.

        Maar dit is té erge onzin.

        Vraag over feiten: Heeft Engelfriet en Rijbroek ooit samengewerkt? Krijg je zinnig antwoord. De ander is een leidende/zoekende vraag. Beetje zoals Dall-e of Midjourney vragen om Arnoud op Mars, en dan klagen dat je er nooit geweest bent. (Of dat text-generatie een verwerking is).

        OpenAI nu zó essentieel voor de maatschappij dat de politiek ervoor gaat liggen

        Volgens de Italiaanse minister van Infra en IT wel (essentieel voor de economie).

        1. Garante is overigens dezelfde dienst die een klacht indiende wegens vrijheid van meningsuiting in het geding, nadat Mark Zuckerberg “op persoonlijke noot” (‘via Bulgaars edict’) Trump van Facebook zou hebben gegooid. En deze klacht over OpenAI komt vlak na Tik-Tok verbod.

          Volgens mij doet die Garante pief zelf een Rijbroekje…

          A videocall is scheduled for tomorrow evening between representatives of OpenAI and the Italian SA (Garante per la protezione dei dati personali), which a few days ago ordered the platform to temporarily limit the processing of Italian users’ data until it complies with [Italian and European privacy legislation].

          Die klacht zit gewoon slecht in elkaar, als het ons onduidelijk is wat met:

          NOTING that the processing of personal data of the interested parties is inaccurate as the information provided by ChatGPT does not always correspond to the real data;

          wordt bedoeld.

          NOTING that the processing of personal data of the interested parties is inaccurate as the information provided by ChatGPT does not always correspond to the real data (provided by the interested parties);

        2. ” ChatGPT kan dit immers niet in 20 dagen oplossen.” Tuurlijk kan dat wel. Je bedoelt “ChatGPT wil dit precedent niet erkennen en is niet bereid geld uit te geven om GDPR-compliant te worden”. Want het zijn leuke smoesjes maar feit is en blijft dat er gegevens over personen uit die chatbot komen die niet kloppen, en dat dit is gedaan op basis van gegevens waarbij geen toestemming is gevraagd of legitiem belang aanwezig is. Daar had je eerder over na moeten denken als OpenAI zijnde, dat heb je niet gedaan, dan is het nu ingewikkeld maar dat is echt je eigen schuld.

          1. Een aantal jaren geleden heb ik een keer een lijstje gemaakt van de 100 populairste voor en achternamen in de VS, en liet een random-generator daaruit volledige namen genereren (voornaam, initiaal, achternaam). Elk van die random namen zocht ik daarna op op het internet, en dat leverde mij steevast een Amerikaans strafblad op, compleet met gegevens over geboorteplaats en datum, en de feiten waarvoor de persoon was veroordeeld. Mijn vraag, wanneer worden die random namen persoonsgegevens?

            1. Mijn standpunt: zodra je die gegevens gebruik om bestaande mensen te identificeren. In een roman “Jeroen de Vries, geboren 7 april 1974” opvoeren is helemaal prima en wijst op oog voor detail. Maar in je ledenadministratie dit fictieve persoon opvoeren als een betalend lid en jou dan een factuur sturen is niet in orde.

  8. Hebben ze geen eggevens over mij of zit er toch iets van bescherming van persoonsgegevens in? Ik heb het volgende gevraagd (Google geeft wel resultaten)

    Welke presentaties gaf [voornaam achternaam] over het spiral model of over PCTE

    Als ChatGPT heb ik geen directe toegang tot de specifieke presentaties van [voornaam achternaam]. Echter, ik kan wel algemene informatie bieden over het Spiral Model en PCTE.

    Het Spiral Model is een software ontwikkelingsprocesmodel dat in 1988 werd geïntroduceerd door Barry Boehm. [………..]

    PCTE (Portable Common Tool Environment) is een standaard voor software ontwikkelingstools die in de jaren ’90 van de vorige eeuw werd ontwikkeld. […………]

    Beide concepten zijn interessante en waardevolle onderwerpen voor presentaties over software ontwikkeling en zijn mogelijk door [voornaam achternaam] behandeld.

    1. Het hangt af van hoe bekend je bent en hoe je de vraag stelt.

      Als ik vraag: “Wat kan je me over [mijn naam] vertellen die zich bezig houdt met [mijn hobby]?” dan krijg ik als antwoord dat hij mij niet kent.

      Als ik vraag: “Kan je 25 personen noemen die bekend zijn vanwege [mijn hobby]?” dan rolt 1 op de 3 keer mijn naam eruit. Vervolgens kan je doorvragen en verzint ChatGPT allemaal onzin over mij.

      Dit gaat over een activiteit die ik eigenlijk 10 jaar geleden heb beëindigd en waarover je vooral informatie kan vinden op een oud forum. Er zit dus wel degelijk informatie over mij in dat model ingebakken ondanks dat ChatGPT als je het direct vraagt, zegt mij niet te kennen.

      Nu vind ik het wel grappig om ChatGPT-bekend te zijn, maar ik vraag me af hoe ze dat gaan doen als iemand zijn recht van vergetelheid wil uitoefenen. Er is namelijk geen enkele manier om de informatie uit het model weg te halen behalve het model opnieuw te trainen, en dat is natuurlijk ondoenbaar als je dat voor ieder verwijderverzoek moet doen.

Geef een reactie

Handige HTML: <a href=""> voor hyperlinks, <blockquote> om te citeren, <UL>/<OL> voor lijsten, en <em> en <strong> voor italics en vet.