Autoriteit Persoonsgegevens: bedrijven mogen internet vrijwel nooit scrapen, nou nou nou

Photo by Hans-Peter Gauster on Unsplash

Scrapen van informatie op internet is in vrijwel alle gevallen illegaal, stelt de Autoriteit Persoonsgegevens. Dat meldde Tweakers gisteren. De toezichthouder bracht een ‘handreiking‘ uit over ‘scrapen’ van ‘data’ op ‘internet’, en getuige mijn inbox waren velen onaangenaam getroffen door de strekking.

De basis lijkt me niet controversieel: wie profielen op sociale media en andere dergelijke data binnenharkt, zal gewoonlijk persoonsgegevens verwerken en moet zich dan aan de AVG houden. Dat betekent dus dat je die mensen moet melden dat je hun gegevens binnenhaalt en ze gelegenheid moet geven te protesteren en/of correcties dan wel verwijdering te laten uitvoeren.

De insteek van de AP is echter fundamenteler: het is “bijna altijd illegaal”. Daarmee bedoelen ze “rechtmatig” (art. 5(1)(a) AVG), wat ze dan baseren op drie specifieke problemen:

  • grondslagen en doelbinding
  • bijzondere persoonsgegevens
  • strafrechtelijke persoonsgegevens
Allereerst de grondslag. Als dataharker ben je zelf verwerkingsverantwoordelijke, dus je moet zelf een grondslag kiezen en onderbouwen. (Je kunt niet meefietsen op bijvoorbeeld de grondslag van Linkedin en dan redeneren dat jouw hergebruik daar slechts een variant op is.)

Die grondslag zal vrijwel altijd het “eigen gerechtvaardigd belang” (art. 6(1)(f) AVG) zijn van de partij die de gegevens binnenharkt. En dan komen we bij het eigenlijke punt dat de AP wil maken: een “zuiver commercieel belang” mag niet tellen als “belang” in de zin van de AVG. Daar is inderdaad al de nodige herrie over geweest en de zaak ligt nu voor bij het Hof van Justitie.

De AP stelt zich op het standpunt dat iets alleen als “belang” kan tellen als het tot een wet te herleiden is. En “zuiver commercieel handelen” staat nergens in een wet en dus is het geen belang onder de AVG. Ik heb daar enorme moeite mee, gezien het feit dat artikel 16 Handvest de “vrijheid van ondernemerschap” expliciet erkent. Geld willen verdienen is dus een grondrecht en daarmee een rechtens te respecteren belang. Daarnaast is er de vrijheid van informatie (art. 11 Handvest), die ook toeziet op het binnenharken van informatie. En je oogmerk doet er niet toe; informatievrijheid geldt ook voor bedrijven.

Dat wil natuurlijk niet zeggen dat alles mág als je Eurotekens er achter zet. De belangenafweging van de AVG is nadrukkelijk in het voordeel van de betrokkenen geformuleerd. De handreiking gaat hier niet verder op in, maar adviseert mensen om “zorgvuldig” na te denken wat de afweging moet zijn. Wel noemt men een aantal factoren, zoals omvang van de dataset en op welke criteria deze doorzoekbaar is: een statistisch model met algemene uitspraken is iets heel anders dan een kopie van geheel Nederlands Linkedin waar je op persoonsnaam in zoekt.

Dit haakt in op de twee andere factoren: het is goed mogelijk dat je ook bijzondere persoonsgegevens (zoals etnische afkomst, seksuele voorkeur of religie) meeharkt of zelfs de vaak vergeten strafrechtelijke persoonsgegevens. En dat is echt problematisch, omdat je als harker eigenlijk nooit een legitieme reden hebt om dat te doen.

De AP trekt daarbij een harde lijn, die volgens mij de enige juiste is:

Slaat u zowel gewone als bijzondere persoonsgegevens op in één database, dan is het beschermingsregime voor bijzondere persoonsgegevens van toepassing op alle gegevens in deze database. Kunt u niet uitsluiten dat u (ook) bijzondere persoonsgegevens verwerkt? Dan geldt het (zwaardere) beschermingsregime voor bijzondere persoonsgegevens.
Hierbij geldt dat alleen een actieve handeling van de betrokkene zelf als excuus kan gelden. Een voorbeeld: op Linkedin kun je je voornaamwoorden instellen. Daaruit kun je een seksuele gerichtheid afleiden, wat dus problematisch is maar omdat dit een actieve en bewuste keuze is (je hóeft het niet te doen) valt dat buiten het verbod.

De uitspraak dat het “bijna altijd illegaal” is, is dus vooral gebaseerd op het gegeven dat je bijzondere persoonsgegevens verwerkt en dat je daarbij niet kunt zeggen dat men dit alles zelf openbaar gemaakt heeft. De AP merkt in de handreiking zelf al op dat hier redelijkerwijs vraagtekens bij te stellen zijn en dat alleen het Hof van Justitie die kan beantwoorden. Het is dus wel nogal een aanname die hier wordt genomen.

Een meer algemeen bezwaar is de juistheid. Naast dat je mensen moet informeren dat jij hun gegevens binnenhaalt (ja, dat moet jij doen en wel actief, dus met een mail of pb), moet je mensen gelegenheid geven hun gegevens te corrigeren. Je zal net gehackt zijn en een cryptoscam op je Facebook krijgen op de dag dat zo’n hark langskomt: dan zullen toekomstige werkgevers je nog lang associëren met dubieuze cryptoverkoop.

Ik zie de handreiking alles bij elkaar vooral als een signaal: er is nog héél veel cowboygedrag in dataharkland, en dat moet maar eens afgelopen zijn. Als jij je processen op orde hebt, weet welke data je binnenhaalt en waarom, bijzondere gegevens wegfiltert en zorgt voor transparantie (inclusief rechten uitoefenen), dan is er verder weinig aan de hand. Als.

Leuk detail nog: wie een AI bouwt die op basis van dataharken is getraind, moet in zijn conformiteitsverklaring (Annex V AIA) expliciet verklaren volledig AVG compliant te zijn. Een aansprakelijkheidsbeperking is daarbij niet mogelijk, en onder de binnenkort te verwachten AI Liability Directive geldt zelfs een omgekeerde bewijslast. Inkopers van AI kunnen dus sturen op dit logo.

Arnoud

 

 

Advocaten opgelet: verzenden ‘beschadigd document’ voor risico van advocaat

Photo by selline on Pixabay

Het risico dat een digitaal bij de rechtbank ingediend document niet geopend kan worden, ligt bij de verzender, aldus de Hoge Raad. Dat las ik op de blog van Ekelmans Advocaten (via). Wie dit niet wil lopen zal “ouderwets een koerier moeten sturen”. Er klopt iets niet helemaal als een ict-storing leidt tot inschakeling van een fysiek alternatief.

Wie wil procederen, heeft sinds een paar jaar de optie om alles digitaal te doen. Niet via e-mail, maar met het speciaal ontworpen systeem van Veilig Mailen, afkomstig van leverancier Zivver. (De fax is in 2022 afgeschaft.) Er zijn ook alternatieven, maar VM is het bekendste hulpmiddel.

In deze zaak stuurde een advocaat een beroepschrift via Veilig Mailen en wel op de dag voor het verlopen van de termijn van hoger beroep. Of nou ja, dat zeg ik nou wel, maar was het wel een beroepschrift? Het openen van de pdf gaf namelijk de Adobe-foutmelding “Er is een fout opgetreden tijdens het openen van dit document. Het bestand is beschadigd en kan niet worden gerepareerd.” Een papieren beroepschrift arriveerde pas een kleine twee weken later.

Een best wel kritieke storing dus. Niet tijdig ingediend is geen hoger beroep. En de inhoud is niet te controleren, dus we weten niet wat er is ingediend in die bijlage.

Een kopie van het bestand was naar de advocaat van de wederpartij gegaan, en ook die had het niet kunnen openen. Dat wijst er inderdaad op dat het een fout was in het document zelf.

In het zakelijk verkeer stuur je afzenders een mailtje “je bijlage is kapot” als je zo’n foutmelding ziet. Die kan het dan nogmaals sturen. Bij de rechtspraak zit men er iets formeler in:

Resteert de vraag of de hiervoor onder 5.1 tot en met 5.4 geschetste gang van zaken het hof aanleiding had moeten geven tot het bieden van een herstelmogelijkheid, al dan niet met het geven van een (extra) termijn. Het hof beantwoordt die vraag ontkennend. Het mailen – één dag voor het verstrijken van de beroepstermijn – van een beschadigd, niet te openen, bestand dient voor risico te blijven van appellant. Daarbij komt dat de advocaat van de man op 18 oktober 2022 ’s ochtends door de wederpartij erop is geattendeerd dat de desbetreffende bijlage niet kon worden geopend.
Als jij op de laatste dag dingen mailt en er gaat wat mis, is dat geheel en al jouw risico. De rechtspraak hoeft je niet die dag nog te berichten dat de bijlage niet te lezen is, laat staan dat ze de termijn voor je moeten verlengen zodat je het stuk alsnog kunt indienen.

Er wordt nog wat gegoocheld met bestandsgroottes:

De door [de advocaat] overgelegde screenshot toont immers een gezamenlijke bestandsgrootte van 155,5 Kb (hoger beroepschrift en V-formulier). De daaruit voortvloeiende omvang van het hoger beroepschrift valt niet te rijmen met de vaststelling van het hof dat bij scannen door het hof het ‘kale’ beroepschrift – dus zonder de bijlagen – een bestandsgrootte van 336 Kb heeft, en evenmin met een bestandsgrootte van 142 Kb zoals die blijkt uit de door [de advocaat] overgelegde screenshot van de Adobe Acrobat bestanden op haar computer.
Voor mij is het onlogisch dat een save-as-pdf qua omvang hetzelfde zou zijn als een scan-to-pdf van een stuk papier. En omdat de pdf kennelijk kapot is, zou de advocaat het ook niet hebben gered met een nieuwe save-as-pdf: die zou meer data hebben omdat die niet corrupt is.

Ik vraag me af hoe je wél aantoont dat een bestand met omvang X een corrupte versie is van een bestand met omvang Y.

De ietwat irritante maar onvermijdelijke conclusie is dan ook zoals advocate Van der Keur schrijft:

 telefonisch nagaan bij het gerecht of het processtuk kan worden geopend. En anders zal hij toch ouderwets een koerier moeten sturen.
Ergens voelt het scheef dat de Rechtspraak niet bereid is om bij (niet vaak voorkomende) problemen even te bellen, maar wel bij íeder ontvangen stuk wil aangeven dat het goed is aangekomen.

Arnoud

 

 

Is Meta’s LLaMa 3 model echt open source of niet?

Bron: LLaMA 3 Github repository, Meta

Meta brengt Llama 3 binnen een maand uit, zo las ik bij Tweakers. Het gaat niet om één model, maar om een samensmelting van meerdere modellen die samen Llama 3 vormen. Over de kracht laat ik me even niet uit, maar ik lees overal dat het model “open source” is. En dat is hier niet zomaar een term: het kan het verschil maken tussen wel of niet onder de AI Act vallen.

De FAQ van Meta zelf noemt het een maatwerk commerciële licentie:

Llama models are licensed under a bespoke commercial license that balances open access to the models with responsibility and protections in place to help address potential misuse. Our license allows for broad commercial use, as well as for developers to create and redistribute additional work on top of Llama models. We want to enable more innovation in both research and commercial use cases, but believe in taking a responsible approach to releasing AI technologies.
Alleen al deze tekst wijst erop dat we het niet echt open source kunnen noemen. De open source definitie eist immers het tegenovergestelde van “responsible approach”, namelijk “No Discrimination Against Fields of Endeavor”. Alles moet kunnen, ook Het Kwaad, als je dat zou willen.

De licentie van Llama 3 bevat inderdaad forse restricties op de gebruikelijke vrijheden die we in open source kennen:

  • Je wordt verplicht je aan de wet én de AUP van Meta te houden. Dat eerste lijkt triviaal, maar waar bemoeit Meta zich mee, mijn compliance is iets tussen mij en de toezichthouder. En dat tweede is natuurlijk wel een probleem want AUP’s kunnen wel van alles zeggen.
  • Je mag geen andere LLM’s trainen met Llama of haar output.
  • Als je meer dan 700 miljoen actieve maandelijkse gebruikers hebt, dan moet je een aparte licentie kopen.
  • Een rechtskeuze voor Californië en een forumkeuze aldaar.
Twijfelachtig is de reclame-eis (“Built with Meta Llama 3”), dit doet denken aan de aloude “All advertising materials mentioning features or use of this software must display the following acknowledgement”-tekst uit de BSD licentie. Die wordt meestal niet als problematisch gezien, maar het maakt de licentie GPL-incompatibel.

Ook staat er een patentengifpil in:

c. If you institute litigation or other proceedings against Meta or any entity (including a cross-claim or counterclaim in a lawsuit) alleging that the Llama Materials or Meta Llama 3 outputs or results, or any portion of any of the foregoing, constitutes infringement of intellectual property or other rights owned or licensable by you, then any licenses granted to you under this Agreement shall terminate as of the date such litigation or claim is filed or instituted. You will indemnify and hold harmless Meta from and against any claim by any third party arising out of or related to your use or distribution of the Llama Materials.
Deze is niet nieuw: de Mozilla Public License versie 2 had al zo’n bepaling die zegt dat als jij een octrooirechtszaak start tegen iemand wegens inbreuk veroorzaakt door de MPL-software, dan vervalt je licentie op de software. Daarmee zijn dan auteursrechtelijke tegenclaims mogelijk. Apache heeft dat overgenomen.

De clausule is hier generieker: ieder IE-recht, niet alleen octrooien. En dat is logisch, want de grote zorg van Meta is aangeklaagd worden voor auteursrechtinbreuk door wat er in de trainingsdata zit of wat Llama voor uitvoer geeft. Gezien de precedenten lijkt dat niet erg genoeg om het label “open source” te ontzeggen.

Het is in zoverre van belang omdat de AI Act in artikel 2 lid 12 bepaalt dat

12. This Regulation does not apply to to AI systems released under free and open-source licences, unless they are placed on the market or put into service as high-risk AI systems or as an AI system that falls under Article 5 or 50.
Llama 3 is een zogeheten general-purpose AI, geen AI systeem. Hiervoor gelden dan de iets generiekere verplichtingen van artikel 53, zoals uitgebreide technische documentatie, API documentatie en een uitleg over gebruikte bronnen (waar auteursrechthebbenden dan in kunnen grasduinen). De documentatieplichten vervallen voor open source modellen mits
2. The obligations set out in paragraph 1, points (a) and (b), shall not apply to providers of AI models that are released under a free and open-source licence that allows for the access, usage, modification, and distribution of the model, and whose parameters, including the weights, the information on the model architecture, and the information on model usage, are made publicly available. This exception shall not apply to general-purpose AI models with systemic risks.
Het moet allereerst dus gaan om een open source model, en daarbij moeten de parameters van het AI model zelf (de weights en architectuur) ook nog eens openbaar zijn. Dat laatste heeft Meta wél gedaan (“open weights“), en ik heb sterk het vermoeden dat zo veel mogelijk buiten de AI Act vallen daarbij een doelstelling was.

Het onderliggende probleem is dat er niet écht een definitie van FOSS (free and open-source software) is. Noch OSI noch de FSF hebben een gezaghebbende stem, al lijkt me erkenning door een of beiden wel zwaarwegend. Het zou me niets verbazen als Meta inzet op dat “that allows for the access, usage, modification, and distribution of the model” en gaat betogen dat haar licentie dat toestaat – waarbij de licentiebeperkingen voor het goede doel zijn, en dus zouden moeten mogen. (Overweging 102 helpt hierbij niets.)

Arnoud

Is tijdelijke onbeschikbaarheid van persoonsgegevens ook een datalek?

Photo by OpenClipart-Vectors on Pixabay

Een lezer vroeg me:

Onder de AVG is een datalek (volgens mij) ook als data onbeschikbaar is voor geautoriseerde gebruikers. Mijn bedrijf slaat persoonsgegevens op die klanten zelf uploaden en biedt tools voor het bewerken daarvan. Als ik door een storing deze tijdelijk niet beschikbaar heb, is dat dan een datalek en is het meldplichtig?
Het lijkt me goed om even terug te vallen op de definitie van wat een “datalek” precies is. De AVG noemt het een “inbreuk in verband met persoonsgegevens” (artikel 4 lid 12):
een inbreuk op de beveiliging die per ongeluk of op onrechtmatige wijze leidt tot de vernietiging, het verlies, de wijziging of de ongeoorloofde verstrekking van of de ongeoorloofde toegang tot doorgezonden, opgeslagen of anderszins verwerkte gegevens;
Er moet dus sprake zijn van een inbreuk (schending) op de beveiliging. Die moet leiden tot vernietiging, verlies, wijziging of verstrekking van persoonsgegevens. En dat moet op onrechtmatige wijze of per ongeluk gebeuren.

De EDPB (de verzamelde AVG-toezichthouders) heeft in een advies in 2022 duidelijk gemaakt wanneer ook onbeschikbaarheid een datalek kan zijn:

Therefore, a security incident resulting in personal data being made unavailable for a period of time is also a type of breach, as the lack of access to the data can have a significant impact on the rights and freedoms of natural persons. To be clear, where personal data is unavailable due to planned system maintenance being carried out this is not a ‘breach of security’ as defined in Article 4(12) GDPR.
Kern is dus ook hier dat sprake is van een beveiligingsincident. Dat kan een simpele storing zijn (een ongeplande reboot) tot een regelrechte ramp (je hele netwerk zit vol malware, alles moet weken offline tot je vanaf veilige backups kon herstellen).

Hoofdregel is dat ieder datalek moet worden gemeld. Ja, dus ook je ongeplande reboot waardoor 3 minuten lang niemand kon inloggen. Maar gelukkig is er een uitzondering: “tenzij het niet waarschijnlijk is dat de inbreuk in verband met persoonsgegevens een risico inhoudt voor de rechten en vrijheden van natuurlijke personen.” Die drie minuten downtime gaan (meestal) heus geen problemen geven, dus dan hoef je dat niet te melden.

Drie weken offline vanwege malware is wél meldingsplichtig, lijkt me. Al die tijd niet met je data kunnen werken kan wel degelijk problemen geven. Uiteraard is het afhankelijk van het systeem: het medischdossierbeheersysteem van een ziekenhuis zal eerder weer online moeten komen dan de backend van een personal fitness app en die weer eerder dan een datumpriktool.

Arnoud

 

Kabinet geeft Facebook laatste waarschuwing en dreigt met vertrek van platform

Photo by Austin Distel on Unsplash

Het demissionaire kabinet heeft nog steeds geen duidelijkheid over hoe Facebook-moederbedrijf Meta de veiligheid van gebruikersgegevens garandeert. Dat meldde Nu.nl onlangs. Staatssecretaris Van Huffelen zegt dat in een Kamerbrief naar aanleiding van advies van de AP over het gebruik van Facebook Pages door de overheid.

In de Kamerbrief wordt het probleem kort benoemd. Sinds 2018 zijn beheerders van Facebook-pages medeverantwoordelijk voor dataverwerking. In AVG-jargon: je bent met Meta gezamenlijk verwerkingsverantwoordelijke, en daarmee aansprakelijk voor wat Meta allemaal doet met persoonsgegevens verkregen via die pagina. Zoals ik toen schreef:

Wél verrassend is dat zij ook de beheerder van zo’n pagina aanmerkt als (mede-)verantwoordelijke. Die besluit immers zo’n pagina op te zetten, waar mensen lid van kunnen worden en zo gegevens achterlaten. Zonder die ingreep waren die persoonsgegevens rondom interesses over die pagina (zeg maar) er niet gekomen, dus daarvoor ligt de verantwoordelijkheid bij deze beheerder. Dat je als beheerder alleen anonieme gegevens krijgt van Facebook, maakt niet uit – in de definitie van gezamenlijk verantwoordelijke staat niet dat je beiden bij alle persoonsgegevens moet kunnen.
Dit geldt natuurlijk net zo goed voor de overheid als paginabeheerder. Die onderzocht de zaak, voerde een DPIA uit en kwam in oktober vorig jaar tot de problematische conclusie dat Meta niet bereid was iets aan te passen en het volstrekt oneens was met alle bevindingen uit die DPIA.

Dat kan, maar schiet natuurlijk niet erg op. De vervolgstap vanuit de overheid lijkt me dan ook onvermijdelijk: wegwezen bij die datagraaiers.

Alleen: de overheid heeft de taak om álle burgers te informeren en te bereiken. Dat lukt niet met alleen een Rijksoverheid-website, een fors deel van de doelgroep is nu eenmaal alleen te bereiken via diensten als Facebook. Daarvan kun je niet simpelweg zeggen, “dat moeten die mensen maar aanpassen”, ik zie daar echt een taak voor de overheid om actief naar de mensen toe te gaan.

Arnoud

Brussel trekt de teugels aan bij drie grote pornosites

Beeld: Daniel Voyager, CC-BY

Pornosites Pornhub, XVideos en Stripchat moeten vanaf aankomende week veel beter controleren welke video’s er op de site staan en hoe oud gebruikers zijn. Dat meldde Nu.nl vorige week. Wederom de Digital Services Act (DSA) aan het werk. Er lopen hier twee (belangrijke) dingen door elkaar, dus let’s unpack. 

Allereerst over leeftijdsverificatie. De DSA bevat in artikel 28 een expliciete plicht om “passende en evenredige maatregelen [te nemen] om een hoog niveau van privacy, veiligheid en bescherming van minderjarigen binnen hun dienst te waarborgen”. Het niet tonen van seksueel expliciet materiaal aan minderjarigen valt binnen dat doel, en is dus iets waar je maatregelen voor moet nemen.

Even verderop – bij artikel 34 – staat iets vergelijkbaars. De dienstverleners moeten maatregelen zoeken om risico’s voor minderjarigen te mitigeren. Leeftijdsverificatie ligt wederom voor de hand, al blijft het al jaren bij min of meer hetzelfde lijstje. Een creditcardbetaling werkt aardig, al kan die worden uitgeleend. Getraind personeel een gesprek laten voeren om te horen of iemand 18+ is, veel geopperd maar oké laat maar het gegniffel achterin geeft aan dat dat bij deze toepassing niet gaat werken.

Hoe moet het dan wel? Geen idee, maar het leuke van de DSA is dat die er het probleem van de dienstverlener van maakt. Jij haalt de bakken met geld binnen in onze markt, dus ga jij maar bedenken hoe je dit effectiever aan gaat pakken.

Hetzelfde geldt over die controle op video’s. Dat is een bekend probleem, met name bij wat men “amateur” beelden noemt en ook daar moet de industrie met een oplossing gaan komen. De straf is in beide gevallen hetzelfde: beperking of sluiting van de dienst in de Europese Unie.

Arnoud

Wat kost een biertje als de prijs achter een QR code zit?

"Beer hyperlinked" by Thinkmobi is licensed under CC BY-NC 2.0

Een lezer vroeg me:

Dit weekend was ik bij een café dat geen prijzen vermeldt op het bord boven de bar met alle speciaalbieren en andere drank. Daarvoor moet je een QR code scannen die op tafel geplakt is. Je bestelt nog wel ouderwets bij het personeel, dus niet via een QR app. De biertjes waren goed maar wel erg duur. Had ik juridisch een punt kunnen maken van deze manieren van prijzen communiceren?
Oké, bierdrinken is nu ook al ict-recht. Maar goed, laten we eens kijken wat er geregeld is over de prijs bij een overeenkomst.

Voor veel mensen klinkt het verrassend, maar je kunt iets kopen zonder te weten dat het kost. Het is bij ‘gewone’ aankopen namelijk niet verplicht de prijs vooraf expliciet te zetten. Bij online verkoop is dat anders (art. 6:230m BW), daar is een overeenkomst niet rechtsgeldig gesloten zonder voorafgaande duidelijke vermelding van alle prijzen.

De wet (art. 7:4 BW) bepaalt voor de situatie van een niet-vermelde prijs het volgende:

Wanneer de koop is gesloten zonder dat de prijs is bepaald, is de koper een redelijke prijs verschuldigd; bij de bepaling van die prijs wordt rekening gehouden met de door de verkoper ten tijde van het sluiten van de overeenkomst gewoonlijk bedongen prijzen.
Hier staan twee dingen. Allereerst ben je in zo’n geval verplicht een “redelijke prijs” te betalen. Ten tweede is de prijslijst van de verkoper een belangrijke input bij bepalen of de prijs redelijk is.

Meestal komt de redenering neer op eerst kijken of de prijs op de prijslijst redelijk is. Zo ja, dan is dat de prijs. Zo nee, dan gaat de prijs naar een marktconforme prijs, zeg maar wat een biertje van die categorie gemiddeld kost in die stad.

Het maakt dus uiteindelijk niet uit of de prijs achter een QR code verstopt zit of op een prijslijst die je apart moet vragen bij de balie. Waar het om gaat, is of deze vooraf gemeld is – dan zit je eraan vast, hoe onredelijk ook – of dat je het pas achteraf kon ontdekken.

Een discussiepunt is nog wel óf de prijs gemeld is of niet, als op de tafel staat “scan de QR code voor de prijzen”. Het is immers niet verplicht om vooraf te melden wat de prijs is, mensen ergens heen wijzen waar ze deze kunnen zien is ‘gewoon’ een manier van de prijs melden. En anno 2024 is het denk ik wel redelijk te verwachten dat men QR codes kan scannen, of dat men aan de bel trekt “mijn telefoon is leeg, heb je een papieren prijslijst?”

Arnoud

Creatief mixen van AI output kan je auteursrecht op het resultaat geven

Photo by ROMAN ODINTSOV on Pexels

Elisa Shupe werd aanvankelijk afgewezen toen ze probeerde auteursrecht te verkrijgen op een boek dat ze met hulp van ChatGPT had geschreven, las ik bij Wired. Toch is het haar gelukt, zij het niet met de argumentatie die ze liever had gehad. Het lijkt wel de jurisprudentie te bestendigen tot nu toe.

Het artikel legt uit:

Het [logboek van Shupe] bevat een vergelijking naast elkaar van de onbewerkte machine-uitvoer en de definitieve versie van Shupe’s boek. Op zinsniveau paste ze vrijwel elke regel op de een of andere manier aan, van veranderingen in woordkeuze tot structuur. Een voorbeeld dat een personage in de roman beschrijft: ‘Mark keek naar haar, een complexe mix van bezorgdheid en ergernis duidelijk zichtbaar in zijn blik’ wordt ‘Mark bestudeerde haar, zijn blik weerspiegelde zowel zorgen als irritatie.’
Het US Copyright Office ziet dit als een vorm van ‘selectie, coördinatie en rangschikking van tekst gegenereerd door kunstmatige intelligentie’. Het idee van een creatieve selectie en bewerking van op zichzelf niet beschermd bronmateriaal is al lang aanvaard als een criterium voor auteursrecht. We kwamen dit in januari nog tegen:
In Nederland bestaat deze constructie ook. Denk aan het creatief oppoetsen van een publiek-domeinwerk: dat geeft je ook auteursrecht op het opgepoetste resultaat (maar natuurlijk niet op het bronmateriaal). Ik zie geen reden waarom dit anders zou moeten werken als je een AI-werk ‘oppoetst’.
Shupe had echter een ander argument ingebracht dat ze zelf sterker vond:
[Namelijk] om een ??belangrijker pad te openen naar auteursrechterkenning voor door AI gegenereerd materiaal. “Ik probeer auteursrechten te verkrijgen op het door AI ondersteunde en door AI gegenereerde materiaal onder een ADA-vrijstelling vanwege mijn vele handicaps”, schreef ze in haar oorspronkelijke auteursrechtaanvraag.
Ze is als 100 procent gehandicapt beoordeeld en heeft moeite met schrijven vanwege cognitieve stoornissen die verband houden met aandoeningen als een bipolaire stoornis, borderline-persoonlijkheidsstoornis en een misvorming van de hersenstam. Dan zie ik hoe het handig kan zijn als tools je een heel eind vooruit helpen.

Maar wat betekent het voor het auteursrecht op het resultaat? Stephen Hawking schreef bijvoorbeeld met een tool die losse woorden voorstelde, en iets dergelijks zit ook in veel telefoon-invoerapps: typ een woord en krijg een suggestie voor het volgende. Weinig mensen zullen zeggen dat de zin die je zo typt, een AI zin is. Het is mijn zin, het is gewoon logisch dat na ‘gewoon’ ‘logisch’ komt.

Als het systeem na één woord de hele zin afmaakt, of zelfs er een alinea van maakt, dan wordt dat gevoelsmatig een ander verhaal. Is dat nog een handige invulling van jouw keuze of zijn we dan al in de vrije ruimte van de tool beland?

De vergelijking die Shupe maakt, is ook een intrigerende: ze vergeleek “haar gebruik van OpenAI’s chatbot met een geamputeerde die een beenprothese gebruikt”. Oftewel: welk percentage van je lijf moet nog origineel-organisch zijn om nog ‘mens’ genoemd te worden? Daar is geen rechtszaak over gevoerd – en wat zou ook de insteek zijn, bij zo veel procent metaal bent u ruimbagage?

Arnoud

 

 

“Sociale media mogen mensen niet dwingen zich te laten volgen”

Photo by Tobias on Unsplash

Socialemediaplatforms zoals Facebook en Instagram mogen hun gebruikers niet dwingen zich online te laten volgen in ruil voor toegang. Dat las ik bij Nu.nl. Hierachter zit een advies van de verzamelde Europese AVG-toezichthouders over „toestemmings- of beloningsmodellen” (Consent or Pay klinkt nét iets lekkerder), dat vrij hard oordeelt dat toestemming eigenlijk nooit rechtsgeldig kan zijn als het alternatief is de knip te trekken.

Enige tijd geleden oordeelde het Hof van Justitie inzake Meta dat het mogelijk moet zijn om toestemming voor tracking in te tracken, sorry trekken, zonder dat je geheel uit de dienst werd gegooid. Er moet een alternatief komen, desnoods tegen een gepaste vergoeding, waar geen tracking in zit:

Thus, those users must be free to refuse individually, in the context of the contractual process, to give their consent to particular data processing operations not necessary for the performance of the contract, without being obliged to refrain entirely from using the service offered by the online social network operator, which means that those users are to be offered, if necessary for an appropriate fee, an equivalent alternative not accompanied by such data processing operations.

Dit vatte men in Californië op als “zet een betaalde versie er naast en de trackingversie is legaal”, vandaar dat je sinds november 9 euro kunt betalen voor een reclamevrije versie. Zoals ik toen schreef:
Het roept de fundamentele vraag op: hoe moet het dan wel? Als ze alleen de betaalde dienst hadden laten bestaan, was er denk ik weinig juridisch tegenin te brengen. Een netwerkdienst voor 10 euro per maand en zonder tracking, wat precies is daar mis mee. Maar het komt nu agressief over omdat we al heel lang die gratis versie hadden, en dus ons op kosten gejaagd voelen om die tracking te kunnen vermijden.
De EDPB gaat terug naar die uitspraak van het Hof en zit zwaar op het “equivalent alternative”. Het is té makkelijk om naar dat bedrag te grijpen en te roepen dat het equivalent is. Een gratis variant met ongepersonaliseerde reclame had ook prima gekund, bijvoorbeeld. Want persoonsgegevens worden nu eigenlijk op één lijn met geld gesteld, en dat is zeer zeker niet de bedoeling.

Het advies (dat dan wel zo heet maar zo dicht bij een bindend document komt als kan) staat voor meer dan de helft van de 42 pagina’s stil bij wat consent is en welke factoren daar aan kleven. Met name het “in vrijheid geven” in z’n eentje is een kwart van het document. Ik ben daar op zich wel blij mee, want er is nauwelijks écht gekeken naar die factoren. Neem nou het “detriment” verhaal: weigeren of intrekken mag geen nadeel opleveren, maar wat is dat dan?

Als ik terugga in waar die term “detriment” of “nadelig gevolg” vandaan kom, dan kom ik bijvoorbeeld bij WP 187 van wat nu de EPDB is. Hieruit haal ik dat iets nadelig is als het zeg maar bestraffend is, je afschrikt die optie te kiezen. Dit halen ze uit eerdere papers over consent bij medische zaken (bij weigering consent geen behandeling, WP 131) en bij het werk (WP 48, bij weigering geen promotie/nieuwe baan).
Helaas komt er geen fundamenteel criterium, maar wordt “als je elke dag op Facebook moet, dan is dat een vorm van nadeel” als waarheid geponeerd:
Data subjects may suffer detriment if it becomes impossible for them to use a service that is part of their daily lives and has a prominent role.
Let ook op de “may”, die met z’n vriendje “might” regelmatig terugkomt in dit stuk van de analyse. Alles kan – koffie kan, thee kan – maar is dit een theoretische zijsprong of gaat dit over 90% van de gevallen?

Afijn, de kern is dus dat grote sociale netwerken een sterke macht hebben en daarvan buitengesloten worden is op hetzelfde niveau als je baan kwijt raken. Ik snap wat men wil zeggen maar ik had denk ik een diepere analyse verwacht die dit rechtvaardigt dan “het is gewoon heel erg als ze je er niet op laten”.

De volgende stap zal zijn dat de toezichthouders aan Meta gaan vragen hoe deze denkt dat toestemming rechtsgeldig is verkregen in het licht van deze opinie. Op basis van dat antwoord kan men dan de verwerking door Facebook verbieden of een bindende aanwijzing geven dat er ook een gratis trackingvrije versie moet komen.

Arnoud

Er zit een backdoor in mijn NAS, mag ik mijn geld terug?

Bron: D-Link DNS-340L ShareCenter + 4-Bay Cloud Network Storage Enclosure Reviewed

Een lezer vroeg me:

Ik zit met het volgende. Ik heb dus een D-Link NAS waar een backdoor account in aanwezig is. Nu begrijp ik heel goed dat software en andere producten beveiligingslekken bevatten. Maar een backdoor account voeg je als fabrikant toch echt zelf toe. Kan ik een partij als D-Link (en genoeg anderen helaas) hier aansprakelijk voor houden? Het liefst wil ik gewoon mijn geld terug of een product zonder backdoor.
Hier werd inderdaad recent voor gewaarschuwd: “Het betreft een command injection-kwetsbaarheid en het gebruik van hardcoded credentials, of een ‘backdoor account’ zoals D-Link het noemt. Via de kwetsbaarheden kan een aanvaller zonder authenticatie willekeurige commando’s op het NAS-systeem uitvoeren, wat kan leiden tot toegang tot gevoelige informatie, het aanpassen van de systeemconfiguratie of een denial of service.”

De hardcoded credentials ware geen bewuste feature, maar een slordigheid: hierachter zit een typische Unix-constructie die alleen niet goed is geïmplementeerd. Maar uiteindelijk doet het er niet toe of het opzet, roekeloosheid, onoplettendheid of iets anders was. Die backdoor zit er, het product is daardoor niet veilig, wat kun je daarmee als consument?

Het simpele antwoord is natuurlijk: je mag van een product verwachten dat dit aan de redelijke verwachtingen voldoet. Dat wil niet zeggen dat het altijd 100% foutloos en backdoorloos is, je moet kijken hoe het product wordt gemarket, hoe eenvoudig de fout te exploiteren is en in hoeverre D-Link dit had moeten voorzien. Niet elke fout is een conformiteitsgebrek.

Toch denk ik dat je bij een enorme impact zoals hier je wel een goed verhaal hebt dat het product niet voldoet aan de redelijke verwachting. Zó makkelijk binnendringen, dat moet niet kunnen bij zo’n belangrijk product. Maar dit wordt al snel een moeilijke technische discussie, waar je niet makkelijk uitkomt als de wederpartij betaald wordt om het met je oneens te zijn.

In de nabije toekomst zullen we met wetten als de Cyber Resilience Act dit een stuk makkelijker aan kunnen pakken. Die stellen updates en een kwalitatief proces van security verplicht. Er is dan weinig nuance meer als er dan toch een securityfout doorheen glipt.

Als laatste blijf je natuurlijk met het aloude probleem in het consumentenrecht dat de winkel (die jij moet aanspreken en die wettelijk verplicht is jou je geld terug te geven, nu herstel geen optie meer is omdat de NASsen end-of-life zijn) simpelweg weigert dat te doen met meestal een excuus zoals “er zit maar 2 jaar garantie op” of “het lampje gaat aan dus hij is niet stuk”. En daarna komt security jou eruit zetten want stemverheffing triggert Protocol Lastige Klant. Het kan dus een hele toer zijn om je recht te halen als consument, en de vraag is altijd of dat het waard is gezien de prijs van het ding.

Arnoud