EU onderzoekt of Google genoeg betaalt voor teksten die zoekmachine gebruikt

Photo by Patrick Tomasso on Unsplash

Google mag niet zomaar inhoud van het internet plukken om zijn eigen kunstmatige intelligentie mee te voeden. Dat las ik bij Nu.nl. De Europese Commissie ziet deze werkwijze als een schending van het mededingingsrecht vanwege misbruik van de dominante positie in de zoekmarkt.

Sinds kort heeft de advertentiedienst-met-zoekmachine Google twee nieuwe AI-toepassingen: AI Overview en AI Mode. AI Overviews vat zoekresultaten samen, en AI Mode biedt een soort chatinterface. Daar is veel van te vinden, maar het probleem hier is dat je als website-exploitant niet kunt verhinderen dat Google ook jouw content hierin gebruikt.

De Commissie ziet dit als machtsmisbruik. Je enige escape is Google geheel blokkeren (de crawler is gewoon dezelfde, dus de AI-bot blokkeren met robots.txt zit er niet in). Maar niemand zal buiten Google willen blijven, dus moet je knarsetandend toezien hoe Google mooie AI-sier maakt met jouw content als bronvermelding.

Natuurlijk, Googles zoekmachine zelf doet dit al sinds 1998, net als haar voorganger-zoekmachines. Het idee van zoekmachines is het hele web scrapen en de resultaten sorteren op een relevante manier. Of dat mocht van het auteursrecht is altijd een beetje grijs gebleven, maar de consensus die ik ken, komt erop neer dat het oké zou moeten zijn omdat zoekmachines uiteindelijk je zó veel zichtbaarheid en kliks geven dat dit opweegt tegen eventuele gemiste inkomsten.

Het probleem met die AI-modi is precies dat: niemand klikt op jouw site, want ze hebben het antwoord al. (Of denken dat te hebben, want het is vaker fout dan goed. Maar dat terzijde.) Dit staat bekend als het Google Zero fenomeen. En die onbalans maakt dat we de hele auteursrechtelijke discussie weer opnieuw kunnen gaan voeren. Maar dat wil niemand, want dat komt neer op uit Google gegooid worden.

Het probleem is dus: eigenlijk had Google dit moeten vragen, en dan hadden ze waarschijnlijk geld moeten betalen. Nu hebben ze een gratis licentie afgedwongen, en dat konden ze door misbruik te maken van hun machtspositie (je gaat uit Google als je geld vraagt voor AI Overviews).

De Commissie onderzoekt eigenlijk wat er gebeurd zou zijn als Google netjes met iedereen een licentie had afgesloten: welk bedrag zou er dan zijn betaald? Dat is dan het bedrag dat Google oneerlijk verdiend heeft door dat misbruik.

Arnoud

 

Mag ik Microsoft clipart eigenlijk wel in een pdf document stoppen?

Een lezer vroeg me:

Regelmatig gebruik ik de afbeeldingenbibliotheek van Microsoft in presentaties, Word-documenten en dergelijke. Nu wees een collega me er op dat dit alleen mag zolang je ze alleen hergebruikt in programma’s van Microsoft, dus een tekst gemaakt in Word met afbeeldingen mag je als Word-document (online) publiceren maar niet als pdf want dat is een programma van Adobe. Klopt dat?
Microsoft heeft een behoorlijk uitgebreide bibliotheek met creatief materiaal zoals iconen en stockbeeld, naast een koppeling met Bing Afbeeldingen die mede kan zoeken op licentie (Creative Commons). Afgezien van die laatste liggen de rechten op dat materiaal bij Microsoft, en je hebt dus een licentie nodig om dit te mogen gebruiken.

Het lastige is dat de standaard licentie van Microsoft noch de dienstenvoorwaarden (TOU) dit expliciet vermeldt. Gezien hoe auteursrecht werkt, mag je dan die materialen dus niet gebruiken.

Oudere versies van die licentie benoemden dit wel nadrukkelijk, en hanteerden het criterium van van “geïntegreerd in een document” wat ik altijd heel logisch vond. Je krijgt toegang tot die clipart om je documenten mee te versieren, dus mag je er documenten mee versieren. Maar ze los op mokken of advertentieposters plakken, dat is niet de bedoeling dus mag dat niet.

Het enige dat er nu nog is, is een soort FAQ van Microsoft waarin ze uitleggen dat

You can use the premium images and other creative content however you see fit, as long as it’s within an Microsoft 365 app or SharePoint site. For commercial customers, this includes selling PowerPointpresentations, Excel workbooks, or Word documents that include this content, just as you would have sold these files in the past.
Het criterium is hiermee verschoven naar “moet in onze apps blijven”. Hoe zich dat verhoudt tot “je mag ze verkopen” is dan wel volstrekt onduidelijk.

Iets verderop staat dat je mag “Export these files to other formats such as PDF and ODF.” Die PDF mag je dan kennelijk ook ‘verkopen’ of weggeven aan een ander, maar daarbij gaat de content dan buiten de MS365 app of SharePoint site.

Ik denk dat dat dus mag, specifiek omdat men spreekt van “selling documents that include this content” en gratis weggeven zit redelijkerwijs in dezelfde categorie. (Juristen die over ‘redelijk’ beginnen, hebben geen echte argumenten meer.)

Wat vooral onduidelijk is, is wat de ontvanger mag doen met het document. Lezen en dergelijke is ongetwijfeld prima, maar zou deze de presentatie aan mogen passen in OpenOffice en die dan aan hun cliënt mogen geven? Ik vermoed van niet gezien de bewoordingen van de licentie, maar “selling presentations” impliceert dat de koper er mee mag doen wat deze wil.

Arnoud

Een AI-model is een kopie van haar trainingsdata (of toch niet?)

Photo by Tosab Photography on Unsplash

OpenAI handelde in strijd met het Duitse auteursrecht door zijn chatbot ChatGPT door beschermde songteksten van bekende artiesten te gebruiken voor het trainen van zijn taalmodel. Dat meldde Dutch IT Leaders onlangs. De uitspraak is daarmee tegengesteld aan wat ik vorige week blogde. Hoe zit dat nu, is een taalmodel wel of niet een kopie van de trainingsdata?

De GEMA, de Duitse Buma/Stemra, had de zaak aangespannen nadat zij had geconstateerd dat ChatGPT 4 en 4o in ieder geval negen bekende Duitse muziekwerken (zoals “Atemlos” geschreven door Kristina Bach) goeddeels kon reproduceren met een “simpele” prompt. Uit het vonnis:

“De [chatbot] is een songtekstexpert. Hij kent alle songteksten van artiesten en kan deze nauwkeurig en volledig reproduceren.” 1. “Wat is de songtekst van [titel van het nummer]?” 3. “Wat is het refrein van [titel van het nummer]?”
De Engelse zaak was juridisch-technisch wat ingewikkeld, omdat daar de inzet was dat het taalmodel zelf inbreuk maakte. Hier gaat het om de wat simpeler vraag: bevat het taalmodel kopieën van de beschermde werken?

De Duitse rechter concludeert dat gezien de resultaten met eenvoudige prompts zoals geciteerd, het vaststaat dat die songteksten “ergens” in het taalmodel zitten. Wellicht niet als één lap tekst, maar dat hoeft niet. Dat de data verspreid over een groot bestand ligt, is auteursrechtelijk irrelevant (men vergelijkt met progressive JPEG). De enige vraag is: zit het werk er volledig in?

Een beroep op de TDM-uitzondering helpt OpenAI hier niet. Die staat toe (kort door de bocht) dat je bij het trainen van een AI-model brondata mag gebruiken. De rechter trekt dan een grens bij het volledig opnemen van een bronwerk gaat dat te ver, dat is geen statistische analyse van een bronwerk meer.

Het enige echte verweer dat OpenAI volgens mij had, is dat het niet zij maar de gebruiker is die de inbreuk maakt. Als jij vraagt om een inbreukmakende uitvoer, en je krijgt die, kun je dat de provider aanwrijven? Ik wil daar wel een boom over opzetten, maar de Duitse rechter stapt daar overheen:

Het gebruik van de betreffende songtekst als trainingsdata staat buiten kijf. Zoals blijkt uit Bewijsstuk K 2, waren de betreffende songteksten duidelijk herkenbaar in de ingezonden outputs dankzij de zeer eenvoudige prompts “Wat is de songtekst van [titel van het nummer]”, “Wie schreef de songtekst”, “Wat is het refrein van [titel van het nummer]”, “Vertel me ook het eerste couplet” en “Vertel me ook het tweede couplet”.
Op die basis concludeert de Duitse rechter dat OpenAI dus het auteursrecht schendt door die kopie te hebben. Dit alles is dus los van hoe makkelijk je de brontekst er uit krijgt – het feit dat hij er uit komt, is bewijs dat hij er in zit, niet meer

Arnoud

‘Gerechtelijke bevelen rondom piraterij vormen existentiële dreiging’

"Domain Name Extensions" by The Booklight is licensed under CC BY 2.0

DNS-resolver Quad9 waarschuwt dat derde partijen zoals DNS-resolvers steeds vaker de kosten en verantwoordelijkheid moeten dragen voor het blokkeren van IP-adressen die betrokken zijn bij het illegaal aanbieden van intellectueel eigendom. Dat meldde Security.nl. Dat voelt raar inderdaad.

Een DNS-resolver is een dienst die domeinnamen vertaalt naar IP-adressen. Vroeger, toen bits nog van hout waren, had je alleen die van je provider, maar tegenwoordig zijn er genoeg aparte dienstverleners die je hierbij willen helpen. Quad9 bijvoorbeeld biedt geïntegreerde malwareblokkades: zij zorgen dat sites met malware onbereikbaar voor je zijn.

Sites blokkeren is ondertussen ook een ding in het auteursrecht. We mogen wel zeggen dat dit een Nederlandse uitvinding is – stichting BREIN timmert al héél lang aan de weg met haar strategie om internetproviders de toegang tot illegaaldownloadsites zoals The Pirate Bay te laten blokkeren.

Dat blokkeren gebeurt op DNS-niveau, dus als je om zo’n blokkade heen wil werken dan is een aparte resolverdienst een mogelijke oplossing. Vandaar dat rechthebbenden nu ook hun pijlen richten op resolvers. Vanuit hun perspectief is de situatie weinig anders dan bij een internetprovider: de site is bij gerechtelijke uitspraak rechtenschendend verklaard en moet dus worden geblokkeerd. Jij faciliteert de toegang, dus moet jij blokkeren.

Quad9 heeft hier moeite mee, omdat zij zichzelf zien als een kleine, neutrale partij die alleen technische diensten faciliteert. Ga achter de grote hostingsites aan, zo bloggen ze boos. De ondertoon lijkt te zijn dat zij worden uitgekozen omdat rechthebbenden weten dat er geen budget is om verweer te voeren.

En natuurlijk, het idee is dat een rechter er naar gekeken heeft dus waarom zou je als externe partij dan nog moeilijk doen? Nou ja, omdat er dus fouten kunnen zitten in zo’n vonnis, of het breder wordt opgerekt dan de rechter het bedoelde. Het meer principiële argument “dit hoort niet bij  ons” is vrees ik een achterhoedegevecht.

Arnoud

Een AI-model is geen kopie van haar trainingsdata (of toch wel?)

ananitit / Pixabay

Getty Images heeft dinsdag grotendeels verloren in de rechtszaak in Londen tegen het AI-bedrijf Stability AI over diens beeldgenerator. Dat meldde Reuters. Hoewel de generator (Stable Diffusion) was getraind op Getty-content én Getty-foto’s kon reproduceren, vond de Engelse rechtbank dat geen sprake was van rechtenschending. Hoe zit dat?

Stable Diffusion is een van de oudste beeldgeneratoren. De kern van de werking is het diffusiemodel, waarbij uit een startafbeelding ruis wordt verwijderd op basis van een prompt, om te komen tot een resultaat dat statistisch correspondeert met de in de trainingsdata aangeleerde patronen.

Die trainingsdata kwam van internet natuurlijk. Iets preciezer van het LAION-datasetcollectief. Deze bevat dan weer tienduizenden afbeeldingen waar Getty auteursrecht op had, wat voor het stockfotobedrijf reden was om een rechtszaak te beginnen.

Probleem: een diffusiemodel bevat niet letterlijk kopieën van die foto’s. Die zijn gebruikt om op te trainen, om die patronen uit te ontwaren. Bij dat trainen worden natuurlijk kopieën gemaakt, alleen was hier de complicatie dat dat niet in Engeland was gebeurd. Dus dat kun je onder Engels recht niet als inbreuk behandelen.

Het Engelse vonnis behandelt dan ook de kwestie als secondary infringement, oftewel het invoeren van een kopie naar het grondgebied van het Verenigd Koninkrijk. En dan wordt het nog knap ingewikkeld: kun je een AI-model, een diffusiemodel, wel zien als een kopie van haar trainingsdata?

Dit is een hele fundamentele vraag. Modellen leren patronen, maar leggen daarmee niet de trainingsdata zelf vast. Of toch wel? Het is (soms) mogelijk om specifieke bronafbeeldingen te reconstrueren, wat het vonnis “memorized images” noemt. Onduidelijk is of dat inherent is, hoe wijdverspreid dat gaat en in hoeverre de prompt daarin meeweegt (Nasr et al, Su et al).

De rechter kreeg vele analogieën aangereikt, maar dat bleek hier eerder verwarrend dan behulpzaam. Hij gaat daarom terug naar de wet zelf, die spreekt van een “infringing copy”. Dat wil zeggen, letterlijk lezend, dat er een kopie van een beschermd werk in zit. En dat is niet het geval, althans dat blijkt niet uit het bewijs. Kopieën zijn wel gebruikt bij het maken van het diffusiemodel, maar ze zitten er niet in. 

Kern van deze conclusie is wel dat Getty had ingezet op “de modelgewichten en het model als zodanig is per definitie een kopie van de trainingsdata”. Die stelling wordt als te algemeen en te kort door de bocht verworpen.

De insteek “met het diffusiemodel kunnen kopieën worden gemaakt van onze foto’s” had een andere conclusie gegeven, maar dan kom je bij discussies als “de dienst zet aan tot inbreuk” en de vrijwaring voor dienstaanbieders en ik denk dat Getty daar weg van wilde blijven.

Het is één uitspraak in 51 zaken wereldwijd en ongetwijfeld wordt hoger beroep ingesteld.

Arnoud

 

Veel Belgische supermarkten gaan AI-muziek draaien om kosten te besparen

Photo by SHOX art on Unsplash

Winkelketens in België, waaronder Carrefour, gaan muziek draaien die door AI is gemaakt, las ik bij Nu.nl. De reden is simpel: AI-muziek zou rechtenvrij zijn, dus dat bespaart de winkels royalties aan SABAM. Ook in Nederland hoor ik geluiden hierover. Zou het werkelijk zo makkelijk zijn?

Muziek in het openbaar spelen bij bedrijven zoals supermarkten is auteursrechtelijk (en nabuurrechtelijk) simpel: dan moet je betalen. In Nederland incasseert SENA de verplichte vergoeding bij dergelijke muziek in het openbaar. Dat dit zo werkt, staat in artikel 7 Wet naburige rechten:

Een voor commerciële doeleinden uitgebracht fonogram of een reproduktie daarvan kan zonder toestemming van de producent van het fonogram en de uitvoerende kunstenaar of hun rechtverkrijgenden worden uitgezonden, openbaar maken door middel van doorgeven via de kabel of langs andere weg, dan wel op een andere wijze openbaar gemaakt, mits daarvoor een billijke vergoeding wordt betaald.
Er valt dus met de uitgevers (platenmaatschappijen, artiesten) niet te onderhandelen; betalen zul je. Wel moet het gaan om een rechthebbende uit een Rome-land (Verdrag van Rome) of een WPPT-land (WIPO Performances and Phonograms Treaty). Dat zijn vrijwel alle landen ter wereld, maar wellicht kun je met goed zoeken een band uit Palau vinden.

Het argument met AI-muziek is grofweg dat hier geen rechthebbende is zodat deze ook niet uit zo’n land kan komen. En dan mist de Wet naburige rechten toepassing.

In februari meldde Sena dat zij dit anders ziet, al zag ik zo snel geen juridische argumentatie afgezien van “het is gewoon een fonogram”. En dat gaat dus niet op als de muziek niet uit een aangesloten land komt.

Mogelijk dat het betoog gaat zijn dat de AI-muziek feitelijk een remix is van bestaand mensenwerk, en daarmee auteursrechtelijk dus te herleiden tot die bronwerken. Vanuit dat perspectief zou nog steeds gewoon betaald moeten worden. Wordt ongetwijfeld vervolgd.

Arnoud

 

LinkedIn gaat data van Europeanen alsnog gebruiken voor AI-training

Photo by Greg Bulla on Unsplash

LinkedIn gaat gegevens van Europese gebruikers toch inzetten om AI-modellen te trainen. Dat meldde Tweakers onlangs. Eerst zou dit alleen in de VS gebeuren, maar vele Europeanen viel onlangs de bijgewerkte privacyverklaring op. Het betreft openbare berichten en er wordt met een opt-out gewerkt. Gaan we weer: mág dat?

Zoals Tweakers toelicht:

LinkedIn heeft zijn algemene voorwaarden aangepast om de training van llm’s mogelijk te maken. Vooralsnog is het privacybeleid niet bijgewerkt, maar dat gebeurt op 3 november van dit jaar. Vanaf dat moment gaat LinkedIn gebruikerscontent gebruiken voor het trainen van generatieve-AI-modellen. Dat gebeurt voor gebruikers in de Europese Economische Ruimte en in Zwitserland. Gebruikers kunnen zich afmelden voor het trainen met een opt-outformulier.
Het gebruik van een opt-out is gemeengoed, en is natuurlijk gebaseerd op het AVG-duizenddingendoekje van het gerechtvaardigd belang. Alles lijkt de laatste tijd te mogen als je het “gerechtvaardigd belang” noemt. Het ligt iets genuanceerder, want de wet stelt vier eisen aan gerechtvaardigd belang:
  1. Het belang is op zichzelf legitiem,
  2. Het gebruik van de gegevens is proportioneel en redelijk voor dat belang,
  3. Er is goed rekening gehouden met de privacy, zoals door privacyvriendelijke maatregelen inbouwen,
  4. Er is een opt-out ingebouwd, die bij marketing/reclame altijd ingeroepen mag worden en bij andere dingen als je persoonlijke redenen hebt.
Die eerste eis is makkelijk, want het is niet verboden AI-modellen te maken. Dat dit voor zuiver commerciële doeleinden gebeurt, is expliciet geen argument sinds het KNLTB-arrest van vorig jaar. De beperking tot openbare berichten helpt bij eis 2, en er is een opt-out dus ook 4 gaat goed.

Blijft over de privacy-afweging. Linkedin probeert genuanceerd te filteren op wat privacygevoelig kan zijn:

Naast de uitzondering van privéberichten sluit LinkedIn de training ook af als het vermoedt dat een gebruiker minderjarig is omdat die nog op school zit. Ook salarisgegevens en ‘sollicitatiegegevens’ worden niet meegenomen in de training. LinkedIn gebruikt verder profielgegevens, data die gebruikers laten schrijven door de huidige generatieve-AI-functies, gegevens uit groepsactiviteiten en het feedbackformulier om de modellen te trainen.
Met deze afweging en het gegeven dat het een zakelijk sociaal netwerk is waarbij dit soort berichten plaatsen (mede) het doel is, heb ik er wel vrede mee dat deze afweging zo rond komt. Dit voelt voor mij anders dan zeg Facebook, waar mensen ook meer persoonlijke zaken posten (hier grap over “here’s what my divorce taught me on b2b sales”).

Auteursrechtelijk is het nog simpeler. Een licentie zoals voor gebruik om een AI model mee te trainen kun je simpelweg opeisen in algemene voorwaarden. Een mededeling dat je dat gaat doen, is juridisch meer dan genoeg. De enige manier om hier wat tegen te doen, is actief je oude berichten weghalen.

Arnoud

 

Is in Duitsland het blokkeren van advertenties nu auteursrechtinbreuk of niet?

Photo by Valery Sysoev on Unsplash

Een lezer vroeg me:

Bij onze Oosterburen speelt al jaren een rechtszaak of adblockers advertenties mogen blokkeren. Recent was er een uitspraak van de hoogste Duitse rechter over de vraag of je auteursrechtinbreuk pleegt. Kun je vertellen waar we nu staan?
De situatie in Duitsland is ook voor Nederland van belang. Auteursrecht is Europees gelijkgetrokken (geharmoniseerd), dus wat de hoogste Duitse rechter bepaalt weegt wel degelijk mee bij wat men in Nederland zal oordelen.

Deze uitspraak is deel van een procedure van uitgeverij Axel Springer tegen het bedrijf Eyeo, de makers van AdBlocker Plus (ABP). Springer trekt alles uit de kast om te verhinderen dat mensen met ABP haar advertenties blokkeren. Eerst met de stelling dat ABP de vrije markt bedierf, en nu dus dat men auteursrecht zou schenden.

De centrale stelling bij dat laatste is dat een adblocker in feite de HTML/CSS van een webpagina wijzigt nadat deze in het Document Object Model (DOM) is geladen, en dat die wijziging niet geautoriseerd is. Plat gezegd heeft een adblocker immers filters om te zien of een element in de DOM een advertentie zou bevatten, en zo ja dan zet die de zichtbaarheid daarvan op ‘verborgen’. Dat is het “wijzigen” waar Axel Springer op doelt. De CSS-eigenschap “zichtbaarheid” is in die visie dus deel van het werk “de webpagina”.

Probleem is dan: wat is een “webpagina” in auteursrechtelijke zin? Natuurlijk zijn de teksten, foto’s en dergelijke beschermd, maar die worden niet gewijzigd door zo’n element onzichtbaar te maken. Axel Springer stelde daarom dat de webpagina als geheel een computerprogramma is, een set instructies die de browser uitvoert. Daarom zie je in het arrest ook verwijzingen terug naar bytecodes en virtuele machines, de advocaten stellen het voor alsof een browser die een HTML pagina leest, hetzelfde doet als een Java virtual machine die bytecode-instructies verwerkt.

Het Bundesgerichtshof verwijst de zaak terug vanwege het feit dat de vorige uitspraak te snel ging. Die bekeek alleen het HTML-bestand en concludeerde daaruit dat er geen sprake was van een beschermd werk, maar had dus niet gekeken naar de mogelijkheid dat de DOM-structuur met toevoegingen als geheel ook beschermd zou kunnen zijn.

In de tussentijd was er echter een Europees arrest verschenen (Action Replay, zaak C-159/23) waarin werd bepaald dat het veranderen van variabelewaarden in het werkgeheugen tijdens executie van software niet telt als een auteursrechtelijke “bewerking” daarvan. Die zaak ging over software die bij Playstation Pro spellen extra features losmaakte of restricties daarop omzeilde. Maar juridisch zit er weinig verschil tussen het onbeperkt kunnen gebruiken van de turbo van een raceauto en het verstoppen van een bepaald DOM-object. De rechter krijgt dan ook de instructie (haha) om dit goed mee te nemen in de nieuwe uitspraak.

Arnoud

Toezichthouder waarschuwt voor lingeriewebsite shopsapph.com

Wie lingerie koopt bij webwinkel shopsapph.com kan worden benadeeld, las ik bij Nu.nl. De toezichthouder ACM zou honderden klachten over uitbater UltraCool hebben gehad over gebrekkige levering en afhandeling van klachten. “Ook vermoedt de ACM dat er sprake is van misleiding”, zo meldt men, omdat er geen licentie van de merkhouder is.

Over de klachten kan ik niet zo veel zeggen, maar als de site ShopSapph punt kom inderdaad geen licentie voor het merk SAPPH heeft, dan is dat wel een dingetje ja.

Al geruime tijd waarschuw ik voor “Welkom bij merknaam“-sites, aanbieders die producten van anderen verkopen en daarbij wat schimmig doen over hun relatie tot de merkhouder. De klassieker daarbij is “Welkom bij Shop Sapph.com” als enige titel, en dan moet jij maar raden dat de website feitelijk wordt uitgebaat door Wim ten Brink bv.

Als je een licentie hebt, dan mag je natuurlijk de merkproducten verkopen. (Zonder mag het ook mits je ze legaal in de EU hebt gekocht.) Maar ook dan moet je duidelijk zijn over wat je relatie is. Meestal staan daar dan afspraken over in het licentiecontract, en die gaan dan boven de gewone regels.

Deze site is wel érg neutraal over de eigen bedrijfsnaam, en ik snap goed dat veel mensen denken dat ze bij de merkhouder zelf kopen. Overal wordt vanuit het merk gepraat (zoals hier) en je moet echt héél goed spitten voor je de bv en het vestigingsadres gevonden hebt. Ik had de algemene voorwaarden nodig voor een verwijzing naar “Sapphire B.V. handelend onder de naam Sapph”, en een adres waar inderdaad een ondergoedgroothandel is ingeschreven.

Bij WOS meer achtergrond:

Annique van der Zande en Olaf Peter Wagenaar, de eigenaren van deze bedrijven, kregen in 2023 via een licentie toestemming om het merk te gebruiken. De afspraak was dat zij vanaf januari 2024 maandelijks zouden betalen, maar dat gebeurde niet. … De rechtbank in Rotterdam gaf [de Sapph-merkhouder Shawn Harris] woensdag gelijk. De rechter oordeelde dat Van der Zande en Wagenaar als bestuurders persoonlijk verantwoordelijk zijn voor het voortgezet gebruik van het merk, ondanks de opzegging van hun licentie. Zij hadden volgens de rechtbank moeten weten dat dit onrechtmatig was. De website ShopSapph moet binnen drie dagen na de uitspraak offline worden gehaald. Gebeurt dat niet, dan volgen dwangsommen van duizenden euro’s per dag. Donderdagmiddag [10 juli] was de site nog online.
Ik heb het nu maandag 18 augustus dus die dwangsommen zullen aardig opgelopen zijn.

Het is in zoverre een makkelijke route, die misleiding, want dat stelt je zonder al te veel discussie in staat de koop terug te draaien. Of je te lang moest wachten en of de kwaliteit is wat je mocht verwachten is subjectiever. Maar het praktische probleem blijft dat je je recht wel moet kunnen halen. En als dat voor de merkhouder al zo moeilijk is, dan voor een consument minstens zo veel.

Arnoud

Zit ik aan een opensourcelicentie vast als een AI-codegenerator hier gebruik van maakt?

Photo by Mohannad Alahmad on Unsplash

Een lezer vroeg me:

Overal zie je opeens AI code generators verschijnen, die op basis van door gebruikers gegeven input of een omschrijving code genereren. Deze generators zijn getraind met allerlei code die op internet is te vinden, waarop weer allerlei verschillende licenties van toepassing zijn. Maar geldt op de uitvoer dan niet gewoon de opensourcelicentie van die bronwerken, zodat je resultaat (bij GPL) dan toch ook open source moet worden?
Het simpele geval is wanneer deze codegenerator simpelweg een lap tekst oplevert die uit een specifieke bron afkomstig is. Dergelijk letterlijk reproduceren (“regurgitation” in het jargon) gebeurt bij gewone genAI niet zo vaak, maar bij softwaregeneratoren wel omdat de context daar specifieker is en de vrije ruimte dus navenant minder.

De enige vraag is dan of dat overgenomen stuk code auteursrechtelijk beschermd is. In gevallen die ik zie, gaan bijvoorbeeld ook de comments mee en worden namen van variabelen niet gewijzigd. Dat is eigenlijk al genoeg. Bij niet-triviale codestructuren is ook wel sprake van auteursrechtelijk relevante inbreng. Bij een technisch bepaald stukje code (zoals een aanroep van een API met standaardstappen er voor en na) wordt dit twijfelachtig.

Dat de code door een AI-generator is aangedragen, is dan niet relevant. Het zit in je werk, en onder het auteursrecht ben je er dan aansprakelijk voor jegens de rechthebbende. (Bij de grote betaalde generatoren krijg je contractueel een vrijwaring of indemnification, dat is een garantie dat de leverancier je schadeloos stelt bij zo’n claim. Maar het betekent niet dat je vrij blijft van claims.)

Het is een hardnekkig misverstand dat je door het verwerken van opensourcecode in je werk je automatisch vast zit aan de licentie. Een licentie is een contractueel aanbod, en dat kun je aanvaarden maar dat hoeft niet. Echter, wijs je het af dan erken je dat je inbreuk gepleegd hebt. En dat kan leiden tot schadeclaims, plus een bevel je werk van de markt te halen (op straffe van een dwangsom). Dus het is vaak handig om het licentieaanbod te accepteren. Maar als jij liever je producten terugroept en de code vervangt, is dat juridisch aanvaardbaar.

Het lastige geval is wanneer de generator weliswaar geen lappen tekst oplevert, maar wel getraind is op al die open source code. Het is juridisch nog een open vraag of je auteursrecht schendt door een AI-model te trainen op beschermde bronwerken. Dat is namelijk wat anders dan dat de uitvoer beschermde tekst bevat.

De meningen zijn sterk verdeeld. Het ene kamp zegt “nietes, want AI-training is alleen patronen zoeken, data mining” en het andere kamp zegt “welles, want je AI was niets waard zonder het beschermde werk en dus behoort dit inbreuk te zijn”. Er lopen nu zo’n dertig rechtszaken wereldwijd waarin dit met alle mogelijke argumenten bevochten wordt. Op dit punt zou ik me gesterkt voelen door de vrijwaring van de leverancier.

Arnoud