LAION-datasetcollectief wint rechtszaak over fotogebruik onder TDM-uitzondering

Photo by Willian Justen de Vasconcellos on Pexels

Datasetmakerscollectief LAION heeft een rechtszaak wegens auteursrechtinbreuk gewonnen van fotograaf Robert Kneschke. Dat meldde onder meer TechnoLlama vorige week. LAION hoeft de vermeldingen van de foto niet te verwijderen omdat ze zich op de text and data mining (TDM) uitzondering in de Auteurswet kan beroepen. Een opsteker voor anderen die met datasets werken, bijvoorbeeld om er AI modellen mee te trainen. Maar de impact is beperkt.

In mei vorig jaar diende Kneschke een claim in tot verwijdering van zijn foto’s uit de dataset. Hij kreeg een factuur van de advocaat van LAION voor het afhandelen van het verzoek, en stapte daarop naar de rechter. Ik blogde toen:

Het Duitse LAION project onderhoudt een van de bekendste datasets met geannoteerde afbeeldingen, waarmee AI systemen getraind kunnen worden. De bekende afbeeldingsgeneratoren zoals Midjourney en Stable Diffusion gebruiken LAION. Een discussiepunt bij dit soort sets is of hier sprake is van auteursrechtinbreuk, wat onder meer tot deze class action rechtszaak leidde.
De LAION dataset is enorm – zo’n 6 miljard afbeeldingen. Ook populair, alle grote AI afbeeldingengeneratoren bouwen op de dataset van LAION. Maar let wel, LAION bundelt niet een berg plaatjes in een zipfile. Ze hebben alleen metadata, in een gestructureerd formaat. Zeg maar URL en annotaties. Wil jij die dataset gebruiken, dan download jij wat je nodig hebt en plak je de metadata van LAION erbij.

Een set links is natuurlijk geen inbreuk (Svensson-arrest) maar het downloaden zul je zelf moeten verantwoorden. En daar komt die TDM uitzondering om de hoek kijken. LAION deed daar een beroep op. Ja, ze hadden elke afbeelding natuurlijk een keer gedownload maar dat was voor kwaliteitsdoeleinden en daarna werden deze weer gewist.

Is dat TDM? De wet (art. 25 Aw) definieert het als volgt:

In deze paragraaf wordt onder tekst- en datamining verstaan een geautomatiseerde analysetechniek die gericht is op de ontleding van tekst en gegevens in digitale vorm om informatie te genereren zoals, maar niet uitsluitend, patronen, trends en onderlinge verbanden.
Afbeeldingen zijn natuurlijk dergelijke gegevens en de metadat die LAION maakt, telt als “informatie genereren”. Dus dat zit wel goed. De vervolgvraag is onder welke voorwaarden je dit mag doen.

Onderzoeksorganisaties en cultureel erfgoedinstellingen mogen TDM Doen “met het oog op wetenschappelijk onderzoek” (art. 15n Aw). De rest van de wereld mag dat ook, maar moet machine-leesbare opt-outs respecteren. LAION is een nonprofit, maar is dat genoeg om “onderzoeksorganisatie” te mogen heten? Hier wreekt zich het probleem dat termen als “wetenschap” of “onderzoek” juridisch niet gedefinieerd zijn.

In het vonnis onderbouwt de Duitse rechter waarom LAION wél een dergelijke instelling is:

Wetenschappelijk onderzoek verwijst doorgaans naar het methodisch-systematisch nastreven van nieuwe kennis (…). [Het mag] niet zo eng worden opgevat dat het alleen de werkstappen zou omvatten die rechtstreeks verband houden met het verwerven van kennis; Veeleer is het voldoende dat de betreffende werkstap gericht is op het (later) verwerven van kennis, zoals bijvoorbeeld het geval is bij talloze dataverzamelingen die eerst moeten worden uitgevoerd om vervolgens empirische conclusies te kunnen trekken. Met name de term wetenschappelijk onderzoek veronderstelt niet het succes van later onderzoek.
LAION stelt de dataset samen en verbetert deze, waarna ze de resultaten publiceren zonder bijzondere voorwaarden of licentievergoedingen. Dat voldoet al aan de omschrijving. Natuurlijk weet LAION heel goed dat de grote commerciële AI-bedrijven precies hun dataset graag gebruiken. Maar dat is irrelevant, omdat dat andere bedrijven zijn.

Het is in zoverre jammer dat hiermee de vraag over de reikwijdte van het begrip “opt-out” niet beantwoord hoeft te worden, omdat dat pas speelt als LAION géén onderzoeksinstelling zou zijn geweest.

Er wordt zijdelings ingezoomd op een aspect van die discussie, namelijk of een AI niet gewoon een zin als “niet voor TDM gebruiken” had kunnen lezen. Ik vind dat een storende aanname, kort gezegd omdat ook juristen prima van mening kunnen verschillen over de interpretatie van een zin en het dus licht absurd is te denken dat ChatGPT dan wél de beoogde conclusie kan trekken.

Arnoud

 

Bedrijf met zelfde handelsnaam eist dat ik mijn vlog-kanaal offline haal en domeinnaam overdraag

Photo by Rasa Kasparaviciene on Unsplash

Via Reddit:

Ben actief als ‘@ Bomentuinderij, op instagram, en heb ook mijn website met Bomentuinderij .nl gekocht. Hierin laat ik zien hoe je een tuin onderhoudt, en aanlegt. Ik ben geen bedrijf, en verkoop geen goederen. Nu krijg ik een e-mail van een bedrijf die geregistreerd staan met ‘Bomentuinderij’ op KvK als ‘Handelsnaam’. Wat is mijn recht?
Een eerste gedachte is wellicht dat “Bomentuinderij” (een fictief gekozen naam ter anonimisering) een nogal generieke naam is in de categorie tuinonderhoud. Daar moet je mee uitkijken, omdat het hier gaat over handelsnamen en daar geldt formeel niet de eis dat de naam creatief of onderscheidend moet zijn.

Een naam is een handelsnaam als deze gebruikt om een onderneming mee aan te duiden (art. 1 Handelsnaamwet). Een ander mag niet dezelfde of een sterk lijkende naam gebruiken als daarmee “verwarring tussen die ondernemingen te duchten is” (art. 5). Dat kan ook met zeer generieke namen, denk aan twee kleine cafés met de naam Minibar tegenover elkaar in dezelfde straat.

Een sterker argument is dat de vraagsteller geen onderneming is. Als je geen onderneming hebt, heb je ook geen handelsnaam en dus schend je daarmee niet die van een ander. Maar ik twijfel daarover: ik lees dat “ik Tuinen aanleg en verkoop”, dus het Instagramkanaal is een marketingkanaal van dat hoveniersbedrijf zou ik dan denken.

Gebruikt hij de naam als handelsnaam? Ook dat is een sterk argument. Als enkel de accountnaam “@Bomentuinderij” is en deze persoon naar zichzelf verwijst als zeg “Teun de hovenier”, dan is geen sprake van handelsnaamgebruik door die accountnaam.

Als laatste is nog van belang waar de twee ondernemingen opereren. Een handelsnaam is namelijk geografisch beperkt: een hovenier in Panningen (L) kan weinig doen tegen een concurrent in Groningen (G), omdat hun activiteiten niet landelijk zullen zijn. Daarmee is verwarring in Groningen ondenkbaar. Is de oudere handelsnaamhouder wél landelijk actief (en dat vereist meer dan “ik heb een website en het hele land mag me bellen”), dan kan deze wel optreden tegen gebruik in een specifieke stad.

Arnoud

Originele maker Flappy Bird zegt niets te maken te hebben met nieuwe versie, maakt dat uit?

De originele maker van de mobiele game Flappy Bird, Dong Nguyen, zegt niets te maken te hebben met de vorige week aangekondigde mobiele versie. Dat meldde Tweakers onlangs. De Flappy Bird Foundation kondigde vorige week de comeback van de game aan. Dat geeft dan de juridische vraag: kan dat zomaar dan, juridisch?

Zo’n tien jaar geleden was het ineens populair: een side-scroller waarin de speler een vogel, Faby, bestuurt die probeert te vliegen tussen kolommen met groene buizen zonder ze te raken. Nguyen haalde het echter na een jaartje offline, onder meer omdat hij te veel druk op zich kreeg van fans van het spel en omdat het te verslavend zou zijn voor spelers.

Nu is er dus een nieuwe editie. Een stichting “heeft de rechten gekocht”, en heeft gemeld in 2025 het spel opnieuw uit te brengen.

“De rechten” zijn gekocht. Om welke rechten gaat het dan? Allereerst het auteursrecht op de assets. Vogeltje Faby blijkt afkomstig uit Piou Piou vs. Cactus, en omdat je op concrete personages auteursrecht hebt, zijn die rechten dus netjes afgekocht. De andere onderdelen op het spel lijken opnieuw ontworpen, of waren zo triviaal (groene buis) dat er geen auteursrecht op te claimen is. De software is opnieuw geschreven. Dat gaat dus wel goed.

Het andere belangrijke recht is het merkrecht op de naam Flappy Bird. Nguyen heeft dat recht in 2014 vastgelegd, zij het als logo en de naam aan elkaar geschreven. Alleen is er iets bijzonders met dat merk gebeurd: in januari dit jaar werd het als “abandoned” aangemerkt.

In het merkrecht geldt de regel dat je je merk actief moet gebruiken. Het is niet de bedoeling dat je een naam of logo vastlegt en er dan niets mee doet; dat verhindert anderen om wél commercieel te gaan met dat teken. (Waarom bij domeinnamen deze regel niet geldt, weet ik nog steeds niet.)

Als een merk te lang niet gebruikt wordt, kun je als marktpartij het merkenbureau (hier het USPTO) vragen het merk door te halen. En dat is wat hier is gebeurd, vorig jaar september. Alleen was er meer aan de hand: de bezwaarmakende partij heet Gametech Holdings en heeft al sinds 2014 een eigen merkregistratie op het woord Flappy Bird. Hierover zegt men:

[Since 2014], Opposer has spent considerable amounts of money to advertise, use, promote, and develop public awareness for and goodwill in its FLAPPY BIRD mark. As a result of such expenditures and efforts, Opposer has developed a valuable reputation and critical goodwill in its FLAPPY BIRD mark and has created, launched, and maintained a range of computer game products and related offerings under its registered FLAPPY BIRD mark.
Ik kan zelf geen spel vinden dat Flappy Bird heet(te) en door Gametech op de markt gebracht werd, maar dat zal aan mij liggen. In ieder geval had Nguyen geen reactie op dit bezwaarschrift, zodat het USPTO aannam dat alle bezwaren juist waren en het merk doorhaalde.

Het merk van Gametech is ondertussen verkocht aan die Flappy Bird Foundation, die daarmee dan alle essentiële rechten heeft om de markt op te gaan. Of het nieuwe spel een succes gaat worden? They changed it, now it sucks:

According to The Flappy Bird Foundation, the new release will include “new game modes, characters, progression, and massive multiplayer challenges.” … [The new game] will include some form of microtransactions, unlike the original game, which was entirely supported by ads. Footage of the game also shows an interface displaying the player’s number of diamonds, which may indicate a premium in-game currency.
Dat is bepaald wat anders dan het origineel, waar weinig meer te doen was dan tussen de buizen te navigeren en advertenties te negeren. Maar goed, ik zou het over het juridische hebben.

Arnoud

 

Wat je moet doen als je een auteursrechtclaim van Copytrack krijgt

Photo by LoboStudioHamburg on Pixabay

Mogelijk was er bij Copytrack iemand terug van vakantie, maar de afgelopen weken heb ik véle, vele mails gehad van mensen die een schadeclaim (“boete”) hebben gekregen van dit auteursrechtenkeffertje. De kern: foto ongeautoriseerd gebruik, normaal 150 euro, nu graag 750 maar het kan met korting als u meteen betaalt. Wat moet je daarmee doen?

Zoals ik in februari blogde:

Het frustrerende is, dit alles speelt binnen de wet. Als je een foto overneemt zonder toestemming dan moet je (als zakelijke partij) betalen. Alleen: hoe veel? De Hoge Raad heeft véle jaren geleden gezegd dat de gemiste licentie-inkomsten de schade zijn. Dus, wat vraagt die fotograaf normaal, wat kost deze foto in de beeldbank. Is dat een foto van 15 euro, dan is de schade 15 euro. Ben jij een exclusieve fotokunstenaar en krijg je 5000 euro per kopie dan is dat je schade. Net zoals het bekrassen van een custom built Spyder meer kost dan het oplappen van een oude Opel Corsa.
Hoe Copytrack hiermee omgaat, zie je bijvoorbeeld in deze brief uit vorig jaar oktober. Over dit fenomeen schreef ik eerder bij Tweakers. De kern: men rekent opslag op opslag en hanteert korte termijnen met stevige juridische taal om mensen te laten schrikken tot betalen.

Mag dat? Ja, dat mag. Het juridisch systeem gaat uit van twee gelijke, goed ingelezen en geoefende partijen die verbaal met elkaar twisten waarna de rechter bepaalt welke argumenten zhij overtuigender vindt. Dus stevige verbale druk hoort erbij. Dat de wederpartij een vlotte Instagrammer is die niet van copyright weet en nog denkt dat advocaten altijd de volledige en gebalanceerde waarheid spreken, daar doen we juridisch niets mee.

Tegelijk: als je zakelijk actief bent, bijvoorbeeld als reisblogger of influencer, dan horen deze regels erbij en moet je dus weten dat je niet zomaar een foto van internet kunt gebruiken. Ook niet als erbij staat van wel – althans, het is jouw risico dat zoiets niet klopt. Krijg je dus een foto van een hotel om te gebruiken en komt daarna de fotograaf, dan moet je bij het hotel zijn met de rekening, nádat jij de fotograaf hebt betaald. Want jij publiceerde.

Dit voelt oneerlijk en dat is het ergens ook. Maar dat komt met name door de wijze van handelen van partijen als Copytrack. Die willen een betaling forceren, en laten daardoor geen ruimte voor navragen, coulance of een goed gesprek over wat hier misgegaan is. Dat frustreert enorm.

Mijn advies voor dit soort claims is eerst en vooral: ga niet in discussie. Niet over dat het oneerlijk is, dat de bedragen niet kloppen, dat er geen watermerk bij stond, dat het hotel zei van wel en ga zo maar door. Alléén als je bewijs hebt van aankoop van de foto bij de genoemde fotograaf uit de brief (of een stocksite waar die foto met die fotograaf staat), dan stuur je dat bewijs terug.

Wat je wel gaat doen, is kijken wat die foto echt kost. Gebruik omgekeerd zoeken op afbeelding bij Google, zoek op de naam van de fotograaf enzovoorts. Screenshot (of print pdf) het aanbod met de prijs. Dat is bewijs dat je dit zou hebben moeten betalen als je het had gevraagd. En dat is de crux: de schade is dat bedrag, dat is wat de fotograaf écht is misgelopen.

Volgens de jurisprudentie tel je daar 25% bij op, en nu komt ie: dat bedrag maak je over (IBAN: DE80 7604 0061 0529 9862 00, BIC / SWIFT: COBA DEFF XXX) en je stuurt een korte mail om dat te melden. Niet als tegenbod, zij hebben geen énkele interesse in jouw argumenten en ze gaan nooit van z’n leven erkennen dat het bedrag omlaag mag. Maak het bedrag dus over en negeer de discussie. Dat werkt, ik ken niemand die vervolgens voor het verschil (hun eis minus jouw betaling) is aangeklaagd.

Arnoud

 

Heb je auteursrecht op bugfixes op andermans software?

“Het herstellen van een bug is in het algemeen geen grote bewerking”. Aldus de rechtbank Rotterdam in een recent geschil over broncodes. Voordat iedereen boos wordt: het ging hier over auteursrechtelijk grote bewerkingen, en dat is wat anders dan hoe moeilijk het is om voor elkaar te krijgen.

De zaak komt erop neer dat de koper van een stuk software de oude eigenaar (en ik vermoed, maker) daarvan inhuurde als zzp’er om hier bepaalde bug fixes in uit te voeren. Die leverde dat aan in de vorm van gecompileerde binaries, maar wilde geen broncode verstrekken en beriep zich op auteursrecht op de fixes.

Je kunt op zich ook op een klein werk (als in: weinig regels of woorden) auteursrecht hebben. Waar het om gaat, is of je een eigen intellectuele schepping dan wel eigen oorspronkelijk karakter/persoonlijk stempel daar in hebt zitten. Wat de rechter hier “banale of triviale elementen” noemt, valt buiten het auteursrecht. Die interrupt héét nou eenmaal 13h, dus dat getal zul je moeten noemen en daar is auteursrechtelijk niets intellectueels aan.

Intrigerender wordt het door de vervolgzin:

[D]e keuzes van de maker mogen niet louter een technisch effect dienen of te zeer het resultaat zijn van een door technische uitgangspunten beperkte keuze.
Dat je bij programmeren creatief bezig bent, erkent iedereen. Maar er zijn randgevallen waarin daar geen (of weinig) sprake van is. Het herstellen van fouten is zo’n randgeval: je bent dan niet iets nieuws en eigens aan het toevoegen, je herstelt andermans fouten (of denkt dat te doen), en dat is haast per definitie niet een eigen inbreng.

Natuurlijk, het hangt af van het soort fout. Als je een naiëve eenregelige aanroep van een functie vervangt door een pagina vol met checks en balances inclusief security best practices, dan is die pagina vast auteursrechtelijk creatief. Deze zaak lijkt te zijn gegaan om het meer standaardwerk, het corrigeren van kleine misstappen in het origineel.

Een punt is nog wel dat een bug best moeilijk kan zijn om op te sporen (ik heb veel bewondering voor deze) maar niet perse moeilijk om op te lossen áls je het probleem gevonden hebt. Iedereen kent het verschijnsel van een hele middag bezig zijn om een ongewenste puntkomma te lokaliseren. Het frustrerende is dan dat die activiteit niet auteursrechtelijk relevant is – het gaat alleen om creativiteit die in het resultaat te herkennen is.

Als laatste bleek de bugfixer/programmeur niet inhoudelijk diep te zijn ingegaan op wáár dan de creativiteit zat. Als je je op auteursrecht beroept, moet je (desgevraagd) wel kunnen aantonen waarom het jouw intellectuele schepping was.

Arnoud

Mag een dienst zomaar een AI-hergebruiksrecht in de voorwaarden zetten?

Photo by Anete Lusina on Pexels

Mensen hebben kennis genomen van de bijgewerkte gebruiksvoorwaarden voor het gebruik van Adobe-software en zijn verontwaardigd, omdat ze vrezen dat Adobe volledige toegang heeft tot de inhoud van een gebruiker. Aldus nieuwssite Petapixel. Het is een ander aspect van de AI-hergebruikdiscussie: ditmaal gaat het over auteursrechten en contractuele afspraken.

Adobe is niet zozeer op zoek naar gesprekken en dergelijke content, maar heeft dringend behoefte aan bergen beeldmateriaal waarmee ze haar beeldgeneratoren kan voeden. Dat vereist een licentie onder het auteursrecht van de makers, plus toegang tot hun bestanden.

Adobe is een clouddienst, dus dat is een kwestie van een daartoe strekkend beding opstellen:

Solely for the purposes of operating or improving the Services and Software, you grant us a non-exclusive, worldwide, royalty-free sublicensable, license, to use, reproduce, publicly display, distribute, modify, create derivative works based on, publicly perform, and translate the Content. For example, we may sublicense our right to the Content to our service providers or to other users to allow the Services and Software to operate with others, such as enabling you to share photos.
Zoals al vele malen gesignaleerd de afgelopen decennia bij dit soort clausules: hier staat dat men álles mag. (De “For example” is leuk maar juridisch niet relevant.) Dat was in het verleden vaak wat speculatief – gaat Facebook jouw leuke statusupdate op mokken verkopen soms? Maar er is nu een duidelijke use case, namelijk dat trainen van AI modellen. En ja, dat mag naar de letter van deze tekst.

Dit werd op X gesignaleerd met de constatering dat iedere Adobe-gebruiker met enige geheimhoudingsplicht naar cliënten nu een probleem heeft. Immers, Adobe mag je beelden analyseren en als dat werk in opdracht onder NDA is – of werk van een geheimhouder zoals advocaten of artsen – dan doorkruist dat je bestaande afspraken.

Ja, dat is een probleem, ook als je aanneemt dat bij Adobe geen mens naar jouw beeld kijkt en ze echt niet jouw afbeeldingen gaan lezen om daar onthullende publicaties mee te doen. Als je afspraak is dat niemand je werk krijgt behalve de opdrachtgever, dan mag je ook niet toestaan dat Adobe dat doet. Ik snap dan ook goed de vele geluiden van mensen die op zoek zijn naar een alternatief.

Is er juridisch wat aan te doen? Vooralsnog niet: Adobe is geen VLOP en dus niet onderworpen aan de strengste regels van de DSA. Zuiver contractueel is de wijziging in de voorwaarden toegestaan, omdat het een business-to-business dienst is.

Arnoud

Is mijn persoonlijk motto juridisch te beschermen?

Photo by Nathan Dumlao on Unsplash

Een lezer vroeg me:

Ik heb me de afgelopen jaren online geprofileerd met een specifieke slogan of motto, en ben daarmee heel herkenbaar en zichtbaar geworden. Nu wil ik mijn kennis in boekvorm uitgeven, maar ik ontdek net dat er al enkele maanden een semi-concurrent met een zeer vergelijkbare titel op de markt is. Kan ik me ergens op beroepen?
Een motto of slogan mag dan goed werken in je marketing, maar juridisch gezien is het een best lastig iets om wat mee te doen.

Vaak zie ik dat mensen denken auteursrecht te hebben op een slogan, soms zelfs met het ©-teken er bij. Dat is juridisch vrij kansloos: één enkele zin wordt vrijwel nooit als auteursrechtelijk beschermd gezien. En zeker als de ander er een variatie in aanbrengt, houdt het al heel snel op.

Een merkdepot is mogelijk. Je slogan moet dan onderscheidend zijn, in die zin dat mensen de slogan met jóu associëren. Het Hof van Justitie omschreef dat als volgt:

Dit kan in het bijzonder het geval zijn wanneer deze merken niet een gewone reclameboodschap zijn, maar in zekere mate origineel of pregnant zijn, een zekere uitleggingsinspanning vragen of bij het relevante publiek een denkproces in gang zetten.
Dat denkproces moet vervolgens wel bij jou uitkomen, wat mogelijk is door langdurig gebruik – we denken allemaal aan dezelfde persoon als we Tsjakka! horen, bijvoorbeeld. Wereldberoemd in Nederland hoeft niet: ik zou Er vis er een jarig hoera hoera ook een te beschermen merk achten.

Kern van een merk is wel dat je het gebruikt om naar jezelf te verwijzen. Een titel van een boek, hoe zeer dat boek ook met jou geassocieerd wordt, is dus niet geschikt als merk. Dat zou wel kunnen als je een reeks boeken uitgeeft onder een bepaalde groepstitel. Bij juristen is bijvoorbeeld de Tekst&Commentaar een zeer bekende reeks, en dat mag dus een merk zijn. (Andere juristen moeten hun commentaren op wetsteksten dus anders noemen, zoals ik met Artikelsgewijs commentaar.)

Hier gaat het om de titel van een boek die lijkt op een lang gebruikt merk. Allereerst is dan de vraag of dat merk vastgelegd is, zonder depot geen bescherming. Ten tweede is dan de discussie of die concurrent het merk gebruikt, oftewel hoe groot is de variatie, en lijkt het nog genoeg op het vastgelegde merk. En ten derde is de vraag of het merk als merk wordt gebruikt, doet die concurrent of hij je zakenpartner is of wil hij meeliften met jouw bekendheid?

Zonder de namen naast elkaar te leggen (wat in een blog wat onhandig is), is het moeilijk hier een definitieve uitspraak over te doen. In de zaken die ik ken, is voor mij de algemene regel wel ontstaan dat dit niet heel kansrijk is. Mensen hebben zelden een merk, en boeken die (variaties op) andermans slogan gebruiken doen dat zelden op een manier die inbreuk oplevert.

Je kunt natuurlijk een boos mailtje naar de concullega eruit doen, maar als het boek al in de winkel ligt is de kans vrij klein dat die op basis daarvan een terugroepactie organiseert. De beste tegenactie die ik ooit zag, was hard online reclame maken onder de slogan en kleine variaties daarop (toevallig lijkend op de boektitel) en zo de boekenlezers bij jou binnenhalen als klant.

Arnoud

Scarlett Johansson beschuldigt OpenAI ervan haar stem te gebruiken voor ChatGPT

Photo by Jason Rosewell on Unsplash

Scarlett Johanson zegt dat OpenAI haar stem zonder toestemming heeft gebruikt als AI-stem voor ChatGPT, las ik bij Tweakers. De betreffende stem, Sky geheten, leek sterk op de stem van Johansson, maar volgens OpenAI was dat niet bewust. Weinigen die dat geloven, want de stem werd vrij snel daarna weggehaald. Onder juridische druk heet dat dan – maar wat zou dat precies moeten zijn?

Het artikel legt uit:

In een verklaring van Johansson, die door journalist Bobby Allyn op sociale media werd gezet, zegt ze dat Altman haar in september vorig jaar had benaderd om de stem van ChatGPT in te spreken. Naar eigen zeggen sloeg zij dat aanbod toen af. Vlak voor de demonstratie zou Altman haar opnieuw hebben benaderd om haar stem in te spreken, maar voordat ze kon antwoorden, was Sky al gedemonstreerd.
Versie 4o van ChatGPT komt met stembediening en -uitvoer, en de stem Sky is er daar een van. Het is een gekloonde stemacteur wiens identiteit niet bekend wordt gemaakt aldus het bedrijf. Op zich kan dat, de technologie om stemsynthese te doen nadat iemand flink wat zinnen inspreekt is niet nieuw. Dat de vrouwen clichématig moesten klinken ook niet, maar dat terzijde.

Wel opmerkelijk is dat een van de gevraagde stemacteurs diezelfde Scarlett Johanson was. Helemaal als je bedenkt dat zij de stem van de AI insprak in de film herwaar OpenAI-directeur Sam Altman bij de lancering van GPT 4o expliciet naar refereerde. Dat elke gelijkenis met echte gebeurtenissen of locaties of personen, levend of dood, geheel toevallig is, wil er bij mij dan niet in.

Na een stevige brief van Johanssons advocaat werd de stem teruggetrokken. Maar voor mij begint het dan pas: welke juridische basis is er om een claim te leggen?

In Californië – waar dit speelt – zijn er iets meer mogelijkheden dan bij ons. Rechters hebben daar diverse malen geoordeeld dat het specifieke feit van “voice misappropriation” onrechtmatig is wanneer 

a distinctive voice of a professional singer is widely known and is deliberately imitated in order to sell a product, the sellers have appropriated What is not theirs and have committed a tort in California.
Het is dan een korte stap van ‘zanger’ naar ‘acteur’, dus die juridische gestalte zie ik wel opdoemen.

Minstens zo interessant is het argument dat hier een audio-deepfake wordt gemaakt van Johanssen. Dat is voor zover ik kan vinden niet strafbaar – alleen video-deepfakes en dan ook nog eens met het motief van beschamen of beschadigen – maar als bewezen zou worden dat OpenAI, al is het impliciet, de stem van Johanssen wilde laten horen dan ben je daar een heel eind.

In Nederland is er ook geen algemeen strafrechtelijk verbod op audio-deepfakes, maar daar hebben we binnenkort wél artikel 50 van de AI Act dat bij het produceren van deepfakes een duidelijke markering vereist. Dat betekent volgens mij dat het er expliciet bij moet staan, je deepfake ‘Sky’ noemen is echt te weinig.

Arnoud

Mag dat eigenlijk wel, generatieve AI zoekresultaten aan elkaar laten praten?

Photo by Mohamed_hassan on Pixabay

Soms wilt u snel antwoord, maar heeft u geen tijd om alle benodigde informatie bij elkaar te zoeken. Search doet het werk voor u met AI Overviews. Met die marketingblaat maakte Google onlangs bekend dat haar zoekdienst AI gaat krijgen: deze verwerkt resultaten tot een mooi klinkend verhaal. Wat leidt tot de juridische vraag, mag dat eigenlijk wel?

Technisch gezien is “AI Overviews” niet meer dan een herziening van het resultaatscherm. In plaats van een lijst met webpagina’s neemt Google de daarop gevonden informatie en laat een genAI systeem daar een verhaaltje van maken. Dat lijkt vooral handig voor een snel overzicht en het opnemen van de informatie.

Er zit echter een fundamenteel verschil met de ouderwetse lijst. Waar die lijst niet meer doet dan suggereren waar je heen kan gaan, met bij wijze van citaat een paar mogelijk relevante frases, geeft dit verhaaltje al direct het antwoord. Doorklikken is daarmee niet meer nodig.

Dit wringt, omdat zoekmachines altijd juist vanwege die quid pro quo van het aanleveren van bezoekers in ruil voor het mogen scrapen van content als soort-van-legaal zijn gezien onder het auteursrecht.

Een genAI-zoekmachine haalt echter die balans onderuit. Wel alle content binnenhalen, maar niet als hoofdregel mensen doorverwijzen. Dat kost de contentaanbieders dus alleen maar, terwijl ze er niets (of veel minder) voor terugkrijgen.

Alleen: dit is vrij ongrijpbaar, juridisch gezien. Er is nooit letterlijk een uitspraak over geweest. We hebben wel zaken zoals het Zoekallehuizen-arrest (huizenadvertenties) gehad, maar daar ging het om het vertonen van stukjes informatie in zoekresultaatpagina’s, niet om het onderliggende scrapen en opbouwen van een databank met heel internet.

Natuurlijk, we hebben ondertussen diverse nieuwe wetten – de AI Act (bijna), de Digital Markets Act, de nodige aanpassingen aan de Auteurswet, enzovoorts. Maar geen daarvan bevat iets waarmee deze transformatie van zoekresultaten aan te pakken is.

Ja, ik ben een tikje cynisch maar sowieso erger ik me al geruime tijd aan de achteruitgang van de ooit bliksemsnelle en verrassend goed werkende zoekmachine. Als ik dan óók nog de bronsites moet gaan vissen uit een mooi klinkend verhaal dan houdt het wel een beetje op hiermee.

Arnoud

 

Franse toezichthouder beboet Google wegens trainen AI op nieuwsberichten

Photo by Patrick Tomasso on Unsplash

De Franse toezichthouder legt Google een boete van 271 miljoen dollar op wegens auteursrechtschending op generatieve AI, las ik bij CIO Magazine. Niet precies: het is geen schadevergoeding of boete voor het overtreden van de Auteurswet, maar wegens een schending van een eerdere schikking rondom toen nog Bard.

Zoals het artikel nader uitlegt:

De Autorité de la concurrence zei woensdag dat de zoekgigant niet heeft voldaan aan een schikking uit juni 2022 over het gebruik van nieuwsverhalen in zijn zoekresultaten, Nieuws- en Discover-pagina’s. Google vermeed op dat moment een boete door onder meer te beloven te goeder trouw te gaan onderhandelen over compensatie met nieuwsaanbieders voor hun inhoud.
Deze schikking betrof een breder onderzoek naar vermeende auteursrechtinbreuk door Google met hun News-dienst. De discussie was toen of het overnemen van snippets en kleine afbeeldingen telt als inbreuk, citaatrecht of iets anders.

Over zo’n dispuut kun je schikken, en dan kun je allerlei afspraken maken. En als je daarbij niet uitkijkt dan komen die afspraken terug in een geheel andere context:

With regard to “Bard”, the artificial intelligence service launched by Google in July 2023, the Autorité found in particular that Bard had used content from press agencies and publishers to train its foundation model, without notifying either them or the Autorité. Google subsequently linked the use by its artificial intelligence service of the content concerned to the display of protected content, by failing to propose a technical solution for press agencies and publishers to opt out of the use of their content by Bard without affecting the display of content protected by related rights on other Google services, thus obstructing the ability of press agencies and publishers to negotiate remuneration.
Voor mij is met name dat “technical solution” heel relevant: Google zal nu een opt-out moeten gaan ontwikkelen voor Franse nieuwsdiensten. Dat kan zo simpel zijn als duidelijk maken hoe men hun aparte AI-scraper bot kan weren met een robots.txt-bestand (want het zou oneerlijk zijn om als je daarmee ook de gewone Googlebot zou weren).

Interessanter is als men een nieuw protocol ontwikkelt (ai.txt?) waarmee je als uitgever kan aangeven dat data mining voor AI-training niet toegestaan is. Dat zou dan bredere consequenties hebben, omdat onder de Europese auteursrechtregels tekst- en datamining (TDM) is toegestaan op beschermd werk tenzij dit machinaal leesbaar is voorbehouden. Tot nu toe is er geen enkele standaard op dit gebied, en machineleesbaarheid bestaat niet zonder standaard.

Arnoud