Deze fotograaf kreeg een rekening omdat hij zijn foto uit de LAION dataset wilde hebben

Een Duitse stockfotograaf eiste bij de beheerders van de LAION dataset verwijdering van zijn foto’s, maar kreeg een factuur van $979 in plaats van excuses. Dat las ik bij VICE, en ik wou dat ik zulke clickbaittitels kon schrijven. De zaak is interessant genoeg, zeker nu de fotograaf een rechtszaak is begonnen.

Het Duitse LAION project onderhoudt een van de bekendste datasets met geannoteerde afbeeldingen, waarmee AI systemen getraind kunnen worden. De bekende afbeeldingsgeneratoren zoals Midjourney en Stable Diffusion gebruiken LAION. Een discussiepunt bij dit soort sets is of hier sprake is van auteursrechtinbreuk, wat onder meer tot deze class action rechtszaak leidde.

Over een praktische aanpak blogde ik vorig jaar: via de website “Have I been trained” kun je achterhalen of jouw foto gebruikt is om een AI te trainen. Of nou ja, of je in een dataset zit die zo’n AI gebruikt, wat juridisch niet precies hetzelfde is. Ik schreef toen:

De state of the art dataset tegenwoordig is LAION-5B,met 5,85 miljard afbeeldingen verreweg de grootste. Bijeengebracht voor researchdoeleinden en experimenteren met zulke enorme sets, aldus de website. “The images are under their copyright”, staat er dan ook. En dan de juridische truc, of nou ja truc, waarmee dat kan: elk item uit de dataset bevat simpelweg alleen de bron-URL van de afbeelding, waarmee de dataset zelf geen inbreuk is.
De bedoeling van die website was dat je AI-bedrijven ging aanschrijven. Fotograaf Robert Kneschke koos een fundamenteler route: hij schreef LAION aan. Want je kunt maar beter problemen bij de bron aanpakken, nietwaar? Als die je foto uit hun set halen, zal niemand deze meer gebruiken.

De reactie was verrassend voor zowel Kneschke als VICE:

“Our client only maintains a database that contains links to image files that are publicly available on the Internet. It cannot be ruled out that the database may also contain links to images that you are the author of,” the letter, written by the law firm Heidrich Rechtsanwälte on behalf of LAION and viewed by Motherboard, said. “However, since our client does not save any of the photographs you have complained about, you have no right to deletion. Our client simply does not have any pictures that could be deleted.”
En ja, dat klopt dus met wat we vorig jaar hadden gezien: de dataset bevat fysiek geen afbeeldingen, alleen links daarheen. Ja dat is een truc, en ja die truc is legaal: onder het Europese auteursrecht is linken naar legaal gepubliceerd materiaal geen inbreuk. Het doet er daarbij niet toe welke gebruiksvoorwaarden of licentie de publicist bij het materiaal vermeldt. Dat is het probleem van de partij die de link volgt en de foto downloadt – de datasetsamensteller die er een AI mee gaat trainen dus, niet stichting LAION.

Vervolgens pakte de fotograaf door met een takedown-eis. Daar kwam dus die reactie met factuur op, wat een zeer creatieve terugblafactie is:

The legal letter [van LAION, AE] contained an invoice for $979 in Euros, and demanded that Kneschke pay the amount within 14 days or the firm will take legal action. The amount was due for filing an unjustified copyright claim, the lawyers argued, saying that Kneschke must pay because their client had now incurred legal fees to deal with the matter.
In het Europees auteursrecht is het zo dat de verliezer in een rechtszaak de werkelijke advocaatkosten van de winnaar betaalt. Dus niet het liquidatietarief zoals in andere rechtsgebieden, maar echt de factuur van die advocaat. En ja, als je dus als rechthebbende een dure advocaat neemt dan gaat de inbreukmaker meer betalen. En ja dat is oneerlijk. Maar het werkt ook andersom: als een rechthebbende onterecht blaft, mag je als beweerdelijke inbreukmaker jouw advocaatkosten neerleggen bij de blafhebbende.

Dat laatste is dus wat de LAION advocaat doet. Men ontwaart een onterechte auteursrechtclaim, omdat er wordt gesteld dat de dataset inbreuk maakt maar daar zit alleen een link in en dat is auteursrechtelijk legaal. Het in discussie blijven kost tijd van de advocaat, tijd is geld, dus de blafhebbende fotograaf moet die kosten vergoeden. Formeel hoeft dat pas bij een rechtszaak (want het is een proceskosten-vergoeding) maar de rekening na een rechtszaak zal hoger zijn dan die 900 euro.

Natuurlijk zal LAION ooit die foto’s hebben gedownload, al is het maar om de hyperlink te controleren of er echt een afbeelding achter zit en welke resolutie deze heeft. Die download zou je kunnen zien als een inbreuk, want daar is dan dus wél een kopie gemaakt. Maar in Europa hebben we sinds een aantal jaar een auteursrechtelijke uitzondering voor “data mining”, bij ons artikel 15o Auteurswet:

Onverminderd het bepaalde in artikel 15n wordt een reproductie in het kader van tekst- en datamining niet als inbreuk op het auteursrecht op een werk van letterkunde, wetenschap of kunst beschouwd mits degene die de tekst- en datamining verricht rechtmatig toegang heeft tot het werk en het auteursrecht door de maker of zijn rechtverkrijgenden niet uitdrukkelijk op passende wijze is voorbehouden, zoals door middel van machinaal leesbare middelen bij een online ter beschikking gesteld werk.
Met name dat stuk over het voorbehoud is van belang. Menig fotograaf of andere auteursrechthebbende zal een licentietekst of gebruiksvoorwaarden bij zhaar werk publiceren, al is het maar een Creative Commons licentie met bijvoorbeeld een NietCommercieel variant. Je zou zeggen dat je het daarmee juridisch dichtgetimmerd hebt, maar voor gegevensmijnwerkers is het ondoenlijk om al die teksten te gaan lezen. Daarom staat er in de wet dat zo’n voorbehoud op “passende wijze”, met name dus machineleesbaar, moet zijn gedaan.

Kneschke heeft zover ik kan zien geen machine-leesbare licentieinformatie bij zijn afbeeldingen, maar ze staan wel legaal online. Daarmee is dus aan deze uitzondering voldaan, zodat een partij zoals LAION ze mag downloaden voor datamining. Oftewel: haal ze binnen, extraheer de relevante informatie (omvang, type, etc) en maak een record waarin je die informatie vastlegt plus de hyperlink, gooi daarna de afbeelding weg. Ik zie niet hoe dit auteursrechtinbreuk kan opleveren.

Arnoud

Wat is er aan de hand met de nieuwe merkenregels van programmeertaal Rust?

De nieuwe trademark-regels van het open source Rust project doen nogal wat stof opwaaien, las ik bij DevClass. Rust is een relatief populaire programmeertaal, die problemen met andere talen oplost. De taal wordt vanuit de opensourcegedachte aangeboden inclusief alle benodigde tooling, en in 2020 werd een stichting opgericht waarbij de naam als merk werd vastgelegd. De nieuwe voorgestelde regels over merkgebruik maken nogal wat los. Wat is hier aan de hand?

Zoals vrijwel iedere opensourceorganisatie heeft ook Rust een merkbeleid. Daar staat weinig controversieels in. De kern van zulk beleid is altijd een balans tussen enerzijds mensen de naam laten gebruiken (de software is immers open source) en anderzijds grip krijgen op ongewenst gebruik. Dat gaat met name over commercieel misbruik, zoals bij conferenties die zich al te officieel voordoen of herverpakte software die onder de merknaam wordt verkocht waarbij de naleving van de licentie hooguit een vage wens is, zal ik maar zeggen.

Het nieuwe beleid leek vooral bedoeld om wat puntjes op de i te zetten. Maar het gaf enorme heisa, onder meer vanuit de eerste ontwikkelaar Graydon Hoare die erover zegt:

Announcing “common practice in the community is now forbidden” is why everyone’s upset. If that’s not what’s intended, it needs a rewrite, because that’s what it says.
De oude policy was vrij simpel van opzet: je mag de merken en logo’s gebruiken zolang je dat maar niet zo doet dat een vluchtig oplettend iemand zou denken dat jouw ding van de Rust Foundation komt. Ook mag je geen verwarring creëren over het vrije en open karakter van de taal en de tooling, of (buiten kleinschalige events om) geld verdienen met de logo’s an sich, zoals bij merchandise. Dat is natuurlijk volledig standaard, en dat is dan ook wat graydon bedoelt met “common practice”.

De nieuwe policy bevat enkele opmerkelijke zaken, zoals artikel 4.3.1 over zelfgeschreven programma’s in die taal:

Using the Marks in the name of a tool for use in the Rust toolchain, a software program written in the Rust language [AE], or a software program compatible with Rust software, will most likely require a license. The “RS” abbreviation can be used instead.
Het is merkenrechtelijk volstrekt geen inbreuk als je bij een programma geschreven in Rust wil aangeven dat het in Rust geschreven is. Idem voor compatibiliteit, aangeven wat de aard of bestemming van de waar is, is al zo ongeveer sinds de uitvinding van het merkenrecht een toegestane handeling. Ik snap dus werkelijk niet wat hier de bedoeling van moet zijn geweest.

Ook over gebruik van het grafische logo staan er nieuwe regels, die neerkomen op “je mag niets veranderen behalve de grootte of het zwartwit maken”. Het is toch ook vrij gebruikelijk dat logo’s worden bijgekleurd in de huisstijl van een event of website. Dat zou niet automatisch een probleem moeten zijn. En natuurlijk kun je dan zeggen, laat die mensen gewoon even snel toestemming vragen. Maar dat is nogal een hindernis, ik ken geen bedrijf of stichting waar je snel even een merkenrechtelijke toestemming kunt vragen en dan een eenduiding antwoord in de mail zou krijgen. Dus dat zal mensen zeker hinderen.

Het kan wel, want er staat “contact us” bij – ik citeer even het voorbeeld van conferenties:

Events and conferences are a valuable opportunity to grow your network and learning. Please contact us at ‘Where to go for further information’ below if you would like to hold an event using the Marks in the event name. We will consider requests to use the Marks on a case by case basis, but at a minimum, would expect events and conferences using the Marks to be non-profit-making, focused on discussion of, and education on, Rust software, prohibit the carrying of firearms, comply with local health regulations, and have a robust Code of Conduct.
Het is voor mij de eerste keer in m’n leven dat ik merkbeleid lees dat als voorwaarde voor een licentie eist dat de ontvangende organisatie het dragen van vuurwapens verbiedt. Maar ik snap het wel: diverse Amerikaanse staten hebben tegenwoordig regels waarmee je zonder wapenvergunning met een (vaak ook nog verborgen) vuurwapen mag rondlopen. En er zijn ook genoeg mensen die er een punt van willen maken en met een zeer zichtbaar wapen naar zo’n conferentie gaan. Dat verbieden is dan de standaardmanier om een veilige omgeving te creëren. Dit in aansluiting op de Code of Conduct, een verwijzing naar typische regels bij conferenties die lastigvallen, beledigende opmerkingen over bijzondere persoonsgegevens, stiekem fotograferen en dergelijke aan banden leggen. Allebei deze onderwerpen zijn controversieel bij conferenties in de VS, dus een deel van de discussie gaat dan meteen over het al dan niet ‘woke’ karakter van het merkbeleid.

Bij DevClass verzekert het Rust-stichtingsbestuur iedereen dat er echt niets aan de hand is en men teleurgesteld is in sommige reacties:

The goal of the Trademark Policy consultation phase is to involve interested members of the public so we can surface actionable comments, questions, and suggestions and apply them to the next draft. To do this effectively, we needed to set up a system to gather feedback from the Rust Project and community in an organized fashion, hence the form. We were disheartened to see misinterpretations of this intention.
Men kondigt wel aan om direct na sluiting van de consultatieronde al feedback te geven, wat een positief signaal moet zijn. Ik ben benieuwd!

Arnoud

Als je klant je broncode wist, dan hou je een leeg auteursrecht over, succes verder

“Eiser heeft al vrijwilliger software ontwikkeld voor gedaagde.” Een zin in een arrest waar menig ict-jurist rillingen van krijgt: weinig dingen gaan zo vervelend verkeerd als afspraken tussen vrijwilligers. Ook in deze zaak: de software was heel handig, maar op zeker moment is de samenwerking beëindigd, en oh ja oeps, toen “heeft gedaagde de computer waarop haar server draaide laten formatteren en vervolgens verkocht.” Waarna de eiser nu zijn auteursrecht inzet om de broncode terug te zetten. (Dank, tipgever)

Het gerechtshof (ja, dit ging in hoger beroep) legt de feiten kort en zakelijk uit:

[appellant] heeft als vrijwilliger software voor [de stichting] ontwikkeld. Aan die samenwerking is een einde gekomen. Op enig moment heeft [de stichting] de computer waarop de server van [de stichting] draaide laten formatteren en vervolgens verkocht. [De stichting] beschikt nog over een gedeeltelijke back-up. [appellant] wil dat [de stichting] hem de broncode van de door hem voor [de stichting] ontwikkelde software afgeeft en, wanneer dat niet (meer) mogelijk is, dat [de stichting] hem schade vergoedt die hij daardoor lijdt.
De software had als doel het incasseren van donaties, ter vervanging van een commercieel pakket van een derde. Ik zie wel hoe dat enige waarde heeft, ook als de samenwerking ten einde is gekomen – genoeg andere stichtingen die wellicht óók die software willen gebruiken. Daarnaast vermoed ik dat de procedure ook iets te maken had met dat er op zeker moment onenigheid is ontstaan tussen het bestuur en een ander lid dat kennelijk enige band had met de vrijwilliger in kwestie.

Uiteindelijk zette de vrijwilliger zijn auteursrecht in om de broncode terug te krijgen. Er was weinig twijfel dát hij het auteursrecht had, ook al was er een vrijwilligersovereenkomst getekend met daarin een bepaling dat “De werkzaamheden zullen bestaan uit: Bouwen van de IKN Database“. Had daar nou “Alle auteursrechten die ontstaan uit de werkzaamheden komen toe aan de Stichting” bij gestaan, dan hadden we een mooie discussie kunnen voeren.

De stichting had natuurlijk wel een licentie (gebruiksrecht) op die software gekregen, wat uiteindelijk eindigde toen men afscheid van elkaar nam. Dat was ook niet het probleem; de stichting had een andere oplossing gevonden zo meldde men. Maar de broncode bewaren en teruggeven, dat hoort er niet bij.

Of nou ja, niet? Want in de afspraken was ergens wel terug te vinden dat de broncode “in eerste instantie enkel en alleen opgeslagen [wordt] op de daartoe aangeschafte server” die de stichting in huis had. Je zou dat kunnen lezen als een soort van beveiligingseis, het moet bij ons in-house staan zodat anderen er niet bij kunnen. Of misschien was het wel gemakzucht, dan hoeft de vrijwilliger het niet op zijn eigen laptop te beheren. Of controledrift, dan kan het bestuur een ander erbij laten (alleen hadden ze dan het auteursrecht moeten regelen). Of noem nog maar een paar motivaties.

[appellant] heeft op de zitting bij het hof duidelijk gemaakt dat er valide redenen waren om de broncode op de server van [de stichting] te schrijven, maar ook dat betekent niet dat voor [de stichting] duidelijk was of moest zijn dat zij ervoor verantwoordelijk was dat de auteursrechtelijk beschermde creatie van [appellant] op een drager behouden bleef. Op grond van de bewoordingen van de afspraken zoals [appellant] stelt dat die zijn gemaakt, hoefde voor [de stichting] niet duidelijk te zijn dat zij dat risico droeg.
Ik hoor wel eens vaker dat mensen op grond van hun auteursrecht claims leggen op kopieën. Dat is dus een probleem, zoals het Hof het hier formuleert: het auteursrecht legt aan een bewaarder niet de verplichting op om de broncode voor de rechthebbende veilig te stellen. Het auteursrecht is een verbodsrecht, een recht van uitsluiting. Je kunt wel mensen dwingen de broncode te wissen als ze die hebben in strijd met je recht, maar niet om ze je een kopie te laten geven.

Arnoud

Van wie is mijn werk als ik ChatGPT mijn werk laat doen?

Een lezer vroeg me:

Ik ben programmeur en in mijn arbeidscontract staat dat alle software die ik maak, eigendom van mijn werkgever is. Fair enough, maar ik gebruik vaak ChatGPT om basis-stukjes code op te zetten of oplossingen te suggereren voor problemen waar ik tegenaan loop. Is dan alleen die ene uitkomst van de bot eigendom van mijn werkgever of ook de vragen die die je ChatGPT hebt gesteld en daarmee alle mogelijke varianten?
Veel werknemers, niet alleen programmeurs, hebben inderdaad zo’n soort beding in hun arbeidscontract. Juristen zullen meteen opmerken dat het niet om eigendom gaat maar om auteursrecht, wat natuurlijk klopt mede gezien artikel 7 Auteurswet: “Indien de arbeid, in dienst van een ander verricht, bestaat in het vervaardigen van bepaalde werken…”

Zeker bij programmeurs is het niet ongebruikelijk om bij bronnen buiten je werkgever te kijken hoe je bepaalde problemen moet oplossen (relevant xkcd). Dat kan variëren van je inlezen via iemands blog tot een snippet dat concreet iets oplost tot het overnemen van een volledige opensourcelibrary waarmee je verder kunt. Wat de werkgever daarvan vindt, verschilt per bedrijf, maar het is in ieder geval niet relevant voor dat auteursrechtbeding op wat je maakt. Dat gaat immers over wat je zelf maakt, en betekent niet dat je bijvoorbeeld de auteursrechten moet overnemen van zo’n opensourcelibrary.

Bij ChatGPT geldt precies hetzelfde: dat is in feite een interactief soort snippetsite, die je gericht helpt bij het vinden van een oplossing of meedenken de goede kant op. De discussie bij ChatGPT is vooral wáár het auteursrecht nu ligt, omdat het juridisch criterium is wie de creatieve inbreng doet. Ik neig sterk naar dat de persoon die de prompt componeert, het creatieve proces in gang zet en daarmee de (hoofd-)auteur genoemd zou moeten worden. Maar ik kan niet ontkennen dat de GPT-software zelf ook de nodige keuzes maakt, je kunt meerdere uitkomsten krijgen met dezelfde prompt. Dit was bij die graphic novel recent nog de reden om auteursrecht door de prompter af te wijzen.

Ik zou dus voorzichtigheidshalve zeggen: de prompt is auteursrechtelijk gezien van je werkgever, de resultaten die je van ChatGPT krijgt moet je behandelen net zoals iedere snippet die je van Stackoverflow of andere externe bron haalt. En los van het auteursrecht zou het dus kunnen zijn dat dit eigenlijk niet mag, ChatGPT je software laten schrijven.

Arnoud

De US Copyright Office accepteert geen registraties van (mede) door AI gegenereerd werk, nou en?

De US Copyright Office, waar je auteursrechtelijk beschermde werken registreert als je rechtszaken wilt voeren, weigerde recent de registratie van de graphic novel Zarya of the Dawn omdat een deel van het werk door AI Midjourney gegenereerd was. Dat las ik bij The Verge. Weliswaar erkent men dat de tekst en plot en dergelijke het werk zijn van de mens Kris Kashtanova, maar de afbeeldingen zijn “not the product of human authorship” en daarmee niet voor registratie vatbaar. Betekent dit nu iets voor de rechtsontwikkeling van AI? Meh.

Kashtanova is artiest en productontwikkelaar bij Ministudio.AI, een dienst gericht op AI-gedreven visuele ontwerpen. Zoals graphic novels dus, waarvoor zhij een jaar geleden het plot schreef en met de Midjourney tool de bijbehorende grafische voorstellingen creëerde. De registratie bij de US Copyright Office was bedoeld om duidelijkheid te krijgen waar de auteursrechten dan liggen.

De US Copyright Office is formeel niet meer dan een registrerende instantie: je kunt daar naar Amerikaans recht je werk deponeren, en met de registratie ben je dan bevoegd een rechtszaak te starten en statutory damages (zeg maar een wettelijk gefixeerde schadeclaim) te doen. Er zit geen inhoudelijke toetsing in, hoewel men wel de bevoegdheid heeft registraties af te wijzen als ze evident niet aan de formele eisen te doen. En dat bleek hier het geval: Kashtanova had haar plan op de socials gedeeld, en dat was een medewerker van het Copyright Office opgevallen.

Dat leidde tot een afwijzingsbrief, die gezien het belang van de zaak gepubliceerd werd.

[W]hile the word “Midjourney” appears on the cover page of the Work, there is no indication of the intent or meaning of the word on the cover.  … Because the application had not disclosed the use of artificial intelligence, the Office determined that the application was incorrect, or at a minimum, substantively incomplete.
De USCO vat haar taak van het promoten van het auteursrecht breed op, want ze geeft vervolgens een uitgebreide juridische analyse waarom een AI geen (co-)auteur kan zijn, met zoals het hoort prachtige caselaw:
In cases where non-human authorship is claimed, appellate courts have found that copyright does not protect the alleged creations. For example, the Ninth Circuit held that a book containing words “‘authored’ by non-human spiritual beings” can only gain copyright protection if there is “human selection and arrangement of the revelations.”
Voor de afbeeldingen die Kashtanova via Midjourney genereert, ziet de USCO te weinig menselijke tussenkomst. Weliswaar voert zhij een prompt in, maar die leidt tot meerdere afbeeldingen waarop de mens geen invloed heeft. Dat laat zien dat de overwegende mate van creativiteit dus in de tool zit. Als de prompt leidend was, dan zou er één afbeelding uitkomen, zeg maar:
Rather than a tool that [Mx]. Kashtanova controlled and guided to reach her desired image, Midjourney generates images in an unpredictable way. Accordingly, Midjourney users are not the “authors” for copyright purposes of the images the technology generates. … A person who provides text prompts to Midjourney does not “actually form” the generated images and is not the “master mind” behind them. Instead, as explained above, Midjourney begins the image generation process with a field of visual “noise,” which is refined based on tokens created from user prompts that relate to Midjourney’s training database. The information in the prompt may “influence” generated image, but prompt text does not dictate a specific result.
Men trekt de vergelijking met Adobe Photoshop, dat ook een forse mate van eigen intelligentie inbrengt met de bewerkingstools, maar daarbij geldt wel steeds dat Photoshop doet wat je vraagt (niet lachen daar achterin). De controle ligt daarmee nog steeds bij de mens die Photoshop gebruikt. Dat het veel werk is om de juiste prompts te verzinnen en de beste afbeeldingen te selecteren, dat gelooft men graag, maar is geen creatieve inbreng in de zin van het auteursrecht.

De aanvraag wordt daarmee afgewezen, zij het dat Kashtanova deze mag aanvullen door bijvoorbeeld een disclaimer toe te voegen op de AI afbeeldingen. Zijn die dan publiek domein? Nou ja, in de opinie van de USCO dus wel, maar de Copyright Office is geen rechtbank. Hoewel hun opinie zwaar weegt (en goed onderbouwd is), is dit dus zeker geen uitgemaakte zaak.

Arnoud

Usenetprovider NSE droeg niet bij aan copyrightinbreuken maar ging wel ten onder, hoezo?

De Hoge Raad heeft in een zaak tussen usenetprovider News-Service Europe en Stichting Brein bepaald dat de provider geen inbreuk heeft gemaakt op het auteursrecht en in die zin niet onrechtmatig heeft gehandeld tegenover rechthebbenden. Dat meldde Tweakers vorige week. Een Pyrrhus-overwinning, want NSE is al lang (2011) gestopt met haar dienstverlening. Wat natuurlijk vele vragen opriep, want hoe kun je nou bij in hoger beroep én bij de Hoge Raad gelijk krijgen maar toch als bedrijf kapot zijn?

News-Service was als bedrijf sinds 1998 actief in de zakelijke usenetbranche: ze faciliteerde Usenetverkeer voor bedrijven die dat dan weer aan consumenten beschikbaar stelden. Dat betrof in de praktijk vooral binaries, Usenetberichten met daarin software of muziek en films – wat vaak zonder toestemming van de rechthebbenden werd verspreid. Daarom besloot stichting BREIN in 2006 Usenet op de korrel te nemen in aanvulling op de peer-to-peer sites die ze had aangepakt.

Het punt bij Usenet is: je hebt mensen die binaries posten (zeg maar de uploaders) en zij die deze weer ophalen (de downloaders). Die weten wat ze doen, maar het schiet niet op om individuele downloaders aan te spreken. En de uploaders zijn – net als bij p2p – lastig te vinden. Vandaar het idee om de tussenpersonen aan te spreken, in analogie met de torrentsites of hyperlinkzoekmachines waar BREIN al eerder tegen opgetreden had.

Juridisch is dat alleen niet eenvoudig, want tussenpersonen die alleen maar informatie doorgeven zijn wettelijk beschermd. En laat dat nu precies zijn hoe Usenetservers werken: ze krijgen een berg met posts van een andere server (of van een uploader) en storten een kopie van die berg bij al hun aangesloten peers. Daar zit geen filtering tussen, afgezien van spam, dus veel passiever en automatischer dan Usenet krijg je ze niet, qua tussenpersonen.

De rechtbank Amsterdam zag dat anders: NSE was wel degelijk zelf aan het publiceren in auteursrechtelijke zin, en NSE mocht geen beroep doen op die bescherming van providers. Dat werd weliswaar teruggedraaid in hoger beroep (en dus bij de Hoge Raad), maar de fatale klap zat hem in wat juridisch de “uitvoerbaarheid bij voorraad” van het vonnis heet: BREIN mocht de dwangsommen uit dat vonnis in eerste instantie opeisen ook zolang het hoger beroep liep.

Weliswaar had BREIN ze dan terug moeten betalen als NSE in hoger beroep had gewonnen (art. 611c lid 1 Rv), maar het was in 2011 natuurlijk geen zekerheid dat NSE zou winnen. En we hebben het hier over 50.000 euro per dag dat NSE haar diensten zou blijven aanbieden, met een maximum van 1 miljoen euro. Het arrest in hoger beroep was in augustus 2014 na een vonnis in september 2011, dus dat miljoen zou makkelijk zijn gehaald. En wie kan het zich veroorloven een miljoen te betalen als bedrijf met de kans dat je het drie jaar later terug zou krijgen?

Arnoud

Hoe aansprakelijk wordt OpenAI voor de zakelijke versie van ChatGPT?

OpenAI werkt aan een zakelijke, betaalde versie van zijn chatbot ChatGPT. Dat meldde Tweakers onlangs. Momenteel is de chatbot gratis maar niet voor bedrijfsdoeleinden inzetbaar (wat natuurlijk geen hond tegenhoudt om er zakelijk gebruik van te maken). Het onderscheid zal vooral zitten in beschikbaarheid, snelheid en meer berichten per minuut. Het riep wel vele vragen op, die in de comments mooi samengevat werden als “Hoe wordt er in de professionele variant rekening gehouden met data die proprietary is of waar, op zijn minst, een copyright op berust?”

Het GPT-3 taalmodel waar de chatbot mee werkt, is getraind op vele miljarden tekstvoorbeelden. Het doel is leren wat het meest logische volgende woord is – kort gezegd – op basis van een prompt en de reeds gegeven woorden. Dat is met genoeg voorbeelden prima mogelijk, zeker op het niveau van chats waarbij je een vraag moet beantwoorden. ChatGPT produceert dan ook verbluffend goede resultaten, hoewel er ook volkomen waanzinnige reacties tussen zitten die met de grootste overtuiging worden gebracht.

Die tekstvoorbeelden komen natuurlijk van internet, ‘gewoon’ met een crawler die heel internet downloadt en daar machine-leesbare chocola van maakt. De makers leggen uit dat ze meer dan een biljoen (Amerikaans trillion, 1012) woorden hebben verwerkt. Dat kan niet anders dan zonder toestemming, maar iedereen stelt dat dit onder fair use te rechtvaardigen is en weet bovendien dat het ontzettend moeilijk is aan te tonen dat specifiek iemands werk opgenomen is in de dataset, plus dat een rechtszaak om dít punt uit te vechten veel te duur is voor iedere individuele rechthebbende. Uitgesloten is het niet – zie de rechtszaak over CoPilot, waarbij software-eigenaren wel degelijk zagen hoe deze AI-tool herkenbare fragmenten uit hun werk reproduceerde als “AI-generated”.

In de VS zou er misschien nog een lichtpuntje zijn wanneer je aannemelijk kunt maken dat jouw werk is gebruikt, omdat je dan via de zogeheten discovery procedure inzage kunt krijgen in documentatie rondom de bronbestanden. Dan heb je in ieder geval het feitelijke bewijs dat jouw werk is gebruikt. Vervolgens zit je nog met het juridische punt of het inbreuk is om een AI te trainen op jouw data, of dat het pas inbreuk is als de AI jouw werk reproduceert (dat laatste lijkt me evident).

In het auteursrecht geldt nu eenmaal de regel dat het bronwerk herkenbaar terug moet komen in het beweerdelijk inbreukmakende werk. Als ik iemands artikel lees en me laat inspireren tot een hoofdstuk in een boek, dan schend ik geen auteursrechten, hooguit pleeg ik academisch plagiaat. Maar als ik het artikel min of meer naschrijf, dan komt het auteursrecht wel om de hoek kijken. De academische grap is dan ook: één bron gebruiken is plagiaat, honderd bronnen gebruiken is onderzoek. En laat AI nou dus heel duidelijk die laatste kant op gaan: als honderd bronnen gebruiken mag, dan zal varen op honderd miljoen bronnen toch zeker ook wel mogen.

Het nieuwe aan de discussie is vooral dat we nu een betaalde dienst krijgen met een SLA. Afnemers daarvan zullen meer garanties gaan eisen, waaronder dus met name een vrijwaring (indemnification) tegen claims van derden. Want als ik als rechthebbende lees dat er ergens een adviesbureau komt dat een juridische chatbot heeft, dan ga ik die natuurlijk aanklagen en niet OpenAI uit San Francisco. Want ik durf de stelling wel aan dat mijn blog ergens in die dataset zit. Dat bureau heeft dan een probleem, want die is zelfstandig aansprakelijk. Dus dan moeten ze OpenAI zo ver krijgen de verdediging te gaan voeren, en dan wordt het een groot verhaal waar best wat nuttige puntjes uit te slepen zijn.

Arnoud

Is het toegestaan iemands stem na te doen met een AI zoals Vall-E?

Een lezer vroeg me:

Recent presenteerde Microsoft een nieuw AI-model, genaamd Vall-E. Dit text-to-speechmodel kan gesproken zinnen in vrijwel ieder stemgeluid genereren na een sample van drie seconden gehoord te hebben. Het AI-model kan daarbij ook intonatie en emotie nabootsen. Is dat strafbaar, als ik het train op iemands stem en die dan van alles laat zeggen?
Er is geen stem-equivalent van het portretrecht, dat je een (soort van) algemene zeggenschap over je beeltenis geeft. De positie van de stem in het portretrecht is al lang onderwerp van discussie. Niet met AI, maar gewoon met stem-imitatoren (zoals Gert-Jan Dröge en koningin Beatrix overkwam). De rechtspraak is daar altijd hard in geweest: dat is géén portret, geen afbeelding van die persoon. Laatstelijk nog in 2020, toen een vrouw probeerde zich te verzetten tegen gebruik van een audiofragment van haar stem.

Dat vonnis maakte wél duidelijk dat een stemgeluid een biometrische persoonsgegeven kan zijn onder de AVG. De definitie (artikel 4 lid 4 AVG) noemt als voorbeelden wel “gezichtsafbeeldingen of vingerafdrukgegevens” maar ik zie geen bezwaar tegen een herkenbare uitspraak van iemand op een lijn te zetten met een portretfoto of vingerafdruk. De Franse toezichthouder ziet dit ook zo.

Natuurlijk moet het stemgeluid wel herleidbaar zijn, de persoon er achter moet te identificeren zijn. Dat is bij een willekeurig stukje geluid opgenomen in een winkelstraat erg lastig. Maar bij zo’n online geluid dat uit een AI komt is dit een stuk makkelijker – de publicist van het geluid zet erbij wiens stem het is. Ja oké, hij liegt, maar een leugenachtig informatie-element over een persoon is net zo goed een persoonsgegeven.

Een onjuist (want leugens bevattend) persoonsgegeven zou te corrigeren of te verwijderen moeten zijn, wat je dus zeggenschap zou geven over zo’n stemopname. Die vrouw uit 2020 had echter pech, omdat bij haar de opname gebruikt werd in een theaterprogramma, en dat is een verwerking voor artistieke doeleinden. Die zijn net als journalistieke verwerkingen niet vatbaar voor het recht van correctie of verwijdering.

Het is goed mogelijk dat zo’n AI-stem ook daarvoor wordt gebruikt: laat Mark Rutte wat geks zeggen (u mag zich oud voelen: Tuut tuut tuut, de groeten van …?) of leg Max Schrems wat positiefs over Privacy Shield in de mond en noem het parodie. Als de stem wordt gebruikt om iemand voor gek te zetten zonder enige literaire of artistieke rechtvaardiging, dan is dat wél met de AVG aan te pakken.

Strafbaar is het niet, iemands stem imiteren. Daar kom je pas als je met die imitatie (al dan niet met AI) een strafbaar feit construeert, zoals die persoon zijn reputatie beschadigen of valse bekentenis afleggen (smaad) of de uitspraak gebruiken om fraude te plegen (de directeur imiteren die een frauduleuze betaalopdracht geeft).

Arnoud

 

Moet een auteursrechtspeurhond bewijzen dat ze de rechten hebben?

Een lezer vroeg me:

Recent kreeg ik een sommatiebrief van een voor mij onbekende club, die zegt dat ze de auteursrechten hebben op een foto die op mijn site staat. Of ik even 1750 euro wil betalen. Maar ik wil op zijn minst eerst weten of zij wel echt die rechten hebben, iedereen kan wel van alles beweren natuurlijk. Sta ik in mijn recht als ik weiger te betalen tot ik overtuigend bewijs heb gezien?
Het komt nog steeds vaak voor dat mensen foto’s van internet plukken zonder te controleren of de licentierechten wel in orde zijn. Het belangrijkste advies blijft dan ook: haal je foto’s van een legitieme fotosite of maak afspraken met de fotograaf. Er zijn echt héél veel fotografen die mooi werk publiceren en (na vragen) het niet erg vinden als je dat als illustratie gebruikt. En ook voor stockbeeld zijn er genoeg zeer betaalbare en zelfs gratis sites.

Maar goed, daar heb je natuurlijk weinig aan op het moment dat er zo’n claimclub in de mail zit. Er zijn er een hoop; beruchte organisaties zijn het Duitse Copytrack en het Nederlandse advocatenkantoor MillerReyBrighton maar er zijn er veel meer. De werkwijze is vaak min of meer dezelfde: men heeft de foto gevonden met een gespecialiseerde zoektool (omgekeerd zoeken, het kan ook via Google Images) en omdat de naam van de site-eigenaar niet in de licentiedatabank staat, volgt er een rekening voor ongelicentieerd gebruik.

In de basis is het natuurlijk simpel: afgezien van citaatrecht en nog een paar dingen mag je andermans foto’s niet gebruiken zonder toestemming. De daardoor ontstane schade moet je vergoeden, en “ik wist het niet” of “ik heb geen kans gekregen de foto snel weg te halen” is géén argument. Je bent per direct aansprakelijk voor auteursrechtinbreuk, en daar zijn geen excuses voor. De discussie gaat dan ook altijd over de hoogte van de vergoeding, want veel van die claimclubs schrijven met een hark: op een of andere prijslijst staat 750 euro voor “gebruik zonder licentie”, er ontbreekt naamsvermelding dus huppa nog eens 750 erbij, er is een hoekje afgeknipt dus verminking bám nog eens 750 en vier uur opsporingskosten à 195 euro maar we maken het af op 1750 euro als u dat binnen 48 uur overmaakt.

Of je dat moet betalen, is natuurlijk zeer de vraag. De rechter zal kijken naar het normale tarief van deze fotograaf (gemiddelde bedragen uit de branche boeien niet, dus kom niet aan met dat je bij iStock voor een tientje “ook zoiets” koopt). Als die normaal inderdaad 750 euro krijgt voor die foto dan is dat kennelijk de schade. In veel gevallen is dat zeer zeker niet zo, ik kan het aantal claimbrieven niet meer bijhouden waarin men normaal voor minder dan honderd euro foto’s verkoopt en nu 500+ vraagt. De beste reactie is dan ook nagaan wat dat normale tarief is, daar een vrijwillige opslag bij rekenen voor het ongemak en dat bedrag per direct en zonder discussie overmaken. Ga alsjeblieft niet met zo’n club in discussie, dat is als modderworstelen met een varkentje.

Menig vraagsteller zit met het punt dat er geen bewijs wordt overlegd. Verder dan duur briefpapier met in essentie “onze cliënt heeft de rechten en dus moet u betalen” komt men normaal niet. Dat is heel frustrerend want inderdaad kan dat betekenen dat iemand zit te liegen en dan 375 euro overgemaakt krijgt omdat zakelijk gezien dat de beste reactie is. Ik moet zeggen dat ik nog geen enkel geval heb gezien (en ik héb me een stapel claimbrieven gehad door de jaren heen) waarin zo’n club niet in haar recht stond, maar uitsluiten kan ik het niet.

Dus navragen, zeker als het niet eens genoemd wordt in de brief, is een logische reactie. Alleen: deze clubs zijn er niet op uit om in een gezond zakelijk gesprek tot een wederzijds acceptabel compromis te komen. Er is dus geen enkel scenario waarin zij zullen zeggen “ach verhip we hebben inderdaad geen akte van overdracht / vertegenwoordiging / procesvolmacht, sorry laat maar zitten die factuur”. De reactie die ik dan zie, is – zeker bij advocaten – niet meer dan een stellige “U mag erop vertrouwen dat wij gelijk hebben”, en dat wordt meestal gevolgd door “En tevens erkent u hiermee de inbreuk want als u een licentie had gehad, had u zelf geweten bij wie”. En omdat het kan gaat het tarief dan ook nog eens omhoog. Dit is dus waarom je niet in discussie moet gaan.

Kortom, ik snap de frustratie en zou ook graag een klap met een forel uitdelen aan zo’n zelfgenoegzame brieventyper, maar als je er zakelijk vanaf wilt dan blijf je bij de basisstrategie: zoek uit wat het normale tarief is, tel daar 25% bij op en maak dat bedrag over. Zonder discussie, zonder te vragen wat ze daarvan vinden en zonder vooraf tegeneisen te stellen (al is het maar dat je een factuur of bewijsje wil). En ga daarna een plan verzinnen waarmee je je oude foto’s vervangt en nieuwe foto’s legaal verkrijgt. Noem het een goed voornemen voor 2023.

Arnoud

Amazon mogelijk aansprakelijk voor nepproducten van verkopers

geralt / Pixabay

Amazon kan aansprakelijk zijn als anderen namaakproducten verkopen op zijn platform, las ik bij RTL Nieuws. Het Europese Hof van Justitie oordeelde namelijk op 22 december dat de alleswebwinkel zich niet kan beroepen op de juridische bescherming voor tussenpersonen. Amazon doet te weinig om duidelijk te maken wanneer ze zelf iets verkoopt en wanneer een partner dat doet. Daarmee kan Amazon zelf aangesproken worden op eventuele merkinbreuk of andere rechtenschendingen.

De zaak was aangebracht door schoenenmerk Louboutin, bekend van de rode zool. En ja, die is als merk gedeponeerd dus andere schoenen met rode zolen hebben een probleem. Desondanks duiken die vaak op bij grote webwinkels waar partners welkom zijn, want vaak opereer je onder de radar en kun je een leuke winst maken door zulke schoenen te verkopen. Vaak heeft het platform ook weinig contactinformatie, en bovendien is het platform zelf niet aansprakelijk zolang ze het aanbod maar weghalen zodra er een klacht komt.

Louboutin was het daar niet mee eens in het geval van Amazon, omdat die wel even iets meer doet dan een prikbord zijn voor andermans advertenties. Zij geven al het aanbod een uniforme vormgeving, plaatsen nadrukkelijk hun eigen logo bovenaan en vertonen productadvertenties op hun site (en elders, zoals in Google-advertenties) zonder duidelijk te melden dat die van partners zijn. Daardoor kun je makkelijk de indruk krijgen dat al het aanbod van Amazon zelf is, was dus het argument.

Het Hof van Justitie ziet daar wel wat in: als consumenten een link leggen tussen het geadverteerde en het platform, dan is eventuele merkinbreuk door dat geadverteerde toe te schrijven aan dat platform. “Buy now genuine replica Louboutin red sole shoes at Amazon.com” roepen in je advertentie en dan zeggen “ja nee kijk wij zijn alleen een neutraal platform dat geïnteresseerden bij elkaar brengt en wat volwassen mensen dan in een 1-op-1 contact afspreken daar staan wij buiten”, dat vind ik juridisch ook niet heel sterk.

Natuurlijk, bij ieder platform staat de naam er wel ergens bij. Maar waar het nu om gaat volgens het Hof is hoe makkelijk je kunt zien dat je bij verkoper ZoolenZo aan het kopen bent dan wel bij Amazon zelf:

51 However, the fact that the operator of an online sales website integrating an online marketplace uses a uniform method of presentation of the offers published on its website, simultaneously displaying its own advertisements and those of the sellers third party and displaying its own renowned distributor logo both on its website and on all of these advertisements, including those relating to products offered by third-party sellers, is likely to make such a clear distinction difficult and thus to give the normally informed and reasonably attentive user the impression that it is the said operator who markets, in his name and for his own account, also the products offered for sale by these third-party sellers.
Uit eigen ervaring weet ik dat je bij Amazon echt wel even moet kijken met wie je zaken doet. In veel gevallen zie je dat alleen met de kleine “Sold by” omschrijving rechts onder de “Add to cart”-knop, zoals hier:

Als je de hele pagina openklikt, dan is de branding van Amazon zelf een stuk aanweziger dan die van de daadwerkelijke verkoper, Hot Chocolate Design. Dus ik zie het argument wel dat mensen hier van de indruk kunnen krijgen dat ze met Amazon zaken doen. Wat de grote letters suggereren, kunnen de kleine lettertjes niet wegnemen.

In Nederland is het grote alleswarenhuis natuurlijk Bol.com. Die doen het toch iets duidelijker. Allereerst zie je in de zoekresultaten al de naam van de verkoper (direct boven de titel, weliswaar klein), daarna zie je net als bij Amazon “Verkoop door” en de bedrijfsnaam en als je dan gaat afrekenen dan wordt die naam nogmaals genoemd. Dat lijkt mij eerlijk gezegd genoeg om dit arrest te kunnen ontwijken.

Arnoud