Een lezer vroeg me:
In een eerdere blog post van jou las ik dat je de AI-schrijfassistent Lex gebruikt. Nu vroeg ik mij af: wie is eigenlijk de auteur en eigenaar van een tekst die door een AI geschreven is? Mag ik claimen dat het mijn tekst is, of moet ik de AI een naamsvermelding geven? En hoe moet ik omgaan met eventuele plagiaat door de AI?Het is onder juristen bepaald geen uitgemaakte zaak waar de auteursrechten liggen op werk gemaakt door een AI systeem. De hoofdregel van de wet is dat de feitelijk maker de rechten heeft, maar een maker (een mens dus) kan prima tools gebruiken om het werk te maken. We zeggen ook niet dat mijn digitale camera auteursrecht heeft op mijn foto’s, ondanks dat die 99% van het werk doet om er wat moois van te maken.
Ook speelt de vraag wíe de creativiteit inbrengt, wie de maker is. Is dat de persoon die de ‘prompt’, de vraag indiende bij de AI, of is dat de persoon die ervoor zorgde dat je met een prompt een mooie creatieve reactie kreeg?
We weten het echt niet. En vanuit die conclusie ben ik dan ook zeer geneigd te zeggen, vermeld gerust jezelf als de auteur want die AI gaat er echt niet over klagen. Misschien vind je het niet netjes naar je lezers, en dat is dan een afweging om het wél erbij te noemen, maar juridisch is er geen steekhoudend argument om het wel of niet te doen.
En wat betreft aansprakelijkheid: daar hang je zelf voor. Al heel lang geldt de regel bij het auteursrecht dat wie zo’n recht schendt, daarvoor aansprakelijk is. Dat de schending komt door een partner of leverancier is heel vervelend voor jou maar geen excuus om aansprakelijkheid af te wijzen. Je moet gewoon betalen en maar hopen dat die partner jou het gaat vergoeden. In zakelijke verhoudingen maak je daar afspraken over (jij vergoedt mijn schade als ik aangesproken wordt, beste leverancier) maar specifiek bij zo’n gratis AI dienst gaat niemand je dat geven natuurlijk.
Arnoud
Kan de maker dan ook een systeem zijn of wordt geacht dat een mens te zijn? Verder is het zo dat een AI eigenlijk stukjes kopieert van andere bronnen en daar dus misschien nog wel auteursrecht schendt, maar waarschijnlijk is dat zo versnipperd dat dat eerder kan worden gezien als inspiratie opdoen.
Maar stel, Getty Images krijgt tegen de verwachtingen in toch gelijk van de rechter (jouw eerdere post hierover). Dan kan Getty dus allerlei individuele gebruikers aan gaan klagen (zeker als er een schijn van ‘gebruik’ van hun afbeeldingen is). Oftewel; niemand zou iets van AI moeten publiceren, totdat dit traject volledig doorlopen is? Dat gaat nog vele jaren duren.
Daar heb je gelijk in, dat is zeker een zorg die nog jaren in de markt zal hangen.
Het blijft den ik lastig. De AI bot gebruikt op internet gepubliceerde teksten en reproduceert deze, als ze passen bij je vraag. Je weet dus niet of de AI bot plagiaat pleegt en wanneer jij die tekst 1:1 overneemt jij dus ook plagiaat pleegt. Nou zijn daar al verschillende tools voor om dat te controleren maar bij programmeertalen wordt het al lastiger. Je moet er, in mijn ogen, altijd vanuit gaan dat een AI bot werk van een ander gebruikt. Je zou de uitgespuugde tekst dan ook in eigen woorden moeten herschrijven om plagiaat claims te vermijden.
Het complexe is vooral dat een AI niet letterlijk reproduceert, het is niet drie zinnen uit bron A en dan vijf uit bron B. Het is een statistisch proces, welk woord volgt meestal op dat woord gegeven deze context. Dus het plagiaat is niet heel evident, en daarmee kun je ook lastig je wapenen tegen erin geslopen plagiaat.
Je zou met een behoorlijke plagiaat-analyse kunnen beginnen als je weet welke bronnen de grootste invloed op de door de AI gegenereerde tekst hebben gehad. Dit moet technisch mogelijk zijn, maar maakt het algoritme wel duurder in gebruik.
Op scholen, mijn vrouw geeft Nederlands, wordt al langer met tooling gewerkt om plagiaat te herkennen. In haar geval worden er dus door ChatGPT gegenereerde samenvattingen van boeken ingeleverd. De plagiaat scanner vist die er zo uit. En ja, leerlingen proberen dat nog steeds. Op een vraag als “Hoe kan ik het beste een trappenhuis schilderen?” zal AI wel een redelijk zelf samengesteld antwoord geven maar zodra je specifieke vragen stelt als: “Maak een script in Python dat..” zal het meestal met een kant en klare oplossing komen van Github (of zo) waarvan je niet weet onder welke licentie het is geplaatst. Je kunt, in geval van ChatGPT, ook vragen om een bronvermelding, ik heb nooit gecontroleerd of die klopt.
Best wel leuk als je van diverse services gebruik maakt als ontwikkelaar en daarbij diensten van derden gebruikt. Zo heb ik enkele maanden geleden Foxboom Weather gemaakt als een experimentje met ChatGPT. Dit bestaat uit twee delen, te weten een website en een CRON-job die iedere dag eerst een weerrapport ophaalt bij OpenWeatherMap. Deze data haal ik vervolgens door OpenAI om deze naar tekst te vertalen. En ten slotte gebruik ik de Google Speech Engine om er gesproken tekst van te maken alsof er een nieuwslezeres het weerbericht uitspreekt. Ik wilde ook nog via rendering een animatie maken van een dame die alles uitspreekt, maar het renderen daarvan duurt te lang, dus dan maar niet…
Alleen is nu de vraag of ik moet melden dat ik van deze drie partijen gebruik maak. Het zijn allen betaalde diensten en ik vind er niets van terug in de licenties die ik heb, hoewel ik deze niet volledig heb uitgezocht. Vanuit mijn oogpunt ben ik gewoon de auteur van dit alles, ook al worden de teksten automatisch gegenereerd. Ik heb immers de artistieke keuze gemaakt om deze data in deze vorm te presenteren. (Nou ja, ik onder een alias, maar je weet vast wel wie ik ben.)
Maar wat ook interessant is: ik gebruik weer-data voor deze toepassing. Dat is een blokje data die door OpenWeatherMap is gegenereerd maar eigenlijk feiten zijn en niet perse artistiek. Heeft deze data wel auteursrechten? Want als deze data niet auteursrechtelijk beschermd is, waarom zou data uit AI dat dan wel zijn?
Dat zou kunnen betekenen dat de tekst op mijn website dus niet beschermd is, ook al is deze via AI en andere data gebouwd…
Het complexe is vooral dat een AI niet letterlijk reproduceert, het is niet drie zinnen uit bron A en dan vijf uit bron B. Het is een statistisch proces, welk woord volgt meestal op dat woord gegeven deze context. Dus het plagiaat is niet heel evident, en daarmee kun je ook lastig je wapenen tegen erin geslopen plagiaat.