Mag je het nieuws herschrijven met AI?

Er duiken steeds meer nieuwssites op die kunstmatige intelligentie (AI) gebruiken om razendsnel artikelen van gerenommeerde media te hergebruiken. Dat meldde Nu.nl een tijdje terug (sorry). De kern is dat je die artikelen dan in ChatGPT duwt met de instructie “herschrijf dit”, waarna het resultaat automatisch online gaat. Mag dat?

De Amerikaanse nieuwswaakhond NewsGuard heeft 37 van die sites aangetroffen, wat vrij eenvoudig was omdat men soms fouten maakte in de prompt en dan de standaardtekst “Als AI-taalmodel kan ik niet …” liet staan. Dus het betrappen dat iemand dit doet, dat lukt nog wel.

Het Nu.nl-artikel heeft het dan over ‘plagiaat’, maar dat is geen juridische term. Plagiëren kan ook gaan over het  (zonder naamsvermelding) overnemen van iemands idee, ontdekking of werkwijze, zaken die juridisch prima mogen maar waar men met name in de wetenschap ernstig gefronste wenkbrauwen van krijgt.

De juridische term is gewoon “auteursrechtinbreuk”, en dat is nog geen uitgemaakte zaak. Auteursrecht krijg je namelijk op jouw uitwerking van een idee of jouw vertelling van een serie feiten. En specifiek bij nieuws kan dat vrij dun zijn: je kunt het op heel veel manieren vertellen, maar als het neerkomt op “er staat een file op de A12” dan is dat feit vrij voor iedereen om in eigen woorden door te vertellen.

Het meekijken met andermans nieuws en dat in eigen woorden doorvertellen is al zo oud als het nieuws, volgens mij. Het was alleen altijd vrij veel werk, omdat je echt wel je best moet doen als mens om een artikel echt opnieuw te schrijven. Dat laatste is nu een kwestie van iets aan ChatGPT vragen (bron, klik voor groot):

Met een paar API-koppelingen kun je dit volledig automatiseren, zodat je bij ieder nieuwsbericht op een bronsite vrijwel direct een herschreven kopie op je eigen site krijg.

Auteursrechtelijk is dit volgens mij aan de goede kant van de streep, omdat de zinnen duidelijk afstand houden van het origineel. Ze bevatten dezelfde feiten, maar dat is dus geen probleem, de opbouw is anders en er worden geen zinsconstructies letterlijk herhaald. Ik zie niet hoe dat auteursrechtinbreuk zou zijn.

Natuurlijk, het voelt onrechtvaardig, maar dat is omdat het hiermee zó makkelijk is geworden om mee te rijden op andermans werk zonder dat daar een juridisch eenvoudig trucje (een DSA copyright takedown) tegen is. Maar dat is echt een heel andere discussie.

Arnoud

 

17 reacties

  1. Laat ik even een commentaar dat ik op een andere website gelezen heb vertalen en parafraseren:

    Journalisten zullen altijd blijven bestaan, grote taalmodellen (AIs) kunnen niet zelfstandig informatie verzamelen.
    In Nederland kun je vanuit een ANP-feed een nieuwssite opzetten, maar de media die ook eigen artikelen produceren krijgen van mij meer respect.

    1. Je kunt ook als lezer de ANP feed gebruiken om alle als nieuws vermomde opinie stukken de vermijden en puur naar de gerapporteerde feiten te kijken.

      Waarom zou je in vredesnaam een AI samenvatting van een ANP of Reuters feed willen lezen als je het orgineel hebt?

      1. Ik heb bookmarks naar een handjevol (in mijn ogen) goede nieuwssites, om naast het ANP en Reuter nieuws ook op de hoogte te blijven van andere zaken. Het gaat mij om de nieuwe inzichten die (onderzoeks-) journalisten kunnen brengen.

  2. Maar het hoeft niet onrechtvaardig te voelen. Want juist hiervoor hadden we de Persexceptie bedacht, … tot die werd uitgekleed. Het gevoel van plagiaat kun je makkelijk omzeilen door een simpele bronvermelding: “Vermeld inline in het nieuwe bericht dat het van nu.nl afkomt.”

  3. Auteursrechtelijk is dit volgens mij aan de goede kant van de streep, omdat de zinnen duidelijk afstand houden van het origineel.

    Maar als ik jouw woorden een-op-een als prompt gebruik, dan is het resultaat daarvan toch zonder discussie een afgeleid werk van jouw woorden? De link tussen de gegenereerde tekst en de invoer is niet altijd direct duidelijk als de zinnen voldoende afstand houden, wat qua bewijsvoering een uitdaging kan zijn, maar het gebruiken van jouw werk als invoer van mijn werk lijkt me zo’n beetje de definitie van een afgeleid werk.

    1. Lijkt mij niet. Je kan dit ook in twee stappen doen. 1. vraag om een zo bondig mogelijke opsomming van de feiten uit het artikel. 2. vraag om die feiten weer in lopende tekst om te zetten.

      Een herschrijvende mens doet precies hetzelfde, en dat was nooit een probleem met het auteursrecht.

  4. Hoe weet je dat er überhaupt auteursrecht op dat eerste bericht rust: dat kan net zo goed uit een AI gekomen zijn, en dus hoogstwaarschijnlijk vrij van auteursrechten. Hetzelfde geldt voor de output van de AI die je hier laat zien… (artikel van Arnoud op tweakers hierover: https://tweakers.net/reviews/11382/zit-er-auteursrecht-op-een-ai-creatie-het-antwoord-van-ict-jurist-engelfriet.html)

    Het claimen van auteursrechten op werken waar dat niet op zit, zie ik zelf als het misleidden van consumenten, en is naar mijn mening iets waar men tegen moet optreden (dus op die manier ben ik voor een vorm van verplichting om te melden dat een werk uit een AI komt).

    1. Het lijkt me dat een herschreven boek ofwel hetzelfde narratief moet volgen (in geval van fictie) of dezelfde feitenselectie uit een breder geheel zal weergeven (in geval van non-fictie). Dat narratief en/of die specifieke selectie is onderdeel van het auteursrecht van de schrijver van het orgineel, en een inbreuk zal dan redelijk goed aan te tonen zijn.

      Wanneer het gaat om (korte) nieuwsberichten over feitelijke omstandigheden, is er weinig tot geen creatieve inbreng van de schrijver aangaande de inhoud. Het feitelijke relaas over de aanrijding, het aantal slachtoffers, en de daaropvolgende file maakt dan geen deel uit van een auteursrecht, en dus is een voldoende herschreven artikel dan ook geen inbreuk (of dat nu door een AI is gedaan of niet).

      Vraag aan Arnoud: wat als een dergelijke AI-site nu exact dezelfde, maar volledig herschreven, nieuws-artikelen plaatst als mijn kwalitatieve handgeschreven journalistieke site? Valt er dan een zaak te beginnen op basis van de collectie van artikelen (die overduidelijk afgekeken zijn van mijn website), ook al maken de individuele artikelen afzonderlijk geen auteursrechtinbreuk?

  5. Auteursrechtelijk ben ik het met Arnoud eens.

    Wat ik wel kwalijk vind is dat de AI feitelijke elementen erbij verzint:

    Bijvoorbeeld:

    1) De AI schrijft ‘diverse hulpdiensten, waaronder…’ terwijl het origineel zegt dat ‘onder meer ambulances en brandweerwagens..’: Het origineel stelt dus wel dat er meer hulpverleners waren dan alleen ambulance en brandweer, maar niet dat dit hulpDIENSTEN waren (misschien waren het wel omstanders)’

    2) De AI schrijft dat tegen 11.30 de weg weer vrij was. Het origineel schrijft dat het ongeluk om 10.30 was en dat na een uur de weg weer vrij was. Dus 11.30, denkt de AI. Echter, het genoemde ‘uur’ in het origineel is niet per se een uur na het ongeluk, maar vermoedelijk een uur na aankomst van de hulpdiensten. (En ook is 10.30 + ‘een uur’ niet 11.30. ‘Een uur’ is in algemeen taalgebruik niet gelijk aan precies 60 minuten.

    3) De AI schrijft dat de DRIE rijkstroken werden afgesloten door het ongeluk. Dat staat niet in het origineel. Er staat alleen dat er drie rijstroken waren afgesloten. Dat kan ook best zijn om plaats te bieden aan de hulpdiensten, dus niet door het ongeluk.

    4) De AI schrijft dat de drie rijkstroken werden afgesloten DOOR het ongeluk. Rijstroken afsluiten is een menselijke beslissing/handeling. Een ongeluk kan wel rijstroken blokkeren, maar niet afsluiten. De politie of Rijkswaterstaat kan rijstroken afsluiten.

    5) De AI schrijft dat er een vertraging van ruim een uur was. Dit is echter niet wat het origineel zegt: een file van een uur (met een onbekende vertraging, maar bijna zeker minder dan een uur omdat de weg wrsch niet volledig was afgesloten en ook niet iedereen de pech had precies op het verkeerde moment aan te komen en de maximale ellende te ondervinden). De vertraging is gewoon verzonnen door de AI.

    6) De AU schrijft: ‘onstond er een vertraging …. met een maximale filelengte van 7 km’. Dat is koeterwaals: een vertraging is een tijdsperiode, en een filelengte is een afstand. Je kunt niet een afstand toewijzen aan een vertraging, wat de AI wel doet.

    7) De AI schrijft dat de hulpdiensten SNEL ter plaatse waren. Dat is een element dat op geen enkele manier in het origineel staat.

    En zo zijn er nog wel enkele dingen te vinden.

    Het AI bericht (ocharme, maar liefst vier zinnen!) staat vol met verzinsels, onlogische beweringen en taalfouten.

    Daar maak ik me meer zorgen om dan om een auteursrechteninbreuk.

  6. Ik vind het leuk dat je weer over ChatGPT begint en daarmee indirect OpenAI, maar ondertussen gebruik ik zelf ook nog Google Bard, die vergelijkbare functionaliteit heeft maar meer uptodate gegevens gebruikt. Dit merk ik vooral als ik de AI vraag om C# code te genereren voor .NET 7 en hoger. ChatGPT is nog iets te oud, maar Bard doet dat prima. Ik merk ook dat Bard soms betere antwoorden geeft dan ChatGPT en Bard heeft ook een API die ik kan gebruiken. Even Google.Apis.NaturalLanguage.v1 gebruiken in mijn C# code en POEF, een andere AI die andere meldingen zal geven. En er zullen vast meer van dit soort AI oplossingen komen waar we gebruik van kunnen maken…

  7. Is de handeling van het toevoegen van de letterlijke tekst aan de AI geen auteursrechterlijke relevante handeling? Ik zou denken dat het gewoon een vorm van verveelvoudiging is; zelfde als ik de (vermeend) beschermde tekst aan iemand mail ofzo. En met het scrapen daaraan voorafgaand wordt gok ik ook al een kopie gemaakt door jezelf/tool.

Geef een reactie

Handige HTML: <a href=""> voor hyperlinks, <blockquote> om te citeren, <UL>/<OL> voor lijsten, en <em> en <strong> voor italics en vet.