Hoe aansprakelijk wordt OpenAI voor de zakelijke versie van ChatGPT?

OpenAI werkt aan een zakelijke, betaalde versie van zijn chatbot ChatGPT. Dat meldde Tweakers onlangs. Momenteel is de chatbot gratis maar niet voor bedrijfsdoeleinden inzetbaar (wat natuurlijk geen hond tegenhoudt om er zakelijk gebruik van te maken). Het onderscheid zal vooral zitten in beschikbaarheid, snelheid en meer berichten per minuut. Het riep wel vele vragen op, die in de comments mooi samengevat werden als “Hoe wordt er in de professionele variant rekening gehouden met data die proprietary is of waar, op zijn minst, een copyright op berust?”

Het GPT-3 taalmodel waar de chatbot mee werkt, is getraind op vele miljarden tekstvoorbeelden. Het doel is leren wat het meest logische volgende woord is – kort gezegd – op basis van een prompt en de reeds gegeven woorden. Dat is met genoeg voorbeelden prima mogelijk, zeker op het niveau van chats waarbij je een vraag moet beantwoorden. ChatGPT produceert dan ook verbluffend goede resultaten, hoewel er ook volkomen waanzinnige reacties tussen zitten die met de grootste overtuiging worden gebracht.

Die tekstvoorbeelden komen natuurlijk van internet, ‘gewoon’ met een crawler die heel internet downloadt en daar machine-leesbare chocola van maakt. De makers leggen uit dat ze meer dan een biljoen (Amerikaans trillion, 1012) woorden hebben verwerkt. Dat kan niet anders dan zonder toestemming, maar iedereen stelt dat dit onder fair use te rechtvaardigen is en weet bovendien dat het ontzettend moeilijk is aan te tonen dat specifiek iemands werk opgenomen is in de dataset, plus dat een rechtszaak om dít punt uit te vechten veel te duur is voor iedere individuele rechthebbende. Uitgesloten is het niet – zie de rechtszaak over CoPilot, waarbij software-eigenaren wel degelijk zagen hoe deze AI-tool herkenbare fragmenten uit hun werk reproduceerde als “AI-generated”.

In de VS zou er misschien nog een lichtpuntje zijn wanneer je aannemelijk kunt maken dat jouw werk is gebruikt, omdat je dan via de zogeheten discovery procedure inzage kunt krijgen in documentatie rondom de bronbestanden. Dan heb je in ieder geval het feitelijke bewijs dat jouw werk is gebruikt. Vervolgens zit je nog met het juridische punt of het inbreuk is om een AI te trainen op jouw data, of dat het pas inbreuk is als de AI jouw werk reproduceert (dat laatste lijkt me evident).

In het auteursrecht geldt nu eenmaal de regel dat het bronwerk herkenbaar terug moet komen in het beweerdelijk inbreukmakende werk. Als ik iemands artikel lees en me laat inspireren tot een hoofdstuk in een boek, dan schend ik geen auteursrechten, hooguit pleeg ik academisch plagiaat. Maar als ik het artikel min of meer naschrijf, dan komt het auteursrecht wel om de hoek kijken. De academische grap is dan ook: één bron gebruiken is plagiaat, honderd bronnen gebruiken is onderzoek. En laat AI nou dus heel duidelijk die laatste kant op gaan: als honderd bronnen gebruiken mag, dan zal varen op honderd miljoen bronnen toch zeker ook wel mogen.

Het nieuwe aan de discussie is vooral dat we nu een betaalde dienst krijgen met een SLA. Afnemers daarvan zullen meer garanties gaan eisen, waaronder dus met name een vrijwaring (indemnification) tegen claims van derden. Want als ik als rechthebbende lees dat er ergens een adviesbureau komt dat een juridische chatbot heeft, dan ga ik die natuurlijk aanklagen en niet OpenAI uit San Francisco. Want ik durf de stelling wel aan dat mijn blog ergens in die dataset zit. Dat bureau heeft dan een probleem, want die is zelfstandig aansprakelijk. Dus dan moeten ze OpenAI zo ver krijgen de verdediging te gaan voeren, en dan wordt het een groot verhaal waar best wat nuttige puntjes uit te slepen zijn.

Arnoud

Is het toegestaan iemands stem na te doen met een AI zoals Vall-E?

| AE 13776 | Intellectuele rechten, Privacy | 27 reacties

Een lezer vroeg me:

Recent presenteerde Microsoft een nieuw AI-model, genaamd Vall-E. Dit text-to-speechmodel kan gesproken zinnen in vrijwel ieder stemgeluid genereren na een sample van drie seconden gehoord te hebben. Het AI-model kan daarbij ook intonatie en emotie nabootsen. Is dat strafbaar, als ik het train op iemands stem en die dan van alles laat zeggen?
Er is geen stem-equivalent van het portretrecht, dat je een (soort van) algemene zeggenschap over je beeltenis geeft. De positie van de stem in het portretrecht is al lang onderwerp van discussie. Niet met AI, maar gewoon met stem-imitatoren (zoals Gert-Jan Dröge en koningin Beatrix overkwam). De rechtspraak is daar altijd hard in geweest: dat is géén portret, geen afbeelding van die persoon. Laatstelijk nog in 2020, toen een vrouw probeerde zich te verzetten tegen gebruik van een audiofragment van haar stem.

Dat vonnis maakte wél duidelijk dat een stemgeluid een biometrische persoonsgegeven kan zijn onder de AVG. De definitie (artikel 4 lid 4 AVG) noemt als voorbeelden wel “gezichtsafbeeldingen of vingerafdrukgegevens” maar ik zie geen bezwaar tegen een herkenbare uitspraak van iemand op een lijn te zetten met een portretfoto of vingerafdruk. De Franse toezichthouder ziet dit ook zo.

Natuurlijk moet het stemgeluid wel herleidbaar zijn, de persoon er achter moet te identificeren zijn. Dat is bij een willekeurig stukje geluid opgenomen in een winkelstraat erg lastig. Maar bij zo’n online geluid dat uit een AI komt is dit een stuk makkelijker – de publicist van het geluid zet erbij wiens stem het is. Ja oké, hij liegt, maar een leugenachtig informatie-element over een persoon is net zo goed een persoonsgegeven.

Een onjuist (want leugens bevattend) persoonsgegeven zou te corrigeren of te verwijderen moeten zijn, wat je dus zeggenschap zou geven over zo’n stemopname. Die vrouw uit 2020 had echter pech, omdat bij haar de opname gebruikt werd in een theaterprogramma, en dat is een verwerking voor artistieke doeleinden. Die zijn net als journalistieke verwerkingen niet vatbaar voor het recht van correctie of verwijdering.

Het is goed mogelijk dat zo’n AI-stem ook daarvoor wordt gebruikt: laat Mark Rutte wat geks zeggen (u mag zich oud voelen: Tuut tuut tuut, de groeten van …?) of leg Max Schrems wat positiefs over Privacy Shield in de mond en noem het parodie. Als de stem wordt gebruikt om iemand voor gek te zetten zonder enige literaire of artistieke rechtvaardiging, dan is dat wél met de AVG aan te pakken.

Strafbaar is het niet, iemands stem imiteren. Daar kom je pas als je met die imitatie (al dan niet met AI) een strafbaar feit construeert, zoals die persoon zijn reputatie beschadigen of valse bekentenis afleggen (smaad) of de uitspraak gebruiken om fraude te plegen (de directeur imiteren die een frauduleuze betaalopdracht geeft).

Arnoud

 

Moet een auteursrechtspeurhond bewijzen dat ze de rechten hebben?

| AE 13770 | Intellectuele rechten | 40 reacties

Een lezer vroeg me:

Recent kreeg ik een sommatiebrief van een voor mij onbekende club, die zegt dat ze de auteursrechten hebben op een foto die op mijn site staat. Of ik even 1750 euro wil betalen. Maar ik wil op zijn minst eerst weten of zij wel echt die rechten hebben, iedereen kan wel van alles beweren natuurlijk. Sta ik in mijn recht als ik weiger te betalen tot ik overtuigend bewijs heb gezien?
Het komt nog steeds vaak voor dat mensen foto’s van internet plukken zonder te controleren of de licentierechten wel in orde zijn. Het belangrijkste advies blijft dan ook: haal je foto’s van een legitieme fotosite of maak afspraken met de fotograaf. Er zijn echt héél veel fotografen die mooi werk publiceren en (na vragen) het niet erg vinden als je dat als illustratie gebruikt. En ook voor stockbeeld zijn er genoeg zeer betaalbare en zelfs gratis sites.

Maar goed, daar heb je natuurlijk weinig aan op het moment dat er zo’n claimclub in de mail zit. Er zijn er een hoop; beruchte organisaties zijn het Duitse Copytrack en het Nederlandse advocatenkantoor MillerReyBrighton maar er zijn er veel meer. De werkwijze is vaak min of meer dezelfde: men heeft de foto gevonden met een gespecialiseerde zoektool (omgekeerd zoeken, het kan ook via Google Images) en omdat de naam van de site-eigenaar niet in de licentiedatabank staat, volgt er een rekening voor ongelicentieerd gebruik.

In de basis is het natuurlijk simpel: afgezien van citaatrecht en nog een paar dingen mag je andermans foto’s niet gebruiken zonder toestemming. De daardoor ontstane schade moet je vergoeden, en “ik wist het niet” of “ik heb geen kans gekregen de foto snel weg te halen” is géén argument. Je bent per direct aansprakelijk voor auteursrechtinbreuk, en daar zijn geen excuses voor. De discussie gaat dan ook altijd over de hoogte van de vergoeding, want veel van die claimclubs schrijven met een hark: op een of andere prijslijst staat 750 euro voor “gebruik zonder licentie”, er ontbreekt naamsvermelding dus huppa nog eens 750 erbij, er is een hoekje afgeknipt dus verminking bám nog eens 750 en vier uur opsporingskosten à 195 euro maar we maken het af op 1750 euro als u dat binnen 48 uur overmaakt.

Of je dat moet betalen, is natuurlijk zeer de vraag. De rechter zal kijken naar het normale tarief van deze fotograaf (gemiddelde bedragen uit de branche boeien niet, dus kom niet aan met dat je bij iStock voor een tientje “ook zoiets” koopt). Als die normaal inderdaad 750 euro krijgt voor die foto dan is dat kennelijk de schade. In veel gevallen is dat zeer zeker niet zo, ik kan het aantal claimbrieven niet meer bijhouden waarin men normaal voor minder dan honderd euro foto’s verkoopt en nu 500+ vraagt. De beste reactie is dan ook nagaan wat dat normale tarief is, daar een vrijwillige opslag bij rekenen voor het ongemak en dat bedrag per direct en zonder discussie overmaken. Ga alsjeblieft niet met zo’n club in discussie, dat is als modderworstelen met een varkentje.

Menig vraagsteller zit met het punt dat er geen bewijs wordt overlegd. Verder dan duur briefpapier met in essentie “onze cliënt heeft de rechten en dus moet u betalen” komt men normaal niet. Dat is heel frustrerend want inderdaad kan dat betekenen dat iemand zit te liegen en dan 375 euro overgemaakt krijgt omdat zakelijk gezien dat de beste reactie is. Ik moet zeggen dat ik nog geen enkel geval heb gezien (en ik héb me een stapel claimbrieven gehad door de jaren heen) waarin zo’n club niet in haar recht stond, maar uitsluiten kan ik het niet.

Dus navragen, zeker als het niet eens genoemd wordt in de brief, is een logische reactie. Alleen: deze clubs zijn er niet op uit om in een gezond zakelijk gesprek tot een wederzijds acceptabel compromis te komen. Er is dus geen enkel scenario waarin zij zullen zeggen “ach verhip we hebben inderdaad geen akte van overdracht / vertegenwoordiging / procesvolmacht, sorry laat maar zitten die factuur”. De reactie die ik dan zie, is – zeker bij advocaten – niet meer dan een stellige “U mag erop vertrouwen dat wij gelijk hebben”, en dat wordt meestal gevolgd door “En tevens erkent u hiermee de inbreuk want als u een licentie had gehad, had u zelf geweten bij wie”. En omdat het kan gaat het tarief dan ook nog eens omhoog. Dit is dus waarom je niet in discussie moet gaan.

Kortom, ik snap de frustratie en zou ook graag een klap met een forel uitdelen aan zo’n zelfgenoegzame brieventyper, maar als je er zakelijk vanaf wilt dan blijf je bij de basisstrategie: zoek uit wat het normale tarief is, tel daar 25% bij op en maak dat bedrag over. Zonder discussie, zonder te vragen wat ze daarvan vinden en zonder vooraf tegeneisen te stellen (al is het maar dat je een factuur of bewijsje wil). En ga daarna een plan verzinnen waarmee je je oude foto’s vervangt en nieuwe foto’s legaal verkrijgt. Noem het een goed voornemen voor 2023.

Arnoud

Amazon mogelijk aansprakelijk voor nepproducten van verkopers

| AE 13766 | Intellectuele rechten, Ondernemingsvrijheid | 19 reacties

Amazon kan aansprakelijk zijn als anderen namaakproducten verkopen op zijn platform, las ik bij RTL Nieuws. Het Europese Hof van Justitie oordeelde namelijk op 22 december dat de alleswebwinkel zich niet kan beroepen op de juridische bescherming voor tussenpersonen. Amazon doet te weinig om duidelijk te maken wanneer ze zelf iets verkoopt en wanneer een… Lees verder

Geldt een OSS licentie ook voor de data in de repository?

| AE 13696 | Intellectuele rechten, Uitingsvrijheid | 5 reacties

Een lezer tipte me over een interessante discussie bij het ChirpStack project. Een project waar men gebruik van maakte, The Things Network’s Device Repository, bleek niet meer importeerbaar, waarbij men zich beriep op databankrechten voor die data en tevens aangaf dat de opensourcelicentie op hun software niet zou gelden voor deze data. Toevallig was de licentie… Lees verder

Microsoft en Github aangeklaagd voor opensourceschending door AI tool

| AE 13669 | Informatiemaatschappij, Intellectuele rechten | 17 reacties

Programmeur en jurist Matthew Butterick heeft Microsoft en Github aangeklaagd vanwege schendingen van opensourcelicenties, las ik bij Bleeping Computer. De reden is Github’s tool Copilot, een AI code generator die getraind is op de bergen software die op Github gehost worden. De generator blijkt regelmatig lappen tekst uit bestaande werken 1-op-1 aan te leveren, zonder daarbij… Lees verder

Mag je in een game een bekend hotel aan gort schieten?

| AE 13652 | Intellectuele rechten, Ondernemingsvrijheid | 24 reacties

Oh noes, in de vorige week verschenen game Call of Duty: Modern Warfare II wordt het Conservatorium Hotel in de hoofdstad zonder enig overleg aan gort geschoten. Dat meldde de Volkskrant onlangs. “De game reflecteert op geen enkele manier onze kernwaarden en wij betreuren dan ook onze kennelijke en ongewenste betrokkenheid”, aldus de hotelmanager die zich… Lees verder

Brein verliest hoger beroep om Ziggo waarschuwingsbrieven te laten versturen

| AE 13611 | Intellectuele rechten, Ondernemingsvrijheid | 13 reacties

Ziggo hoeft waarschuwingsbrieven van stichting Brein niet door te sturen naar klanten, zo meldde Security.nl onlangs. Volgens het gerechtshof Arnhem-Leeuwarden is er er geen juridische grondslag die Ziggo verplicht hieraan mee te werken. Dit bekrachtigt een vonnis uit februari waarin de rechtbank ook bepaalde dat de provider geen torrent-waarschuwingsbrieven van Brein hoeft te sturen naar frequente torrentgebruikers. Zoals… Lees verder

De strijd tegen illegale torrents, hoe zet je daar een boete op?

| AE 13602 | Intellectuele rechten | 24 reacties

Krijgen we Duitse praktijken in Nederland? Die vraag stelde Tweakers in een recent Plus-artikel. In Duitsland is het gebruikelijk dat torrentgebruikers een claimbrief van een advocatenkantoor op de mat krijgen met daarin een beschuldiging en een schikkingsvoorstel. En je wordt ook echt gedaagd, dus betalen zul je. In Nederland is handhaving altijd tegen de grote jongens… Lees verder

Wacht even, open source is dus niet voor eeuwig gelicentieerd?

| AE 13590 | Intellectuele rechten, Ondernemingsvrijheid | 6 reacties

In vervolg op mijn blog van maandag over open source bij de overheid kreeg ik vele vragen over het waarom. De TK als opdrachtgever wilde immers eigenaar van alle software worden, zodat ze kon voorkomen dat een licentie zou vervallen en de leverancier dan lekker binnen kon lopen met een nieuw contract. Hoe kan dat, aldus… Lees verder