Herman van Veen slaat alarm om diefstal eigen stem, Tweede Kamer wil ingrijpen bij AI-app Udio

Photo by Andy Makely on Unsplash

Een meerderheid van de Tweede Kamer wil actie ondernemen tegen de grootschalige ‘diefstal’ van stemmen en teksten van Nederlandse artiesten en tekstschrijvers door aanbieders van kunstmatige intelligentie. Dat meldde het AD onlangs. Apps zoals Udio kunnen middels AI liedjes maken met de stemmen van bekende artiesten, zoals Herman van Veen die zich hier erg kwaad over maakt.

Het artikel noemt twee juridische routes en stelt verder dat de Tweede Kamer iets kan doen om de positie van artiesten en tekstschrijvers kan verbeteren. Allereerst de Digital Services Act: deze regelt het verwijderen van illegale content (notice/action) en verplicht tot transparantie over de werking van algoritmen. Of Udio daaraan voldoet is de vraag, maar belangrijker: het is zeker niet gezegd dat een liedje “in de stijl van” of “klinkend zoals” onrechtmatig is en dus verwijderd zou moeten worden.

Dan komt ook de AI Act langs:

Het CDA wijst naar nog een andere wet: de Europese AI Act, een wet die vanaf 2025 eist dat creatieve makers eerst toestemming moeten geven. ,,De opkomst van Udio laat zien dat er geen tijd te verliezen is om die te vertalen naar concrete regels”, waarschuwt CDA-Kamerlid Herman Krul.
Ik denk dat hier sprake is van een misverstand, want de AI Act zegt alleen dat de producenten van algemene AI modellen (zoals LLaMa of GPT) iets met auteursrecht moeten en dan ook nog eens alleen in de vorm van een duidelijk beleid over hoe zij aan de wet voldoen. Toestemming vragen is zeer zeker niet genoemd in de AI Act.

Ook wie de Auteurswet erbij pakt, komt niet uit bij toestemming. Deze wet kent namelijk een uitzondering voor tekst- en datamining, die neerkomt op “je mag een AI trainen met auteursrechtelijk beschermde data”. De uitzondering daar weer op is als het auteursrecht op machinaal leesbare manier is voorbehouden – en dát kan alleen als er een standaard is over hoe je dat voorbehoud maakt. In een tekstbestand de letters op een rij zetten “Auteursrecht voorbehouden” is geen machinaal leesbaar voorbehoud. Dat is dus nog een probleem.

Meer algemeen is mij niet duidelijk wat de Tweede Kamer zou moeten doen aan dit probleem. Het auteursrecht is Europees geregeld, en onze wetgever kan en mag geen eigen regels aannemen die strenger zijn op dit punt. Ook collectief beheer (AI voor muziekuitvoer trainen mag mits Buma/Stemra geld krijgt) is niet mogelijk binnen het Europese stelsel.

De AI Act is ook een Europese wet, net als de DSA, en beiden bieden geen optie om aparte auteursrechtregels of toestemmingsvereisten in te voeren. De enige route die ik kan bedenken is dat de DSA-toezichthouder ACM via de open norm van een systemic risk assessment bij de app-aanbieders afdwingt dat deze anders met auteursrecht omgaan. Maar dat kan alleen als die apps VLOP zijn (zeer groot online platform), en volgens mij voldoen die bij lange na niet aan deze definitie.

Daar komt bij dat de ACM nog steeds niet formeel aangewezen is als toezichthouder onder de DSA. Dat is dan weer wél iets dat de Tweede Kamer snel zou kunnen regelen, overigens.

Arnoud

 

 

 

 

17 reacties

 1. Ik neem aan dat een stemacteur een concurrentiebeding voorgelegd krijgt. Als een bedrijf een grote reclamecampagne heeft opgezet en daardoor associeert men die stem met hun bedrijf, dan wilt dat bedrijf niet dat de stemacteur de volgende dag reclame voor de concurrent gaat maken, welke daarmee meelift op de associatie van de stem met (de kwaliteit van) het eerste bedrijf.

  Het zou me dus niet onredelijk lijken als de stem dus als “beschermd” wordt beschouwd (totdat deze X tijd niet meer gebruikt is). Een soort van merkrecht.

  Vervolgens zou het erg onredelijk zijn als de stemacteur geen reclame mag inspreken voor bedrijf 2, maar dat bedrijf 2 wel een AI mag gebruiken om de stem na te bootsen. Dan lift bedrijf 2 nog steeds mee op de bekendheid van bedrijf 1.

  Hetzelfde geldt voor zangers. Een ander persoon kan meeliften op de bekendheid van de zanger.

  De enige reden die ik nu zie waarin een AI nabootsing van een stem terecht is (excl toestemming), is voor parodie. Dat is immers een legitiem gebruik van associatie met de bekendheid van een stem. Dit conflicteert niet met een stem onder merkrecht laten vallen.

  1. Ronald, als ik jou goed begrijp wil jij per wet regelen dat een concurrentiebeding dat tussen twee partijen gesloten wordt automatisch afdwingbaar wordt tegen derden. Dat lijkt me niet verstandig omdat die derde geen kennis heeft van hetgeen die twee partijen zijn overeengekomen.

   Er is al het een en ander aan jurisprudentie over portretrecht en ik kan me heel goed voorstellen dat misleidende stemimitaties aangepakt gaan worden. Een uitgebreid persoonlijkheidsrecht op stemmen creëren is teveel van het goede, iemand wiens stem toevallig op Lee Towers lijkt moet (onder eigen naam) gewoon op een podium kunnen blijven zingen.

  2. Stel je eens voor dat een aantal van de top stemacteurs (die soms honderden verschillende stemmen hebben) al hun stemmen laten beschermen. Bijna niemand kan dan meer praten zonder de wet te overtreden. Ook krijg je het probleem dat de dood of het stoppen van een stemacteur betekend dat de characters die ze vertolken ook niet meer gebruikt mogen worden.

 2. De fundamentelere vraag is of het bescherming waardig zou moeten zijn. Arnout zet het woord “diefstal” al terecht tussen aanhalingstekens. Het auteursrecht is bedacht zodat het produceren van specifieke werken loont en dat uiteindelijk ten goede komt aan de samenleving. Je stem is iets dat je gewoon hebt gekregen. Ik zou zo niet weten waarom er fundamenteel gezien een “recht” zou moeten bestaan om geld te verdienen aan je stem – ook al was het tot voor kort mogelijk.

  1. Helemaal eens. Dit is geen auteursrechtenmaterie.

   Je zou eventueel een ‘klankmerk’ kunnen overwegen, dan kunnen zangers/stemacteurs die veel werk gestoken hebben in de ontwikkeling en marketing van een specifieke stemgeluid op die manier bescherming kunnen krijgen.

   Uiteindelijk is het natuurlijk zo dat automatisering veel taken van de mens heeft overgenomen. Dat doet pijn bij de mensen die daardoor inkomsten mislopen, maar de samenleving als geheel vaart er wel bij.

   Blijkbaar zijn de stemacteurs en zangers de volgende. Ik heb daar geen bijzondere positieve of negatieve gevoelens bij.

   1. Het niet ongeautoriseerd gebruik van beeltenis, zoals adverteerders met Jort Kelder’s beeltenis of de Carltondans aan de haal gingen?

    Ik kloonde een complete jurist met AI en vroeg om opheldering:

    Het ongeautoriseerd gebruik van een beeltenis, zoals adverteerders deden met de beeltenis van Jort Kelder, kan problematisch zijn. Artikel 35 van de Auteurswet stelt dat het openbaar tentoonstellen van een portret zonder toestemming inbreuk maakt op het portretrecht.

    In de Groninger Zwembad Foto zaak (HR 21 januari 1994, NJ 1994, 473) claimde een man, die in het publiek in een zwembad was gefotografeerd, dat zijn portretrecht was geschonden. Uit deze zaak komt het herkenbaarheidscriterium van het portretrecht voort, evenals de belangenafweging tussen het commerciële belang, de privacyrechten van de geportretteerde en de vrijheid van expressie.

    De zaak verduidelijkte dat commercieel gebruik van iemands herkenbare gelijkenis zonder toestemming hun portretrechten schendt en dat dit een precedent schept voor het toepassen van portretrechten op herkenbare representaties van individuen, zelfs in niet-visuele vormen zoals stemmen.

    Het herkenbaarheidscriterium is relevant voor voice cloning en inbreuk op portretrecht. Als de geclonede stem de zanger herkenbaar maakt voor het publiek, kan dit worden beschouwd als een schending van portretrechten. Als luisteraars de zanger kunnen identificeren enkel door het horen van de geclonede stem, zou dit herkenbaarheid betekenen.

    Er moet verder een balans zijn tussen creatieve vrijheid en de commerciële belangen van een individu in hun herkenbare stem. De geclonede stem mag niet worden gebruikt op een manier die consumenten misleidt en hen doet geloven dat de zanger een product of dienst onderschrijft.

    Een stem kan ook worden beschermd onder naburige rechten. Naburige rechten bieden bescherming aan uitvoerende kunstenaars, producenten van fonogrammen, omroeporganisaties en uitgevers van werken, die vergelijkbaar maar verschillend zijn van het traditionele auteursrecht. Deze rechten worden beheerst door de Wet op de naburige rechten (WNR, 1993). Als een door AI gegenereerde stem de kenmerkende vocale eigenschappen van een artiest (bijv. toon, timbre, stijl) of uitvoeringen reproduceert of nauw nabootst, kan worden gesteld dat dit inbreuk maakt op hun naburige rechten.

    De zaak Midler v. Ford Motor Co. (1988) erkende het recht van een zanger om ongeoorloofde imitatie van haar kenmerkende stem voor commerciële doeleinden te voorkomen. Nederlandse naburige rechten kunnen op soortgelijke wijze worden uitgebreid om ongeoorloofde cloning of imitatie van kenmerkende vocale eigenschappen te beschermen.

    Onafhankelijk van het auteursrecht kan het ook een onrechtmatige daad zijn (6:162 BW) als publicatie van de geclonede stem de reputatie of inkomsten van een zanger schaadt.

    1. HR 21 januari 1994, NJ 1994, 473 is volgens mij Ferdi E. en niet een Groninger zwembad en betrof persvrijheid versus privacy bij personen die onvrijwillig in het nieuws komen. Die andere zaken over portretrecht geloof ik wel (hoewel Midler natuurlijk Amerikaans recht is) maar het is zeker geen uitgemaakte zaak dat een stem een vorm van portretrecht is, integendeel.

     In januari blogde ik hierover:

     Er is geen stem-equivalent van het portretrecht, dat je een (soort van) algemene zeggenschap over je beeltenis geeft. De positie van de stem in het portretrecht is al lang onderwerp van discussie. Niet met AI, maar gewoon met stem-imitatoren (zoals Gert-Jan Dröge en koningin Beatrix overkwam). De rechtspraak is daar altijd hard in geweest: dat is géén portret, geen afbeelding van die persoon. Laatstelijk nog in 2020, toen een vrouw probeerde zich te verzetten tegen gebruik van een audiofragment van haar stem.
     Ik zou zelf eerder via de AVG kijken hoe ver te komen. In die zaak uit 2020 werd het stemgeluid wel als persoonsgegeven aangemerkt, en dan wordt de discussie iets lastiger.

     1. Het was wel een zwembad, maar niet in Groningen, maar Hoogeveen, Drenthe. AI laat dit soort opvallende haakjes vallen, zodat ik niet klakkeloos mij als jurist kan voordoen, zonder alle feiten uitgebreid na te gaan en het aan legitieme expertise te toetsen.

      Ferdi E. was herkenbaar in de krant terechtgekomen, hoewel hij in het publiek was gefotografeerd. De zaak gaf het herkenbaarheidscriterium, dat schending van portretrecht mogelijk maakt als een herkenbare representatie wordt gebruikt (zelfs niet-visueel, zoals een unieke stem).

      Als een stem niet uitgemaakt een vorm van portrecht is, is het dan mogelijk een naburig recht? Een poppenspel of zangkunstenaars hebben naburig recht, en dat mag je niet zomaar nabootsen of kopieren, dus waarom wel de kenmerkende stem van Herman van Veen?

      Het moet en kan natuurlijk mogelijk blijven om AI te trainen op auteursrechtelijke werken om deze te laten zingen of spreken, maar dat hoeft niet per se in precies dezelfde en herkenbare stem van een specifieke zanger? Je kan best stemacteurs en zangers automatiseren, zonder iemand klakkeloos te kopieren?

      En persoonsgegeven vind ik ook een interessante insteek, hoewel een bekende zanger als Herman van Veen natuurlijk iets minder bescherming verdiend als een onbekende vrouw. Maar het zou best een biometrisch persoonsgegeven kunnen zijn als de geclonede stem identificerende kenmerken herleidbaar naar persoon bevatten.

     2. Uiteraard is het doel van het gebruik van de stem wel van belang. Dit kan fraude zijn, of misleidende reclame, of bijvoorbeeld zelfs laster. Bij een expliciet geregistreerd stem-merk zou het merkinbreuk kunnen zijn (bij gebruik als merk). Het gebruik in satirisch of kritiek is echter niet makkelijk een probleem.

      Overigens zie ik wel een argument voor een recht op het commercieel gebruik van eigen stemklank, en beperking van inbreuk daarop (met doelgerichte uitzonderingen).

     3. Ik ben het eens met de huidige rechtspraak omtrent portretrecht en stem-imitatoren (wat ook een vak/kunst is), hoewel ik het oneens ben dat deze benadering ook zou moeten gelden voor AI voice cloning.

      Illustratie: Een foto van een Michael Jackson-imitator die de moonwalk doet, is geen portret of afbeelding van Michael Jackson zelf, net zomin als een opname van een stem-imitatie een opname is van de stem van Gert-Jan Dröge zelf.

      Maar AI, in haar simpelste vorm, creëert een database van alle woorden die Gert-Jan Dröge heeft uitgesproken, en maakt daar dan nieuwe zinnen mee. Het is dus niet zozeer een imitatie, maar een simulatie/synthese: een mash-up/cut-and-paste van uitspraken en stemgeluid van die persoon.

      Je mag nog steeds “een AI trainen met auteursrechtelijk beschermde data,” oftewel een AI met alle auteursrechtelijk beschermde portretten van Michael Jackson, maar om vervolgens (bijvoorbeeld in Photoshop) een gemiddelde te nemen dat niet te onderscheiden is van de echte Michael Jackson, is voor mij een ander verhaal. Dat AI/computerbewerking resultaat mag dan geen “echt” portret van Michael Jackson zijn, maar naar mijn mening is het wel een schending van zijn portretrecht.

      Het blijft dan een belangenafweging. Een fanclub of komiek die AI voice cloned vs. MacDonalds of een cyberstalkende pestkop.

      1. Kortom: Gebruik AI gewoon om niet Michael Jackson, maar je nichtje op dat podium te plaatsen. En een krant heeft persvrijheid, maar maakt maar blurry publieksfotos, in plaats van om bij elke “het is weer 30 graden!” die duikende Ferdi E. in die te krappe speedo erbij te photoshoppen.

       1. Of als men zo verknocht is aan die ecrobatieke fratsen van Ferdi E., dan huurt men maar een Ferdi E.-imitator die dan wel vastlegt elke keer betaald te moeten voor gebruik van beeltenis. En als Ferdi E.-imitator dan ook een woordje Gert-Jan Dröge kan, dan train je de AI daar op, en heb je helemaal geen probleem met direct hergebruik: Een Michael Jackson van Michael Jackson-imitators. Niet te onderscheiden van de enige echte.

      2. En wat doe je bij stemmen dan als je de AI laat trainen op een paar uur geluid die je door een Gert-Jan Dröge imitator laat uitspreken. En als dat getrainede model wordt aangeboden, hoe gaat Gert-Jan Dröge aantonen dat de trainingsdata Gert-Jan Dröge en niet een immitator?

       1. Daarom moet je uiteindelijk wel naar naburig recht toe (ongeacht of het inbreuk portretrecht is). Het is natuurlijk absurd als een AI op Gert-Jan Dröge niet mag, maar een AI op de Gert-Jan Dröge-imitator wel. Dat mag dan wel geen portret van de echte Gert-Jan Dröge zijn, het is gemaakt om er zoveel mogelijk op te lijken.

        1. Als een imitator geen schending van het portretrecht is, dan kan trainen op die imitator ook geen schending van het portret rechts zijn.

         Maar ik zie ook niet waarom een AI getraind op de uitspraken van de persoon dat opeens zou veranderen. In beide gevallen is het niet de persoon zelf die de uitspraken doet en in tegenstelling wat sommigen beweren werkt een AI niet met opgeslagen kopieën. Een AI is niet anders dan een praktische toepassing van geavanceerde statistieken.

         Een mooi voorbeeld daarvan is dat de AI woorden uit zal kunnen spreken die die persoon nooit gezegd heeft. Zolang de AI de het woord maar kent door de algemene training.

 3. Ik denk dat een groot deel van de verwarring voortkomt uit het feit dat AI iets fundamenteel nieuws is.

  Definities van plagiaat en auteursrechtschendingen zijn bedoeld voor, en getoetst aan, “syntax” (letterlijk): Heb je meer dan zeven opeenvolgende woorden overgenomen zonder bronvermelding? Was de afbeelding klein genoeg om als miniatuur te gelden? Klinkt de specifieke melodie herkenbaar als afgeleid van een bestaande geregistreerde melodie?

  AI kan niet alleen syntax kopiëren (maar dit wordt tegengegaan om bestaande regels en wetgeving niet te overtreden), maar ook “semantiek” (betekenis, stijl): een blog schrijven die niet te onderscheiden is van een blog die Arnoud zou schrijven, een stememulatie (computerimitatie) die niet te onderscheiden is van Herman van Veen, alle melodieën van Neil Young nemen en daar iets nieuws mee maken.

  AI kan al zingen en componeren. Het kan al nieuwe teksten schrijven die, in zekere mate, het patroon van Arnoud’s toegankelijke en interessante blogstijl gebruiken. Willen we dit als maatschappij blijven belonen en compenseren? Dan moeten we iets ontwikkelen waarbij creatievelingen zoals Herman van Veen en Arnoud worden beloond of erkend.

  OpenAI is developing Media Manager [eta 2025], a tool that will enable creators and content owners to tell us what they own and specify how they want their works to be included or excluded from machine learning research and training. Over time, we plan to introduce additional choices and features. https://openai.com/index/approach-to-data-and-ai/

  En wees dankbaar voor de trainingsdata en het behoud van de waarde ervan. Als het allemaal waardeloos wordt, heeft AI geen trainingsdata meer. Misschien is het overnemen van een zin uit een wetenschappelijk artikel zonder bronvermelding vergelijkbaar met het overnemen van de stem en artistieke uitdrukking van Herman van Veen? Want God is een sneeuwvlok, jongen… welke AI schrijft dat nou?

  AI kan zo mooi zijn:

  Helping patients recover their voice, for those suffering from sudden or degenerative speech conditions. The Norman Prince Neurosciences Institute at Lifespan(opens in a new window), a not-for-profit health system that serves as the primary teaching affiliate of Brown University’s medical school, is exploring uses of AI in clinical contexts. https://openai.com/index/navigating-the-challenges-and-opportunities-of-synthetic-voices/

Geef een reactie

Handige HTML: <a href=""> voor hyperlinks, <blockquote> om te citeren, <UL>/<OL> voor lijsten, en <em> en <strong> voor italics en vet.