Geldt een OSS licentie ook voor de data in de repository?

Een lezer tipte me over een interessante discussie bij het ChirpStack project. Een project waar men gebruik van maakte, The Things Network’s Device Repository, bleek niet meer importeerbaar, waarbij men zich beriep op databankrechten voor die data en tevens aangaf dat de opensourcelicentie op hun software niet zou gelden voor deze data. Toevallig was de licentie ook net een uur eerder weggehaald, wat erg raar aandoet. Wat is hier aan de hand?

Die repository is deel van The Things Network, “a global collaborative Internet of Things ecosystem that creates networks, devices and solutions using LoRaWAN®.” Dat laatste is dan weer een netwerkarchitectuur, maar daar hoeft het verder niet over te gaan. De kern is dat TTN een device repository heeft, een databank met belangrijke technische informatie over apparaten die op dit IoT-ecosysteem aan te sluiten zijn. En omdat er fors wat inspanning is gaan zitten in die repository, en The Things Industries (dat daarachter zit) een Nederlands bedrijf is dat het financiële risico draagt voor al die inspanningen, kan zij daar een databankrecht op claimen.

ChirpStack biedt net als TTN een open-source LoRaWAN Network Server aan. Inlezen van die repository is dan erg handig, maar dat maakte TTN recent onmogelijk onder verwijzing naar twee argumenten. Allereerst zou haar databankrecht worden geschonden, en ten tweede ging het importeren uit van een technische structuur die binnenkort zou veranderen, dus het zou alleen maar onhandig zijn voor de toekomst om dit te laten staan.

De beheerder van ChirpStack snapte van dat eerste niets: hij haalde de informatie uit het project op Github dat TTN zelf actief heeft. Daar stond (tot voor kort) een Apache licentie boven, een simpele OSS licentie die alles toestaat zonder copyleft-eisen of andere ingewikkelde dingen. En dan kun je wel een databankrecht hebben, maar licentie is licentie. De reactie van TTN:

There is and was no open data license on the concerning repository. We spend a lot of time and resources on the content of that database. In this instance, GitHub is a great channel to receive contributions from the device maker community and to contribute ourselves, verify, review and validate. But a GitHub repository doesn’t provide a license to reuse and extract it in its entirety. Sure, if you want to copy paste a payload codec that you are missing from the Device Repository, that is fine.
Oftewel: die licentie geldt alleen voor de software, niet voor de data. Dat vind ik raar in het algemeen. Het gebruik is dat je op sites als Github één licentie kiest, die dan voor alles geldt. (Of in ieder geval in de directory en daaronder van de plek waar je die neerzet.) Uitzonderingen kunnen, maar die documenteer je dan in de LICENSE file. Dat is hier niet gebeurd. Vroeger was er wel kritiek dat OSS licenties te specifiek op software geschreven waren, maar bij de Apache 2.0 licentie kun je dat moeilijk volhouden. De definitie van ‘werk’ is keurig generiek:
“Work” shall mean the work of authorship, whether in Source or Object form, made available under the License, as indicated by a copyright notice that is included in or attached to the work (an example is provided in the Appendix below).
Hiermee is het dus volkomen logisch dat ook databestanden als ‘work’ kunnen worden aangemerkt, zodat de rechten en plichten uit de Apache licentie gewoon gelden voor afnemers van die databestanden. Althans, als de licentie daarop van toepassing is. Want tegenover wat ik hierboven schetst, staat dat men in de README (die iedereen ook geacht wordt te lezen) een beperkte verklaring had staan:
The API is distributed under Apache License, Version 2.0. See LICENSE for more information.
De bedoeling van deze software was namelijk dat je voor een gegeven stuk hardware de informatie opvraagt, met die aangeboden API. Wat ChirpStack deed, was dus niet helemaal hun bedoeling: zij maakten een kopie van alle data zodat je niet steeds via de API deze op hoefde te vragen. Die API is er alleen nooit van gekomen, het werd ‘gewoon’ software met alle data in die repository beschikbaar. Dat maakt de term “The API” onduidelijk, als die API er niet is wat bedoelde men dan wel?

Ik denk dat je dan toch uitkomt bij “alles op deze site”, omdat dat nu eenmaal de meest voor de hand liggende interpretatie is gezien het gebruik in de softwarewereld. Bijgevolg kan TTN dus het gebruik van de data niet verbieden mits dat binnen de regels van de Apache licentie gebeurt. Daar staat dan weer tegenover dat de Apache licentie heel expliciet alleen over “copyright” en “patent” toestemming spreekt, en dus niets over databankrechten. In die lezing heb je dus nog steeds niets.

Daartegen heb ik dan alleen nog het argument dat in die situatie de genoemde licentie vrijwel geen betekenis heeft, want er is verder niets van waarde onder die licentie te krijgen en dat is raar. Als je daarbij optelt dat die licentie door Amerikaanse juristen is geschreven (waar databankrecht niet bestaat) en dus best om die reden genegeerd kan zijn, dan kom ik bij de conclusie dat deze overname gewoon mag.

Arnoud

Microsoft en Github aangeklaagd voor opensourceschending door AI tool

Otto, the inflatable autopilot from the movie “Airplane.”

Programmeur en jurist Matthew Butterick heeft Microsoft en Github aangeklaagd vanwege schendingen van opensourcelicenties, las ik bij Bleeping Computer. De reden is Github’s tool Copilot, een AI code generator die getraind is op de bergen software die op Github gehost worden. De generator blijkt regelmatig lappen tekst uit bestaande werken 1-op-1 aan te leveren, zonder daarbij de juiste licentie + bron te noemen. Hoe zeiden ze dat ook weer, één bron jatten is plagiaat en duizend is inspiratie?

Vorig jaar bracht Github de dienst Copilot uit, een AI-gedreven pair programmer die ontwikkelaars helpt bij het schrijven van code. Copilot stelt contextgebonden code en functies voor, en helpt actief bij het oplossen van problemen door te leren van de code die iemand schrijft. “Trained on billions of lines of public code, GitHub Copilot puts the knowledge you need at your fingertips, saving you time and helping you stay focused.” Het idee is vrij simpel: soms heb je even een klein zetje nodig, een paar regels code om weer verder te kunnen – of om te beseffen, nee dit is precies niet hoe het moet. (Ik experimenteer zelf met Lex.page, die dit doet voor tekstschrijvers, als iemand een invite wil hoor ik het graag.)

Het probleem is natuurlijk: die suggesties moeten ergens vandaan komen. Dat is dus die inspiratie, die patronen die Copilot leert herkennen in honderdduizenden bestanden met source code. Net zoals Lex.page en vele andere tools dat doen met tekst, en DALL-E en consorten met afbeeldingen. Alleen: die hebben een bronbestand dat orde van groottes ruimer is. Alle teksten van heel internet versus alle geprogrammeerde software op Github, dat scheelt nogal een slok op een borrel. Daar komt bij dat er bij software nou eenmaal heel wat minder manieren zijn om iets aan te geven, het moet nou eenmaal technisch aansluiten op het voorgaande.

Het verbaast mij dan ook helemaal niets dat je bij Copilot veel vaker gewoon een lap code uit eerdere software krijgt, “hier, zoals deze het doet”. Dat is helemaal logisch gezien context en dataset, alleen is dat juridisch dus problematisch want een lap broncode in je eigen werk overnemen noemen wij auteursrechtinbreuk tenzij dat mag van de licentie. En aangezien dat dus vaak een opensourcelicentie is, krijg je dan te maken met eisen zoals naamsvermelding of – bij de GPL – het weer moeten open sourcen van je eigen broncode wanneer je dat werk publiceert.

Naar goed Amerikaans gebruik is Butterick dus nu een class action lawsuit begonnen, waar iedereen mag meedoen die ook code op Github heeft staan. Het lastige bij zulke zaken is altijd bewijzen dat jouw werk is overgenomen. Maar specifiek bij dit soort Amerikaanse zaken kan dit interessant worden: als onderdeel van de discovery procedure moet Github op zeker moment onthullen hoe zij aan haar dataset is gekomen. En dan kun je gewoon zien dat jouw code daarin is opgenomen (of niet, maar dat lijkt onwaarschijnlijk).

Arnoud

Mag je in een game een bekend hotel aan gort schieten?

OpenClipart-Vectors / Pixabay

Oh noes, in de vorige week verschenen game Call of Duty: Modern Warfare II wordt het Conservatorium Hotel in de hoofdstad zonder enig overleg aan gort geschoten. Dat meldde de Volkskrant onlangs. “De game reflecteert op geen enkele manier onze kernwaarden en wij betreuren dan ook onze kennelijke en ongewenste betrokkenheid”, aldus de hotelmanager die zich beraadt op juridische stappen. Ik heb zitten peinzen maar kan werkelijk geen stap bedenken.

Bij Tweakers schetsen ze een mooi beeld van de kwaliteit van deze map: 

Van de drie maps is Breenbergh Hotel de opvallendste en dat heeft een simpele reden. Wanneer je met je team aan komt vliegen in een helikopter, valt direct op dat je op dat moment uitkijkt over Amsterdamse daken. Sta je eenmaal op de grond, dan zie je dat voor de deur van het stukgeschoten hotel Nederlandse politie- en brandweerwagens staan, terwijl aan de achterzijde van het hotel het Rijksmuseum zichtbaar is. Dat is allemaal geen toeval, want Breenbergh Hotel is gebaseerd op het Amsterdamse Conservatorium Hotel. Wie wel eens in het luxueuze gebouw geweest is, zal de zalen en gangen van het hotel zeker herkennen, al zijn ze in Modern Warfare II aardig beschadigd.
Het hotel herkent zichzelf in deze ophef, wat ik ergens wel snap want als je gaat voor een luxe uitstraling (veel luxer dan het Conservatorium komen ze niet, in Nederland) dan is het bepaald niet leuk om je gebouw aan gort geschoten te zien worden.

Is er wat tegen te doen? Nou ja, de slimmeriken van producent Infinity Ward hebben natuurlijk naam en logo aangepast, en alle personages die je in beeld ziet zijn ingehuurde acteurs. Dan blijft eigenlijk nog maar één recht over en dat is het auteursrecht op het gebouw, in dit geval van de architect. Want die heeft een redmiddel tegen ‘verminking’ van het werk, als daardoor zijn goede naam wordt aangetast dan kan hij daartegen optreden (art. 25 Auteurswet).

Het gebouw is oorspronkelijk een conservatorium uit de 19e eeuw, ontworpen door Daniel Knuttel (1857-1926). Omdat auteursrechten vervallen 70 jaar na overlijden, zijn diens persoonlijkheidsrechten dus vervallen ondertussen. Echter, het gebouw is in 2012 gerestaureerd en gemoderniseerd door architect Piero Lissoni en zijn kantoor. De auteursrechten (en persoonlijkheidsrechten) op diens werk zijn dus nog niet vervallen.

Er moeten dan drie vragen worden beantwoord: (1) is er werk van Lissoni overgenomen in de game, (2) is de overname en verwoesting daarvan in de game een vorm van ‘verminking’ van het werk en (3) wordt diens reputatie daardoor aangetast? (Voor juristen: HR 29 maart 2019, vragen 2 en 3 zijn aparte vragen).

Vraag 1 is makkelijk, het uiterlijk van het hotel is vrij rechttoe overgenomen. Ik ken de architectuur niet goed genoeg om aan te wijzen welk deel exact van Lissoni is, dus laten we voor het gemak doen alsof er stukken van zijn ontwerp zijn overgenomen. Dan kom je bij, wat is de verandering en kunnen we dat een aantasting of verminking van het werk noemen?

Dat het werk (het uiterlijk van het hotel) wordt veranderd, staat buiten kijf. De verwoesting wordt zakelijk in beeld bracht, dat is nu eenmaal wat gewapend conflict in een stad doet gebeuren. Maar ik geef toe dat een verwoest gebouw toch wel een ‘aangetaste’ versie van het origineel genoemd kan worden. Dus aan die eis lijkt me wel voldaan.

Dan kom je bij: wordt de reputatie van de architect aangetast door deze verwoesting? De Hoge Raad vindt het geen vanzelfsprekendheid dat een verminking automatisch reputatieschade oplevert. Het moet anders gezegd wel op een of andere manier afstralen op de architect. De HR zegt daarover:

Bij de beoordeling van het effect dat een aantasting van een werk in de ogen van het relevante publiek heeft op de reputatie van de maker van dat werk kunnen alle omstandigheden die daarop licht kunnen werpen in aanmerking worden genomen. Daarbij valt te denken aan omstandigheden als de aard en ernst van de aantasting, de mate van bekendheid van het werk en van de maker bij het relevante publiek, de reden voor de wijziging waarin de aantasting is gelegen, de waarneembaarheid daarvan voor het relevante publiek, en de tijd die reeds is verstreken tussen de voltooiing van het werk en de aantasting.
Voor mij is dan een factor van belang dat we in de context zitten van een oorlogsspel, waarin iedereen snapt dat gebouwen en dergelijke schade gaan ondervinden. Niemand zal in die context de architect daarop aankijken, nog los van dat vrij weinig mensen wéten wie die architect is. (Dat is een ouder argument: buiten de kring van vakgenoten van de ontwerper is er geen te schaden reputatie, Hof ’s-Gravenhage 11 november 1999.) Verder heet het hotel anders, wat voor veel spelers de herkenbaarheid sterk zal verminderen, en is de verwoesting meer iets dat gebeurt dan iets dat nadrukkelijk het doel van het spel is.

Arnoud

 

 

Brein verliest hoger beroep om Ziggo waarschuwingsbrieven te laten versturen

Ziggo hoeft waarschuwingsbrieven van stichting Brein niet door te sturen naar klanten, zo meldde Security.nl onlangs. Volgens het gerechtshof Arnhem-Leeuwarden is er er geen juridische grondslag die Ziggo verplicht hieraan mee te werken. Dit bekrachtigt een vonnis uit februari waarin de rechtbank ook bepaalde dat de provider geen torrent-waarschuwingsbrieven van Brein hoeft te sturen naar frequente torrentgebruikers.

Zoals ik in februari blogde, het ging hier om een nieuw idee van de auteursrechthandhaver: identificeer frequente uploaders, en stuur ze een “we hebben je in de gaten”-brief in de hoop dat men ermee stopt. Dat is niet hetzelfde als ze gelijk dagvaarden, wat gezien de kosten en gedoe niet meteen wenselijk is. Maar de ervaring leert dat als je mensen waarschuwt, ze er regelmatig mee stoppen – al is het maar omdat ze denken dat de volgende stap wél een rechtszaak is.

Alleen een probleempje: het verwerken van persoonsgegevens van personen waartegen een min of meer gegronde verdenking bestaat van handelingen die inbreuk maken op een auteursrecht, moet aangemerkt worden als het verwerken van strafrechtelijke persoonsgegevens. Dit aldus de Autoriteit Persoonsgegevens in haar onderzoek tegen Dutch Filmworks die direct met boetes naar torrenters wilde gaan smijten.

Vanwege die reden concludeerde de rechtbank in februari dat Ziggo een vergunning nodig zou hebben (om als “privédetective” in opdracht strafrechtelijke persoonsgegevens te verzamelen). Dat staat inderdaad in de AVG als je die formeel leest, maar het doet gek aan want Ziggo is niet echt een particulier recherchebureau dat in de virtuele bosjes gaat liggen om mensen structureel in de gaten te houden.

Het Hof begint in hoger beroep met zich af te vragen op grond waarvan Ziggo überhaupt brieven door moet sturen. De redenering van Brein was: op grond van Lycos/Pessers moet je namen en adressen afgeven van inbreukmakers, een brief doorsturen is minder erg voor die mensen hun privacy dus dan kan daar geen argument tegen zijn. Het Hof ziet dat anders:

In deze zaak gaat het er niet om dat Brein zich bij de burgerlijke rechter teweer wil stellen tegen specifieke onrechtmatige gedragingen. Zij wil overtreders waarschuwen. Het mogelijk onthouden van effectieve rechtsbescherming aan een (rechts)persoon die meent onrechtmatig bejegend te worden is hier niet aan de orde.
Lycos/Pessers ging erom dat je moet kunnen procederen tegen een concreet iemand. Maar diverse onbepaalde iemanden een boze brief sturen is nog geen juridische actie, daarom valt het buiten de rechtsplicht die dat arrest oplegt.

Brein eist op dit moment al NAW gegevens van grote uploaders met als doel daartegen rechtsmaatregelen te nemen.

Die verzoeken worden volgens Brein doorgaans toegewezen. Niet aannemelijk is dus dat het verzenden van waarschuwingsbrieven een noodzakelijke stap is om civielrechtelijke actie te kunnen ondernemen tegen (een andere groep van) inbreukmakers. Ook is nog niet duidelijk in hoeverre het doorsturen van waarschuwingsbrieven zal maken dat in de toekomst op een kleinere schaal auteursrechtinbreuken zullen worden gepleegd. Partijen verschillen daarover van mening, maar vooralsnog heeft Brein niet voldoende onderbouwd gesteld dat te verwachten valt dat dat doel juist bereikt kan worden met (dit onderdeel van) de waarschuwingscampagne.
Het belang van Brein is dus enigszins speculatief te noemen. Daar staat tegenover dat Ziggo dus inderdaad stevige maatregelen moet nemen: een nieuw bedrijfsproces inrichten, daarbij rekening houden met de strenge eisen uit de AVG voor strafrechtelijke persoonsgegevens, een DPIA uitvoeren en wat al niet meer. En inderdaad dus ook die recherche-vergunning ex artikel 33 lid 4 sub c UAVG.

Het klopt, maar toch voelt het een tikje raar. Brein mag dus wel NAW gegevens van inbreukmakers eisen voor een gerechtelijke procedure, maar niet NAW gegevens van inbreukmakers om een voorlichtingsfolder en “hou op” brief te sturen? Ik snap de weerstand maar het voelt inconsequent en ik heb moeite de argumentatie van het Hof te volgen.

Arnoud

De strijd tegen illegale torrents, hoe zet je daar een boete op?

Krijgen we Duitse praktijken in Nederland? Die vraag stelde Tweakers in een recent Plus-artikel. In Duitsland is het gebruikelijk dat torrentgebruikers een claimbrief van een advocatenkantoor op de mat krijgen met daarin een beschuldiging en een schikkingsvoorstel. En je wordt ook echt gedaagd, dus betalen zul je. In Nederland is handhaving altijd tegen de grote jongens gericht: de torrentplatforms, de ISP’s, de grote seeders. Maar de discussie blijft: moeten particulieren ook gaan betalen? Dat riep de vraag op hoe zo’n boete in het recht moet worden vormgegeven. (Hoe dit in Duitsland werkt, is mij nog steeds niet duidelijk.)

Auteursrecht is civiel recht, iets dat burgers onderling uitvechten. Dat staat los van het strafrecht (in theorie is opzettelijke auteursrechtinbreuk strafbaar maar dat is al decennia een dode letter). Het civiel recht gaat erom dat burgers tegen elkaar beschermd worden en elkaar aan kunnen spreken op schade en ongewenst gedrag. Maar de bedoeling is niet dat je rijker wordt van andermans ongewenst gedrag. Claims gaan dus over schadeloosstelling, vergoeding van wat je kwijtgeraakt of misgelopen bent.

Als ik een auteursrecht schend, moet ik dus de schade vergoeden. Maar niet méér dan dat, niet 500 euro betalen bijvoorbeeld terwijl de schade 50 was. Als ik bij de buren een vaas omgooi, moet ik de vaas vergoeden en niet tien keer dat bedrag. (Ik ben strafbaar wegens vernieling en ik zóu bij de strafrechter een boete kunnen krijgen, maar die gaat niet naar de buren.)

Het probleem vanuit auteursrechthandhaving is dat de meeste claims veel te klein zijn. Een grote uitgever aanspreken wegens ongeautoriseerde overname van je website in hun boek dat kan nog wel, maar een blogger aanspreken op één plaatje van je stockfotoset, of een downloader voor één aflevering van een serie die op Netflix staat, welk bedrag koppel je daaraan?

Dit is een probleem omdat mensen dan redeneren “ik kan gewoon inbreuk maken, en word ik gepakt dan betaal ik 50 cent”. Dat voelt onrechtvaardig, het is immers niet de bedoeling dat mensen inbreuk maken op je rechten. (Morele discussie over auteursrecht daargelaten.) Dus men wil meer afschrikking, meer handhaving, keihard optreden. Als kinderen elke dag door mijn tuin rennen en voetballen, dan wil ik ballen lek gaan prikken, overweeg ik berenklemmen en valkuilen met stevige staken en eis ik dat de politie in vol ornaat voor mijn tuin gaat staan.

Een boete is een bekende vorm van afschrikking, en Duitsland laat zien dat dat werkt. Vraag is alleen, hoe moet je dat vormgeven in het recht? Want in het civiele recht bestaat dat dus niet, een boete die naar het slachtoffer gaat. En omdat de schade dus 50 cent is, kun je het ook niet camoufleren als een schatting van de schade.

Dat zou dus een forse wetswijziging met zich meebrengen, en dan zijn er vele andere rechtsgebieden die óók zulke boetes willen. Denk aan winkels die dieven willen afschrikken (die 181 euro is nu zogenaamd een “schatting van de schade”, maar welke winkeldief gaat daar een punt van maken) of verhuurders die misbruik van hun spullen willen tegengaan.

Tegelijk: als je dat niet doet, blijf je dus zitten met het probleem dat er geen effectieve handhaving tegen individuele inbreukmakers mogelijk is. Dan moet je dus of zeggen, we noemen dit legaal (want als je geen handhaving op iets toelaat, moet je het vrijgooien), of we nemen hardere maatregelen zoals het strafrecht en/of strikte eisen tegen andere partijen. Ik weet niet wat daar een oplossing in moet zijn.

Arnoud

Wacht even, open source is dus niet voor eeuwig gelicentieerd?

johnhain / Pixabay

In vervolg op mijn blog van maandag over open source bij de overheid kreeg ik vele vragen over het waarom. De TK als opdrachtgever wilde immers eigenaar van alle software worden, zodat ze kon voorkomen dat een licentie zou vervallen en de leverancier dan lekker binnen kon lopen met een nieuw contract. Hoe kan dat, aldus de diverse vraagstellers (dank, allen) als het open source is? Dat is toch voor eeuwig en onherroepelijk gelicentieerd?

De bedoeling van open source is inderdaad dat de software voor altijd onder duidelijk vastgelegde voorwaarden beschikbaar is. Maar letterlijk “voor eeuwig en altijd” (juristen houden van dubbele herhalingen, twee keer genaaid houdt beter)

De BSD licentie bevat bijvoorbeeld helemaal niets over de looptijd of intrekbaarheid, dat is simpelweg een “je gaat je gang maar binnen dit kader” verklaring. Hetzelfde voor de Mozilla Public License, en daar zit veel meer juridisch geweld in. In de Apache 2.0 licentie vind je weer wel “perpetual” bij de licentieverlening. en de GPL (versie 3) noemt de licentie “irrevocable”. Hier staat dan ook meteen het voorbehoud dat verklaart waarom deze term niet standaard genoemd wordt:

All rights granted under this License are granted for the term of copyright on the Program, and are irrevocable provided the stated conditions are met.
Dit is het instrument voor de handhaving: OSS licenties vervallen zodra je de voorwaarden schendt. (Sommige hebben automatische herstelbepalingen als je de schending opheft.) Daarmee is voortgezet gebruik van de software een inbreuk op auteursrechten, waar een enorm arsenaal aan handhavingsbepalingen uit de kast voor kan worden gehaald. Dus logisch dat OSS licenties niet letterlijk “perpetual and irrevocable” vermelden.

Dat gezegd hebbende, de strekking van die licenties is dat natuurlijk wel. Er staat geen harde termijn, en het is ook niet echt de bedoeling dat er na ${periode} opnieuw een licentie moet worden aanvaard of iets dergelijks. Naar Nederlands recht zouden we van een licentie voor onbepaalde tijd spreken. Die zijn in principe opzegbaar, mits met voldoende opzegtermijn en/of zwaarwegende reden en/of opzegvergoeding (je moet er 2 kiezen, succes George Boole) tenzij de strekking van de licentie anders is. En dat laatste lijkt me hier wel opgaan.

Blijft echter over de gekke randgevallen, en dat is waar juristen voor leven. Het voor de hand liggende randgeval is overlijden of faillissement van de rechthebbende. De auteursrechten komen dan bij een ander terecht, en het is geen uitgemaakte zaak dat de licenties dan meegaan. Voor juristen: de vraag is of een licentie een goederenrechtelijk recht is of slechts een persoonlijk recht, en het lijkt dat laatste te zijn. Je kunt als licentienemer dan alleen een schadeclaim indienen, in juridische termen heb je dan dikke pech met je concurrente vordering op een failliete boedel.

Langs een ander argument kom je bij hetzelfde probleem uit: via het Nebula- en Berzona-arrest is verdedigbaar dat de curator een licentie mag schenden (wanpresteren) wanneer dat in het belang is van de boedel. En daaronder valt dan het te gelde maken van het onderliggende auteursrecht. Hoewel daar de nodige nuances bij te maken zijn, is het zeer zeker niet uitgesloten dat er een route is waarmee een curator hiermee wegkomt. En dat wil je dan natuurlijk voorkomen met je inkoopvoorwaarden.

En ja, dit voelt als schieten met een kanon op een mug: hoe vaak gebéurt het nou dat er OSS uit de markt gaat omdat de rechthebbende/maintainer overlijdt of failliet raakt, waarna hebberige familieleden of bedrijfskopers de hoofdprijs gaan vragen? Je moet allereerst weten dat je overleden tante Agaath uit Nebraska met zo’n project bezig is, vervolgens een familierechtadvocaat met IE-kennis vinden om de rechten te krijgen én ruimte zien voor een businesscase om daar geld te gaan halen bij partijen die de software nu gratis gebruiken, terwijl je niet weet wie dat zijn. Ik zie het niet gebeuren, maar dat heeft nog nooit een inkoopvoorwaardenschrijvende jurist tegengehouden.

Arnoud

Mag je bedrijf “Robert’); DROP TABLE Companies;–” heten?

Wie in Engeland zijn bedrijf wil inschrijven bij de Kamer van Koophandel (het Companies House), heeft mogelijk een probleem: je bedrijfsnaam mag geen computer code meer bevatten (via). Jammer dus voor kleine Bobby Tables, die volgens mij ondertussen oud genoeg is om een bedrijf in te mogen schrijven. Maar het roept wel de vraag op: hoe zit dat bij ons?

De opmerking over “Robert’); DROP TABLE Companies;–” komt uit een xkcd strip, waarbij een moeder haar kind dus zo had genoemd. De SQL code in Robert’s voornaam is een triviale exploit die verrassend vaak werkt, en in dit geval ervoor zorgt dat de database waar je in zoekt de tabel met alle company-informatie verwijdert. (Als alles stupide is ingesteld, wat dus redelijk vaak het geval is.) Zijn roepnaam is Bobby Tables, trouwens.

Afijn. Het punt is dus: dit is computercode, en de software van de Companies House kan daar niet mee omgaan en/of kan rare dingen doen. Dus dat is nu een weigeringsgrond geworden voor een Engelse bedrijfsnaam. In Nederland ken ik zo’n regel niet. De regels over handelsnamen zijn vrij simpel en gericht op het doel van handelsnamen: niet misleiden, je niet groter voordoen en geen speciale aanduidingen zoals bv of bank of stichting tenzij je dat bent.

Over gekke tekens zegt de KVK:

Je mag cijfers en de leestekens @ & + en – altijd gebruiken in je bedrijfsnaam, Speciale tekens als () ? ! * # / mag je uitsluitend ter vervanging van een letter of als ‘woordgrap’ gebruiken.
Ik kan niet direct een juridische basis voor deze uitspraak vinden, behalve dan het argument dat het moet gaan om een ‘naam’ en dat namen toch vrij evident bestaan uit letters, cijfers en die leestekens, met hooguit een woordgrap. (Van dit standaardwerk, hoewel grondig, werd ik niet veel wijzer.)

Dat sluit aan bij een indirect gerelateerde zaak uit 2010 bij het Hof van Justitie, waarbij de merknaam “&R&E&I&F&E&N&” werd ingeschreven met als doel voorrang te krijgen bij de .eu domeinnaamopenstelling voor www.reifen.eu. Het Hof bepaalde dat een merkregistratie ongeldig is (kwade trouw) als je niet het oogmerk hebt het merk als zodanig te gebruiken in de markt. Daaruit zou ook voor handelsnamen het argument kunnen volgen dat “Robert’); DROP TABLE Companies;–” niet bedoeld is als handelsnaam maar als truc om de KVK (en data brokers) te pesten.

Engelse slimmeriken ontdekten al een IT-consultant die IFTHENELSE heet, bij de KVK vond ik TRY CATCH, zoeken op // geeft vele resultaten, en toen vond ik ook diverse bedrijven die DROP TABLE heten. Eentje lijkt zelfs van Robert Table te zijn:

Lachi’); DROP TABLE bedrijf;–, Hoofdvestiging KvK 67788106 Vestigingsnr. 000036287172 <snip>
Hier lijkt dus een filter van de KVK minder streng te zijn dan de folder, of dit bedrijf was goed in het overbrengen van de humor van deze bedrijfsnaam.

Wie vindt er nog een bedrijfsnaam die computercode bevat?

Arnoud

Aanvallen patenttrollen op open source verdubbeld, ondanks Alice, huh?

Het aantal patentclaims bij open source projecten door patenttrollen is sinds 2021 met 100% toegenomen, las ik bij ZDNet. (De cijfers komen uit een onderzoek van patentclaimonderuithaler Unified.) Op zich niet raar gezien open source sterk aan populariteit wint en het aantonen van een inbreuk niet heel kostbaar is. Maar wel raar gezien de stand van de jurisprudentie in de VS: geen patent is meer veilig. Wat is hier aan de hand?

Het artikel noemt als belangrijkste reden voor de toename van claims het toegenomen gebruik van OSS bij banken en fintech bedrijven. Dit zijn traditioneel geen partijen die veel met patenten doen, en die sterk risicomijdend zijn en bovendien calculerend: deze claim voelt gevaarlijk, voor een ton gaat ‘ie weg, wat kost een patentrechtszaak? Oké, betalen en verder met wat we aan het doen waren.

Maar Alice dan? Het was inderdaad lang zo dat een patentrechtszaak enorm duur was, omdat er een langlopende discovery en feitelijk/juridische discussie moest worden gevoerd. Maar in 2014 deed de Supreme Court uitspraak over de vraag wanneer een software-uitvinding nu voor octrooi in aanmerking komt (de Alice-uitspraak): eigenlijk nooit. Alleen dat lijkt nu weer anders te liggen:

It also doesn’t help one darn bit as Federal Circuit Court of Appeals Judge Pauline Newman said, “The court’s rulings on patent eligibility have become so diverse and unpredictable as to have a serious effect on the innovation incentive in all fields of technology. The victim is not only this inventor …; the victims are the national interest in an innovative industrial economy and the public interest in the fruits of technological advance.”
Dat heeft dan weer te maken met een uitspraak uit 2019 waarin de criteria uit Alice vertaald werden naar andere vakgebieden, maar op zo’n manier dat de interpretatie weer helemaal open is komen te liggen. Bovendien zijn er (natuurlijk) weer trucs bedacht, zoals per direct een expert laten opdraven die feitelijke uitspraken doet, waardoor er tegenexperts nodig zijn en je niet met een snelle Alice-aanval de zaak onderuit kunt halen. En dat zijn precies het soort vertragingstactieken waardoor patenttrollen weer waarde krijgt.

Het rapport is opgesteld door Unified Patents, een organisatie die zich ten doel stelt patenten van trollen aante vallen precies met de Alice-argumenten. Dat kan, als je bijvoorbeeld bij het USPTO herziening aanvraagt of in het algemeen belang een rechtszaak start zonder dat er concreet discussies over inbreuk zijn. (Dan zijn die experts ook niet nodig.) Het is alleen wel duur. Het laat maar zien hoe vastgelopen het Amerikanse patentsysteem is.

Arnoud

Mag ik een AI-artiest online zetten of moet ik bang zijn voor het auteursrecht?

Een lezer vroeg me:

Gisteren heb ik zitten spelen met zo’n machine-learning ai die plaatjes maakt van een tekstje (“prompt”). Dat tekstje en een aantal getals-parameters kun je zelf invullen en tweaken. Het resultaat is een webpagina vol met schilderijen waarop acteur Brad Pitt te zien is alsof hij geschilderd is door Monet, van Gogh, Degas, enzovoort. Als ik deze AI online zou zetten, kan ik dan problemen verwachten met portretrechten van Brad Pitt dan wel auteursrechten van de bronwerken?
Allereerst het portretrecht, daar verwacht ik de minste problemen. Het gaat om een portret niet in opdracht, waarbij de vraag is of de afgebeelde persoon een redelijk belang tegen publicatie heeft. Wat kan meneer Pitt aanvoeren? Hij is een bekend persoon en je gebruikt hem vanwege de herkenbaarheid, dat is nu eenmaal inherent aan bekend zijn vanwege je uiterlijk (met alle respect voor zijn inhoudelijke kwaliteiten, overigens).

Auteursrecht is lastiger, want de AI van de vraagsteller transformeert niet één foto maar tien miljoen. Dat lijkt de auteurswet te buiten te gaan, alsof je zou zeggen dat je mijn boek overneemt omdat je daaruit plus nog tien miljoen boeken haalt hoe juridische tekst gaat. Ik meen dat dat niet opgaat.

De gegenereerde werken zijn in de stijl van bekende schilders. Dat kan, een stijl van werken is niet beschermd. Ook niet als de bedenker van die stijl auteursrechtelijk nog leeft (70 jaar na overlijden).

Pas als er concrete fragmenten uit één bronwerk in het gegenereerde werk komen, dan loop je tegen auteursrecht aan. Denk aan het schilderij van het meisje met de parel, waar je AI eigen variaties op maakt. Dat zou inbreuk zijn als het een modern werk was.

Arnoud

Mijn foto is een datapunt in iemands AI, kan ik een schadevergoeding krijgen?

Simon / Pixabay

Via de website “Have I been trained” kun je achterhalen of jouw foto gebruikt is om een AI te trainen, las ik bij Ars Technica. Of nou ja, iets preciezer: of je foto in een van de enorme datasets zit waarmee tegenwoordig alle beetje fatsoenlijke AI’s worden getraind. Want die datasets zijn meestal zonder het ook maar iemand te vragen opgebouwd, dus een beetje pixeljager zou daar wel geld moeten zien. Maar valt er wel wat te eisen?

Wie een machine learning systeem wil trainen, heeft data nodig. Dat geldt voor iedere applicatie, maar voor afbeeldingen is het helemaal een complexe eis: waar haal je die enorme hoeveelheid plaatjes vandaan die nodig is om een adequate brede dekkingsgraad van je AI-toepassing te krijgen? Nou ja, dat pluk je gewoon van internet want als je het maar massaal genoeg verzamelt is het geen auteursrechtinbreuk meer maar innovatie (cf. Google Images).

De state of the art dataset tegenwoordig is LAION-5B,met 5,85 miljard afbeeldingen verreweg de grootste. Bijeengebracht voor researchdoeleinden en experimenteren met zulke enorme sets, aldus de website. “The images are under their copyright”, staat er dan ook. En dan de juridische truc, of nou ja truc, waarmee dat kan: elk item uit de dataset bevat simpelweg alleen de bron-URL van de afbeelding, waarmee de dataset zelf geen inbreuk is.

De dataset is voor haar doel buitengewoon nuttig: bij elk plaatje staan labels zoals wie of wat er te zien is. Met dergelijke metadata kun je systemen trainen die daarmee nieuwe afbeeldingen kunnen maken op een zelfbedachte suggestie (“copyright symbol racing against computer“). Die leren dan op basis van die metadata wat er zoal mogelijk is bij een dergelijke tekst.

Als je nu een dataset maakt door al die afbeeldingen te downloaden en daarmee een AI traint, heb je dan auteursrechten geschonden? De eerste stap – het downloaden – is voor onderzoekers of bedrijven problematisch, omdat in Europa in ieder geval zoiets buiten de thuiskopie-regeling valt. In de VS is dit mogelijk fair use, het staat immers legaal online en het downloaden van een afbeelding is dan fair. 

De volgende stap is het trainen van een machine learning model, waarbij dus allerlei features van die afbeeldingen worden geëxtraheerd en in combinatie met die metadata tot een algoritme wordt omgezet waarmee nieuwe afbeeldingen worden gemaakt. In principe zijn die echt nieuw, maar er zitten soms wel herleidbare stukjes in, zoals in deze foto met herkenbaar Getty watermerk. (Ik weet niet of dit is omdat het stukje met het watermerk paste bij de prompt of omdat het systeem heeft geleerd dat goede foto’s vaak een Getty watermerk dragen, en daaruit concludeerde dat dit erbij hoort.)

Het belangrijkste is, je kunt aan een AI eigenlijk nooit zien of jouw foto’s er specifiek in zitten. Deze tool maakt voor het eerst soort van dat wél mogelijk, althans als de AI-exploitant dus meldt dat hij met LAION-5B werkt (wat op zich een normale melding is, want het is nodig voor benchmarking). En dan kun je dus een claim doen, want gegarandeerd dat er dan bij dat bedrijf ergens een zipfile rondzwerft met een kopie van jouw foto(‘s).

Alleen: wat is je schade? Dit probleem is fundamenteel bij het auteursrecht online, zeker voor mensen die hun werk gratis op internet zetten. Want dan kun je niet eens de gemiste licentiekosten als schade opvoeren. En hier speelt dan ook nog eens dat we niet weten wat je auteursrechtelijk precies doet als je een foto omzet naar een berg datapunten waarmee je een image generator maakt.

De makers van deze tool hebben een iets andere insteek: zij willen dat de AI community vrijwillig overstapt naar een model waarbij toestemming de norm is, juist om de kleine creatieveling te beschermen. En dat is een heel nobel streven, met natuurlijk de kanttekening dat er weinig prikkel is om bij dit soort bedrijven hier op over te stappen.

Arnoud