Hoe aansprakelijk wordt OpenAI voor de zakelijke versie van ChatGPT?

OpenAI werkt aan een zakelijke, betaalde versie van zijn chatbot ChatGPT. Dat meldde Tweakers onlangs. Momenteel is de chatbot gratis maar niet voor bedrijfsdoeleinden inzetbaar (wat natuurlijk geen hond tegenhoudt om er zakelijk gebruik van te maken). Het onderscheid zal vooral zitten in beschikbaarheid, snelheid en meer berichten per minuut. Het riep wel vele vragen op, die in de comments mooi samengevat werden als “Hoe wordt er in de professionele variant rekening gehouden met data die proprietary is of waar, op zijn minst, een copyright op berust?”

Het GPT-3 taalmodel waar de chatbot mee werkt, is getraind op vele miljarden tekstvoorbeelden. Het doel is leren wat het meest logische volgende woord is – kort gezegd – op basis van een prompt en de reeds gegeven woorden. Dat is met genoeg voorbeelden prima mogelijk, zeker op het niveau van chats waarbij je een vraag moet beantwoorden. ChatGPT produceert dan ook verbluffend goede resultaten, hoewel er ook volkomen waanzinnige reacties tussen zitten die met de grootste overtuiging worden gebracht.

Die tekstvoorbeelden komen natuurlijk van internet, ‘gewoon’ met een crawler die heel internet downloadt en daar machine-leesbare chocola van maakt. De makers leggen uit dat ze meer dan een biljoen (Amerikaans trillion, 1012) woorden hebben verwerkt. Dat kan niet anders dan zonder toestemming, maar iedereen stelt dat dit onder fair use te rechtvaardigen is en weet bovendien dat het ontzettend moeilijk is aan te tonen dat specifiek iemands werk opgenomen is in de dataset, plus dat een rechtszaak om dít punt uit te vechten veel te duur is voor iedere individuele rechthebbende. Uitgesloten is het niet – zie de rechtszaak over CoPilot, waarbij software-eigenaren wel degelijk zagen hoe deze AI-tool herkenbare fragmenten uit hun werk reproduceerde als “AI-generated”.

In de VS zou er misschien nog een lichtpuntje zijn wanneer je aannemelijk kunt maken dat jouw werk is gebruikt, omdat je dan via de zogeheten discovery procedure inzage kunt krijgen in documentatie rondom de bronbestanden. Dan heb je in ieder geval het feitelijke bewijs dat jouw werk is gebruikt. Vervolgens zit je nog met het juridische punt of het inbreuk is om een AI te trainen op jouw data, of dat het pas inbreuk is als de AI jouw werk reproduceert (dat laatste lijkt me evident).

In het auteursrecht geldt nu eenmaal de regel dat het bronwerk herkenbaar terug moet komen in het beweerdelijk inbreukmakende werk. Als ik iemands artikel lees en me laat inspireren tot een hoofdstuk in een boek, dan schend ik geen auteursrechten, hooguit pleeg ik academisch plagiaat. Maar als ik het artikel min of meer naschrijf, dan komt het auteursrecht wel om de hoek kijken. De academische grap is dan ook: één bron gebruiken is plagiaat, honderd bronnen gebruiken is onderzoek. En laat AI nou dus heel duidelijk die laatste kant op gaan: als honderd bronnen gebruiken mag, dan zal varen op honderd miljoen bronnen toch zeker ook wel mogen.

Het nieuwe aan de discussie is vooral dat we nu een betaalde dienst krijgen met een SLA. Afnemers daarvan zullen meer garanties gaan eisen, waaronder dus met name een vrijwaring (indemnification) tegen claims van derden. Want als ik als rechthebbende lees dat er ergens een adviesbureau komt dat een juridische chatbot heeft, dan ga ik die natuurlijk aanklagen en niet OpenAI uit San Francisco. Want ik durf de stelling wel aan dat mijn blog ergens in die dataset zit. Dat bureau heeft dan een probleem, want die is zelfstandig aansprakelijk. Dus dan moeten ze OpenAI zo ver krijgen de verdediging te gaan voeren, en dan wordt het een groot verhaal waar best wat nuttige puntjes uit te slepen zijn.

Arnoud

12 reacties

  1. Hmm. Die 10^12 wordt niet goed getoond omdat een reset.less bestand met vertical-align: baseline; de super positie verwijdert. Aan zo’n reset zitten is soms vervelend. Dan zou je de basis terug kunnen zetten met een sup { vertical-align: revert; } ergens in een maatwerk layout bestand weer toe kunnen voegen.

  2. Want ik durf de stelling wel aan dat mijn blog ergens in die dataset zit.

    Even getest maar ik weet het eigenlijk wel zeker. Ik gaf ChatGPT deze prompt: “Schrijf een blog entry in de stijl van Arnoud Engelfriet” Dit was de output:

    Als juridisch adviseur ben ik vaak geconfronteerd met vragen over internetrecht. Een van de meest voorkomende vragen is die over het gebruik van afbeeldingen op een website.

    Er zijn een aantal zaken waar u rekening mee moet houden als u afbeeldingen op uw website wilt gebruiken. Ten eerste is het belangrijk om te weten wie de rechthebbende is van de afbeelding. Dit kan de fotograaf zelf zijn, maar ook een stockfotografiebedrijf of een andere partij die de rechten heeft verworven. Ten tweede moet u toestemming vragen aan de rechthebbende voor het gebruik van de afbeelding. Dit kan een licentie zijn, maar soms moet u ook betalen voor het gebruik.

    Het is ook belangrijk om te weten dat sommige afbeeldingen auteursrechtelijk beschermd zijn, terwijl andere afbeeldingen in het publieke domein vallen. Afbeeldingen die auteursrechtelijk beschermd zijn, mogen niet zonder toestemming gebruikt worden. Afbeeldingen die in het publieke domein vallen, mogen vrij gebruikt worden.

    Een andere veelvoorkomende vraag is of het gebruik van afbeeldingen van andere websites toegestaan is. In principe is het niet toegestaan om afbeeldingen van andere websites te gebruiken zonder toestemming van de rechthebbende. Er zijn echter wel uitzonderingen, zoals het gebruik van afbeeldingen onder een licentie die Creative Commons heet. Hiermee kunt u afbeeldingen gebruiken onder bepaalde voorwaarden, zoals het vermelden van de bron.

    Als u er niet zeker van bent of u een afbeelding mag gebruiken, dan is het verstandig om advies te vragen aan een juridisch adviseur of een advocaat gespecialiseerd in internetrecht. Zo kunt u voorkomen dat u aansprakelijk gesteld wordt voor inbreuk op auteursrecht.

    In het kort:

    • Zorg ervoor dat u weet wie de rechthebbende van de afbeelding is
    • Vraag toestemming aan de rechthebbende voor het gebruik van de afbeelding
    • Houd rekening met auteursrecht en publiek domein
    • Vraag advies aan een juridisch adviseur als u twijfelt of u een afbeelding mag gebruiken
    1. Dit is wat ChatGPT van deze blog vond

      Het is interessant om te zien hoe OpenAI een betaalde versie ontwikkelt van ChatGPT voor commercieel gebruik. De mogelijkheid voor een grotere beschikbaarheid, snelheid en aantal berichten per minuut is zeker aantrekkelijk voor bedrijven. Echter, zoals het artikel aangeeft, is het gebruik van propriëtaire of auteursrechtelijk beschermde gegevens een geldige zorg. Het gebruik van fair use en de moeilijkheid om specifieke werken te bewijzen die in de dataset zijn opgenomen, zijn geldige punten, maar zoals de zaak CoPilot aantoont, is het niet onmogelijk voor individuele rechthebbenden om juridische stappen te ondernemen.

      Het is ook belangrijk om op te merken dat de onderscheid tussen het trainen van een AI op iemands gegevens en de AI die het werk reproduceert zelf een belangrijke juridische onderscheid is. Zoals het artikel stelt, geldt in auteursrecht dat het oorspronkelijke werk herkenbaar moet zijn in het werk dat beweerd wordt inbreuk te maken. Het zal interessant zijn om te zien hoe dit zich ontwikkelt naarmate de technologie en haar commerciële gebruik evolueert.

    2. schrijf een blog in de stijl van ict-jurist Arnoud Engelfriet om te betogen dat taalmodellen inbreuk op het auteursrecht maken

      schrijf een blog in de stijl van ict-jurist Arnoud Engelfriet om te betogen dat taalmodellen inbreuk op het auteursrecht maken Als ict-jurist is het mijn taak om de juridische implicaties van nieuwe technologieën te onderzoeken. Een van de onderwerpen waar ik me recentelijk op heb gericht, is het gebruik van taalmodellen zoals ChatGPT.

      In principe is het gebruik van taalmodellen een inbreuk op het auteursrecht. Auteursrecht beschermt namelijk het recht van de maker van een werk, zoals een boek of een artikel, om te beslissen hoe het werk wordt gebruikt en gedistribueerd. Wanneer een taalmodel zoals ChatGPT gebruikt wordt om teksten te genereren, wordt het werk van andere auteurs zonder toestemming gebruikt en gekopieerd.

      Er zijn echter enkele uitzonderingen op deze regel. Zo kan het gebruik van taalmodellen soms onder de categorie “citeren” vallen, wat inhoudt dat een beperkt gedeelte van een werk mag worden gebruikt voor beoordeling, commentaar of parodie. Ook kan er sprake zijn van “fair use” wanneer het gebruik van een werk noodzakelijk is voor wetenschappelijk of onderwijsdoeleinden.

      Echter, in de praktijk is het vaak moeilijk om vast te stellen of een bepaald gebruik van taalmodellen onder deze uitzonderingen valt. Veel taalmodellen worden gebruikt voor commerciële doeleinden, zoals het genereren van teksten voor websites en sociale media. In deze gevallen is het gebruik van taalmodellen vaak niet te verdedigen onder de uitzonderingen voor citeren of fair use.

      Daarom stel ik voor dat er duidelijkere regelgeving komt voor het gebruik van taalmodellen, zodat de rechten van auteurs worden beschermd en er geen onduidelijkheid is over wat wel of niet mag. Dit kan bijvoorbeeld door het opstellen van richtlijnen voor het gebruik van taalmodellen in commerciële contexten, of door het invoeren van licentievereisten voor het gebruik van taalmodellen.

      Tot slot is het belangrijk om te benadrukken dat het gebruik van taalmodellen zeker zijn waarde heeft, bijvoorbeeld voor het automatiseren van taken of het verbeteren van de toegankelijkheid van informatie. Echter, dit mag nooit ten koste gaan van het respecteren van de rechten van auteurs.

  3. Het klopt niet helemaal, omdat bij OpenAI er ook een officiële, betaalde API beschikbaar is. En daarmee dus een commercieel product dat je kunt kopen en gebruiken. (Wat ik al een maand doe voor mijn website Foxboom Weather waarbij ik data van OpenWeatherMap tot tekst laat vertalen door OpenAI, waarna deze door Google TTS wordt vertaald tot gesproken tekst. Waarom? Gewoon, voor de lol. 🙂

    Ik heb al redelijk wat zitten spelen met deze commerciële versie, omdat deze beter beschikbaar is en beter is in te stellen. Ik heb het ook voor het genereren van code gebruikt, om JSON objecten te vertalen naar C# klassen voor in mijn code. Maar ook om gewoon willekeurige data te genereren zoals gebruikersnamen en persoonsgegevens. Wat eigenlijk weer de vraag opwekt of fictieve personen ook onder de AVG/GDPR vallen. 🙂

    Maar waar het volgens mij ook om gaat is of publiekelijk gepubliceerd materiaal door software geanalyseerd mag worden om daar een AI-model op te bouwen. Kijk, de bedoeling is dat personen dit publicaties lezen, maar computers lezen natuurlijk mee. En zoekmachines zoals Google en Yahoo doen dit al sinds de vorige eeuw. Als publicaties niet door machines gelezen en geanalyseerd mogen worden dan levert dat enorme problemen op.

    Ik zie regelmatig vergelijkingen tussen Google en ChatGPT in FB groepen voor developers. Veel developers gebruiken Google om code te zoeken en kopiëren dit dan in hun eigen werk. Hoezo, auteursrechten? Is dit dan anders indien ChatGPT deze code aanlevert? ChatGPT levert alleen een zoekresultaat op, net als Google. Verschil is alleen dat je bij Google nog iets verder moet zoeken terwijl ChatGPT hapklare brokken levert. (En je niet vertelt wat de bron is.)

    Maar goed, die vraag over auteursrechten en of OpenAI garanties gaat leveren kun je ook vragen bij Google. Je zoekt op Google en je vindt een site met een stuk code die je kopieert. Helaas is die site zelf weer plagiaat van een andere site, waar de code vandaan komt. En ik gebruik dan die code en de eigenaar van de oorspronkelijke code komt bij mij verhaal houden. Ik kan dan naar Google verwijzen en Google verwijst dan weer naar de site die oorspronkelijk het plagiaat deed. En die? tja… Geen idee, eigenlijk…

    Er is natuurlijk de website StackOverflow waar veel code te vinden is. En iedereen die daar meedoet kan weer code overnemen uit een beschermd werk en daarmee dus plagiaat plegen. Maar er zijn ook weer sites die de Q&A van StackOverflow gewoon kopiëren naar hun eigen pagina’s en er wat extra advertenties bij plaatsen in de hoop dat ze qua SEO hoger scoren dan StackOverflow. En dat blijkt nog best te werken. Dus auteursrechten op het Internet is nog best lastig, als je eenmaal zelf iets hebt gepubliceerd.

    1. Bij het kopiëren van code van een website geldt in principe hetzelfde als bij get overnemen van foto’s: het is auteursrechtinbreuk. Kijk maar naar de Chessbase zaak. Wanneer he als programmeur een herkenbaar stuk code overneemt van een ander, dan wordt jouw code een afgeleid werk en wordt het verkrijgen van de benodigde licentie een juridisch discussiepunt. Het maakt niet uit of je via een zoekmachine, een forum of een AI aan die code gekomen bent.

      Dat heel veel mensen met dit soort inbreuk en plagiaat wegkomen maakt het nog niet legaal. En als je gesnapt wordt kom je niet van je schadeplicht af door te wijzen naar tussenpersonen.. Je hoort zelf voor de benodigde licenties te zorgen.

      1. Ja, maar de ChessBase zaak zat anders in elkaar. Daar was duidelijk dat ChessBase gewoon de code van StockFish had gejat en niet aan de GPL wilde voldoen. En het ging waarschijnlijk ook om enorm grote stukken code…

        Bij OpenAI ben je eigenlijk beperkt tot 4000 tokens, of 8000 in een nieuwe versie, in de code die je krijgt. Dit is de som van het aantal tokens in je vraag plus het aantal tokens in het antwoord. En een token is ruwweg een woord. Omdat je vraag meetelt met deze telling krijg je misschien 3000 tokens aan code uit een of ander werk. Waarbij het ook nog eens de vraag is of dat werk uniek genoeg is om auteursrechtelijk beschermd te zijn. Want als ik OpenAI vraag om code om een JWT token uit te lezen dan zal die code waarschijnlijk niet beschermd zijn omdat het om een open standaard gaat.

        Lastiger is het als je om ASN.1 code vraagt, maar ook dan krijg je voorbeelden die eigenlijk publiekelijk genoeg zijn en gewoon functioneel bedoeld zijn. Auteursrechten zijn niet bedoeld om bepaalde functies te beschermen als deze gewoon een algemeen nut hebben. (Daar zijn immers patenten voor!) Maar goed, weet je wat het beste voorbeeld is van waar het hier om gaat? 🙂

        Ga naar ChatGPT/OpenAI en typ: “sparse matrix trans­pose in the style of Tim Davis”. Dat is genoeg om een stukje code te krijgen waar dus auteursrechten op kunnen zitten. Cod die uit deze repository zou komen, volgens Tim Davis. Zou best kunnen. Maar als ik daarna vraag: “What license does this code have?” dan is het antwoord: “This code does not have an explicit license, so it defaults to all rights reserved.” En zo zou je meer vragen over de oorsprong van de code kunnen vragen, maar OpenAI kan die verder niet geven.

        Maar op de vraag: “What code did Tim Davis write?” kreeg ik als antwoord: “Tim Davis wrote the code for the Sparse Matrix Transpose algorithm.” En daarna: “What is the difference between this code and the code for the Sparse Matrix Transpose algorithm?” met als antwoord: “The code for the Sparse Matrix Transpose algorithm is designed to efficiently compute the transpose of a sparse matrix, while this code is designed to read in a sparse matrix and output its transpose.”

        En nou wordt het echt interessant! Want het beschermde werk gaat over het berekenen van deze matrix en de code die ChatGPT levert gaat over hoe je die berekening uiteindelijk gebruikt! Ofwel, puur functioneel. Dus dan de vraag om dichter bij het oorspronkelijke werk te komen: “Give me code to to efficiently compute the transpose of a sparse matrix in C. Call the function ‘cstranspose’.” En dan dit vergelijken met de code uit de repository. Dat leverde dit op:

        Give me code to to efficiently compute the transpose of a sparse matrix in C. Call the function “cs
        transpose”.

        include <stdlib.h>

        include “cs.h”

        /* Compute the transpose of a sparse matrix / cs cstranspose(cs* A, int values){ int m, n, nz, Ap, *Ai, *Cp, *Ci; double *Ax, *Cx; cs *C; if (!CSCSC(A)) return (NULL); / check inputs / m = A->m; n = A->n; Ap = A->p; Ai = A->i; Ax = A->x; nz = Ap[n]; C = cs_spalloc (n, m, nz, values && Ax != NULL, 0); / allocate result / if (!C) return (NULL); / out of memory / Cp = C->p; Ci = C->i; Cx = C->x; for (int j = 0; j < n; j++) { Cp[j] = nz; / column j of C starts here / for (int p = Ap[j]; p < Ap[j+1]; p++) { Ci[nz] = Ai[p]; / A(i,j) is the nz-th entry in C / if (Cx) Cx[nz] = Ax[p]; / and x[nz] is A(i,j) / nz++; } } Cp[n] = nz; / finalize the last column of C */ return ( C); } Het lijkt er een beetje op, maar de verschillen zijn groot. En als je een beetje verder nadenkt dan bedenk je dat dit algoritme door veel anderen ook kan zijn geschreven en kan zijn gebruikt. Tim Davis kan dan wel een library hebben geschreven en deze hebben vrijgegeven maar een patent op deze functie heeft hij niet. Alleen auteursrechten. Maar het commentaar bij dit soort functies zal nooit veel verschillen en de namen van variabelen zijn ook niet erg creatief te noemen. En dat roept de vraag op of Tim Davis de code misschien heeft overgenomen uit een andere library? Mogelijk eentje in een andere programmeertaal? Want OpenAI is best goed in het vertalen van code tussen meerdere programmeertalen. Je kunt dezelfde vraag stellen om code in een andere taal te genereren en dan ook te kijken naar overeenkomsten…

        Dus de vraag is in hoeverre OpenAI de code van Tim Davis heeft overgenomen en of dit niet ook van een ander werk afkomstig kan zijn. En dan de vraag of de code uniek genoeg is om auteursrechtelijk beschermd te zijn, daar je pure functionaliteit niet kunt beschermen. De bewijslast ligt uiteindelijk bij de auteur die moet aantonen dat hij het oorspronkelijke werk schreef en deze uniek genoeg is om beschermd te zijn. En ik vermoed dat wat OpenAI genereert er sterk op kan lijken, maar dit soort functies zijn veelal niet erg uniek…

        1. Beste Wim,

          We kunnen heel lang discussiëren over een stuk C++ code dat je in een belabberde layout presenteert. Ik zou niet weten of er matches te vinden zijn tussen wat ChatGPL hier genereert en auteursrechtelijk beschermde software. Het probleem is “All rights reserved.” Als programmeur moet jij kunnen garanderen dat de code geschikt is voor gebruik door jouw werkgever en haar klanten. Kun je dat als je niet weet of de code onder het auteursrecht van een (onbekende) derde valt?

          1. Meh. Arnoud moet eens iets aan deze website doen daar het de blockquote gewoon verkeerd weergeeft. Gewoon even helemaal moderniseren zou geen slecht idee zijn.

            En ja, “All rights reserved” is wat ChatGPT aangeeft qua licenties en geeft niet aan wie dan de rechten heeft. Je kunt dus wel vragen om code, maar deze kun je niet zomaar verder publiceren. Dat moet je als programmeur dan maar zelf oplossen.

            Maar de vraag is meer of de betreffende code wel auteursrechtelijk te beschermen is. Want de klacht is vooral dat er kleine stukjes code worden gegenereerd op basis van beschermde werken. Valt dit onder de “Fair Use” wetgeving? En onder het citaatrecht in Nederland? En is de code eigenlijk wel uniek genoeg om auteursrechtelijk beschermd te zijn? Dat zijn de twee belangrijkste vragen in deze discussie.

            Want Tim Davis heeft dan wel een transpose-algoritme in C geschreven, maar dat algoritme is niet echt bijzonder te noemen. Dit is klassieke wiskunde uit 1858 dus dat algoritme heeft geen bescherming. Het enige waar hij rechten op kan claimen zijn de namen van de variabelen want een transpose-functie zal automatisch het woord “Transpose” in de naam krijgen. En het gebruik van een-letter variabelen is ook niet erg uniek te noemen. Het commentaar in de code misschien? Ook niet echt moderne proza.

            Dus als programmeur moet je ook kijken in hoeverre jij kunt inschatten of de gegenereerde code beschermd kan zijn. De code moet door de “oorspronkelijkheidstoets” heen komen en dat is bij korte stukjes code enorm lastig. Ja, de helft van StockFish in je eigen applicatie stoppen en dan niet conform de licentie is fout, natuurlijk. En het idee achter code is niet beschermd, maar alleen de broncode zelf. Maar je mag het idee achter de broncode wel zelf schrijven, en dan kom je vaak in de buurt van de broncode zelf. Dit zijn belangrijke vragen als we het uiteindelijk ook over aansprakelijkheid gaan hebben…

            Want nu komt het: ik gebruik de code die ChatGPT mij geeft voor deze transpose functie en Tim Davis stuurt mij een gepeperde rekening voor het gebruik van de code. Ik schrik, en na overleg met een advocaat tref ik een dure schikking. En die rekening presenteer ik vervolgens bij OpenAI. Tja, leuk, maar ik denk niet dat dit gaat werken. Ten eerste omdat ik beter had moeten weten. Maar ook omdat OpenAI van mening kan zijn dat het betreffende stukje code gewoon Public Domain is omdat het niet door de toets heen komt.

            1. Ik ben het met het grootste deel van jouw analyse eens. Er is weinig jurisprudentie die ons inzicht kan verschaffen over wanneer een code fragment herkenbaar en beschermd is. De meeste inbreukzaken betreffen het kopiëren van aanzienlijke stukken code.

              Jouw voorbeeld betreft een rechttoe rechtaan implementatie van een uit de literatuur bekend algoritme. Ik denk dat een goede advocaat, met de hulp van een goede expert een rechter kan overtuigen dat het door jouw gepresenteerde code onvoldoende oorspronkelijk is om onder de auteursrechtbescherming te vallen, maar dat is niet een bij voorbaat gewonnen race.

              De vrijwaring die OpenAI aanbiedt is een contractuele zaak en hangt van de afspraken af die tussen OpenAI en haar gebruiker gemaakt zijn. Belooft OpenAI dat de ChatGPL output geschikt is voor commercieel gebruik? Zo niet dan zegt OpenAT (terecht) “eigen schuld”. Mocht de claim wel onder de (potentiële) vrijwaring vallen dan zullen OpenAI’s advocaten zich al snel gaan bemoeien met de onderhandelingen over de schadeclaim. (Het is een gebruikelijke eis bij vrijwaringsclausules dat je de gever van de vrijwaring vroegtijdig inlicht.)

              1. Mooi! we zijn het eigenlijk wel met elkaar eens, denk ik. Uiteindelijk gaat het om de vrijwaring die OpenAI geeft en die is er eigenlijk niet. Maar dat komt mede omdat op door AI gegenereerde code (en andere zaken) geen auteursrechten zitten omdat een AI geen auteur kan zijn. Ten minste, nog niet. Geen idee of dat ooit zal veranderen…

                Maar sowieso denk ik dat het voor programmeurs een goede zaak is om deels op de hoogte te zijn van de wetgeving en daarbij vooral betreffende auteursrechten, handelsmerken en patenten. Daarom zit ik ook dit blog te volgen. 🙂 Uiteindelijk gaat het er vooral om in hoeverre een stuk code beschermd is. En hoe kun je dat uiteindelijk het beste beoordelen?

                Ik denk sowieso dat code lastig te beschermen is omdat het grotendeels functioneel is. Zo kun je geen auteursrechten claimen op een nieuwe hamer die je maakt omdat een hamer functioneel is. Je kunt mogelijk een handelsmerk-inbreuk claimen als andere hamers teveel op die van jou lijken, maar dan moet er wel een esthetisch aspect aan je ontwerp zitten. Een patent lijkt mij al helemaal onmogelijk, tenzij je hamer schroeven in een muur kan schroeven door erop te slaan. En dat probleem heb je nu eenmaal met code.

                Wat belooft OpenAI eigenlijk? Ik heb toevallig een betaalde account (En ben al bijna $40 kwijt aan wat ik heb verbruikt!) dus ik ben even gaan kijken. De TOS van OpenAI is daarbij belangrijk. Maar het betreft hier een beta-versie dus geeft OpenAI nog geen garanties. En daatbij geven ze ook aan: Output generated by code generation features of our Services, including OpenAI Codex, may be subject to third party licenses, including, without limitation, open source licenses.

                Dat lijkt mij vrij duidelijk. Het is aan mij om te bepalen of ik de gegenereerde code veilig kan gebruiken. Op mijn eigen risico, dus. Dat is sowieso al snel het geval als je code van het Internet af haalt. Als ik b.v. op StackOverflow een vraag stel en daarbij een stukje code als antwoord krijg dan weet ik ook niet of ik wel de juiste rechten heb. Ja, de persoon die het antwoord gaf zal mogelijk de rechten hebben, maar die kan het weer ergens anders uit gekopieerd hebben.

                En dat probleem bestaat ook met al die open-source projecten die er bestaan. Hoe weten we zeker dat de betreffende code ook echt uniek is? Ik moet hierbij denken aan de “network sockets” functionaliteit, waarvan de eerste C libraries al decennia oud zijn en hun oorsprong in UNIX en BSD vinden. De Berkeley Sockets van 1983 zijn daarbij de meest bekende. En zijn daarbij ook weer eens vertaald naar diverse andere programmeertalen. Maar het is code die voornamelijk functioneel is, en dus niet artistiek. En dan zijn auteursrechten lastig te verkrijgen… Lijkt mij.

                Maar OpenAI geeft nog geen garanties dus gebruik blijft op eigen risico. Hetzelfde risico dat je hebt bij Google, StackOverflow en andere sites waar je code kunt vinden…

Geef een reactie

Handige HTML: <a href=""> voor hyperlinks, <blockquote> om te citeren, <UL>/<OL> voor lijsten, en <em> en <strong> voor italics en vet.