Het onderbelichte probleem van dataverzameling in de artificial intelligence

| AE 9913 | Innovatie | 14 reacties

Bewerking/parodie van XKCD, bron https://xkcd.com/303/Jaja, vrijdag wordt machine learning/AI dag, maar ik vond vrAIdag zo’n rare hashtag. Deze week een netelige en vaak onderbelichte kwestie: hoe kom je aan je data? Veel mensen denken dat het bij AI vooral gaat om het bouwen van het netwerk, maar dat is in feite niet meer dan op de “Generate” knop drukken en het ding een nachtje laten stampen. AI als technologie is vrijwel een commodity. Het gaat erom wat je erin stopt, want dat bepaalt voor vrijwel 100% wat eruit komt. En daar zit hem het probleem.

AI en big data lijken als hype hand in hand te zijn opgekomen. En dat is niet gek, want AI is in feite weinig meer dan statistische analyse op grote datasets, en hoe groter de dataset, hoe accurater de uitkomsten van de analyse. Dus als je gigantisch veel data hebt, dan krijg je behoorlijk goede resultaten. Maar hoe kom je aan die data?

Er zijn grofweg twee manieren: je kunt alle data zelf verzamelen, of je kunt datasets van anderen betrekken. De eerste manier is behoorlijk duur en tijdrovend, en werkt eigenlijk alleen bij de grote platforms zoals Facebook die nu eenmaal heel veel mensen hebben die data genereren. Of onderzoeksinstellingen die grootschalige metingen kunnen doen op allerlei fenomenen. Voor veel partijen is er alleen de tweede manier: zie ergens een dataset te pakken te krijgen.

Die tweede manier is nog behoorlijk problematisch. Vanwege rechtenkwesties en natuurlijk de zorg over persoonsgegevens in de data wordt vaak teruggegrepen op publieke datasets. Uit een recent paper blijkt echter dat dit goed kan leiden tot bias in de AI. Zo is er een publieke dataset van 1,6 miljoen interne e-mails uit het controversiële bedrijf Enron, welke vanwege justitieel onderzoek openbaar zijn geworden. Deze zijn een mooie dikke dataset om sentimentanalyse te doen, grammatica te leren herkennen en ga zo maar door. Maar goh, wat voor voorbeeld neem je als je de mails gebruikt van een Texaans bedrijf dat omviel vanwege gigantische fraude?

Andere systemen worden gebouwd op basis van stokoude bronnen, zoals publiekdomeinboeken omdat je dan auteursrechtelijk veilig zit. Maar het doet nogal wat met een systeem of je hem traint op Charles Dickens dan wel Dan Brown (om mevrouw Van der Plas niet weer te noemen 😉 ). Taalgebruik zal verouderd zijn, en vooral: ook hier een grote kans op vooringenomenheid qua wereldbeeld.

En daar zit dus in de kern het probleem: de datasets waar iedereen mee kan werken, zitten scheef en leveren dus geen betrouwbare basis op voor een AI systeem dat aanbevelingen of beslissingen doet. En waar je mee zou moeten werken, zit opgesloten achter auteursrechten of is onbereikbaar omdat de eigenaar het als privé beschouwt.

Arnoud

Sonos-speakers mogelijk onbruikbaar bij weigeren privacyvoorwaarden

| AE 9622 | Innovatie | 28 reacties

Gebruikers die niet instemmen met de nieuwe privacyvoorwaarden van Sonos, riskeren mogelijk dat hun speakers op termijn niet meer werken. Dat meldde Nu.nl eerder deze week. De speakerfabrikant gaat de apparaten voorzien van stemassistent Alexa van AmazonGoogle, en dat vereist een akkoord op privacyvoorwaarden. Wie dat weigert, kan geen updates meer installeren en zal dus op zeker moment functionaliteit verliezen. Ja, dat krijg je er van als je van een producten- naar een dienstenmaatschappij verschuift.

Voor veel mensen is dit nogal een verrassing: koop je een duur apparaat, en krijg je na een jaar of zo te horen dat er ineens allerlei privacy-dingen aan vast zitten waar je mee akkoord moet gaan als je niet wilt blijven zitten met een dure presse-papier. Maar juridisch klopt het, en niet omdat je bij aankoop maar beter de voorwaarden had moeten lezen: een Sonos is een abonnement, geen productaanschaf.

Natuurlijk, dat ding met stekker is een best wel feitelijk object dus dat koop je. Maar dat ding is op zich voor weinig dingen bruikbaar. Daar heb je een account voor nodig, zodat je bijvoorbeeld radiostations kunt ontvangen, een koppeling met Spotify of andere diensten kunt maken en andere muziekbronnen kunt streamen. En daar zit hem de crux: het zwaartepunt van de transactie om de Sonos te krijgen is die dienstverlening, dus wordt die transactie in principe als dienst gezien.

De wet kent al heel wat decennia regels over dienstverlening. Alleen zijn die geschreven voor situaties waarin mensen (of bedrijven met mensen) die diensten leveren. Denk aan schoonmakers, nannies, bezorgdiensten, vuilophaling, onderhoudscontracten en dergelijke. De regels uit de wet zijn dan ook geschreven om die situaties te reguleren. Zo staat er best goed geregeld wanneer een dienstverlener mag opzeggen of hoe en wanneer hij recht heeft op geld.

Wat niet in de wet staat, is hoe de voorwaarden mogen worden gewijzigd. Daar komen mensen onderling wel uit, was de gedachte. Specifiek bij consumentencontracten staat er een en ander op de zwarte en grijze lijsten voor algemene voorwaarden, om hen te beschermen tegen al te eenzijdige voorwaarden van dienstverleners. Kort gezegd komt het erop neer dat je kosteloos van je contract af kunt als men het zomaar ineens helemaal omgooit.

Dat is heel leuk bij een vuilophaaldienst of een schoonmaker, maar bij een Sonos heb je daar weinig aan. Daar wil je juist niet opzeggen, want dan heb je niets meer aan het apparaat. Je wilt eigenlijk juist dat bij afwijzen van de voorwaarden de huidige diensten geleverd blijven, zodat je in ieder geval kunt genieten van de dienst zoals oorspronkelijk afgenomen. Maar daar biedt de wet geen grondslag voor.

Conformiteit van het apparaat dan? Dat doet ineens niet meer wat je ervan mocht verwachten. Daar twijfel ik dus over. Volgens mij is er nog steeds niets mis met het apparaat. De slechte werking of geschonden verwachtingen zitten hem in de dienst die bij het apparaat hoort, en volgens mij kun je dat niet toerekenen aan het apparaat. (Iets juridischer: ik zie de overeenkomst namelijk niet als een koopovereenkomst, maar als een gemengde koop/dienst-overeenkomst met het zwaartepunt op de dienst.)

Nieuw mantra: Je bent geen eigenaar van je data, alle diensten die je koopt mogen zomaar stoppen of wijzigen en apparaten kunnen zomaar onbruikbaar worden. Leuk man, die informatiemaatschappij.

Arnoud

Gastpost: Hoe T-shaped moet je worden als advocaat?

| AE 8841 | Innovatie | 8 reacties

t-shaped-lawyerOmdat ik met vakantie ben, traditiegetrouw een aantal gastblogs. Vandaag advocaat Nine Damsté over de T-shaped lawyer, en die moest ik ook even opzoeken (klik op plaatje voor Het Concept).

De advocatuur en de rechtspraak proberen te moderniseren. Zo worden er in de rechtspraak digitale dossiers toegevoegd, werken veel meer advocatenkantoren papierloos en in the cloud en proberen wij als advocaten afstand te doen van onze geliefde fax. Dat laatste lukt nog niet helemaal. Ook bloggen wij ons rot en kreten wij steeds meer moderne, vaak Engelstalige leuzen uit om onze waar aan de markt te kunnen brengen.

Dit kijken wij af van de giganten van deze wereld. Zo adverteert Coca Cola al jaren met de slogan Open Happiness. U moet toegeven dat dit veel beter klinkt dan “Open Vrolijkheid”. Gek genoeg, en dan terugvertaald naar de frisdrankwereld, adverteren advocatenkantoren nog steeds als volgt: “Wij zijn een grote Frisdrankfabriek. Wij hebben vestigingen in Amerika. Wij werken in een goed team samen waar iedereen wat weet over frisdrank. De een weet wat over doppen, de ander over koolzuur. Dat maakt onze frisdrank érg lekker!”. Kortom: de advocatuur staat nog in de kinderschoenen als het gaat om marketing, profilering en pakkende leuzen. Ik denk dat dat komt omdat het lang verboden was om als advocaat reclame te maken voor de dienstverlening, en het stereotype advocaat – die beschrijf ik zo – misschien niet hip kan zijn. De advocatuur probeert dit besmette beeld van zich af te schudden en lijkt massaal een inhaalslag te maken op marketinggebied. Dat leidt echter tot bijzondere en soms haast aandoenlijke pogingen.

Een ‘normale’ advocaat – het stereotype – is iemand met behoorlijk wat vlieguren, een strenge blik, grijze haren en een gouden plakkaat aan de deur waarop zijn titels staan vermeld. Deze advocaat wordt inmiddels verdrongen door de “moderne jurist(e)”, waarvan ik nog altijd zelf niet precies weet wat het betekent. Ik weet wél dat een moderne jurist(e) ook wel een T-shaped lawyer wordt genoemd die werkzaam is binnen de dynamische wereld van de advocatuur 2.0 of zelfs 3.0. Ook van deze laatste definitie moet ik u een precieze uitleg schuldig blijven. Maar het klinkt erg smooth, en wij proberen allemaal zo’n T-shaped lawyer te zijn. Maar kunnen wij dat eigenlijk wel? En wat is het eigenlijk?

Enkele mooie aspecten van mijn beroep vind ik de diepgewortelde tradities, het dragen van een toga en het gebruik van moeilijke woorden. Ook de balie, de gedragsregels en het aanspreken van collegae met “amice” en “amica” kan ik van genieten. Het imago van de strafpleiter en de geur van net gestoomde befjes. Heerlijk. Ik weet dat er ook velen met mij zijn.

Die T-shaped lawyer is anders. Moe van de tradities en die toga hoeft hij ook bijna niet meer aan. Mediation, oftewel het oplossen van een probleem zonder rechter, is het nieuwe procederen. De T-shaped lawyer eet superfoods en kan meer dan een probleem juridisch inkaderen, overtuigen en redeneren. De T-shaped lawyer zou meer over de culture achtergrond van zijn klant weten, overal zijn kantoor kunnen opstarten vanuit zijn MacBook en zou een halve psycholoog zijn. Nee. Niet alle advocaten kunnen een T-shaped lawyer zijn. Rechters zijn er ook nog niet aan toe. Zo heb ik laatst een van mijn zittingen op een IPad gedaan waardoor ik geen dik procesdossier op de tafel hoefde te leggen (die ik overigens altijd in een rode map doe als ik hem wel bij me heb, noem dat vooral ook traditie!). Ik voelde me door de blik van de rechter betrapt op afkijken tijdens een tentamen waar geen mobieltjes mee de zaal in mogen.

Dan nog het bloggen. Binnen de advocatuur zijn we massaal aan het bloggen geslagen. Ja, ik ook. Maar ik blogde ook al voordat ik advocate werd. Contentmarketing (kennis delen) is hip in de advocatuur en in theorie zou het goed kunnen werken. Maar ook daar zijn we niet allemaal even goed in.

Mijn uitgangspunt voor het bloggen zijn Jip en Janneke. Ja: dit klinkt erg flauw maar dat is het niet. Juridisch schrijven in processtukken (oh heelijk!) is echt anders dan bloggen. De grootste valkuil wat mij betreft is dan ook dat wij als advocaten nog veel te veel jargon (daar ga ik al: vaktaal), wetsartikelen en rechtspraak in de blogs vermelden. Dat snappen Jip en Janneke niet. En moeder is er ook niet om het ze uit te leggen. Daarbij ontbreekt het ons vaak aan tijd waardoor we niet regelmatig uploaden. Het break point voor contentmarketing en een hoge ranking met de kantoorwebsite in Google. Conclusie: ook daar moeten wij nog groeien. Als het ooit echt lukt.

Ik noem mijzelf niet graag T-shaped lawyer geloof ik. Ik ben gewoon een (moderne) advocaat. Die iets van computers weet, enzo. Ik zie het als mijn taak om het verschil tussen een domeinnaam en een website bij de rechtelijk macht door te laten dringen. Toch ben ik wel gaan vloggen om mijn werk als advocaat op de gevoelige plaat vast te leggen. Regelmatig heb ik met mezelf zoveel lol om de starende blikken van colleage als wij ons op een sjiek advocatenfeestje bevinden en ik tegen het opklapbaar schermpje van mijn vlogcamera klets. Laat die stereoptye advocaten nog maar even bestaan. En vooruit, de fax ook.

Nine Bennink, advocate IE/IT bij Damsté advocaten – notarissen. Salsa, lippenstift en vlogs onder de naam Miss IP op Youtube.

Ministerie: apparaten zoals Oxboards mogen niet de openbare weg op

| AE 8239 | Innovatie | 21 reacties

Apparaten zoals Oxboards, waarop gebruikers zich voortbewegen zonder stuur, zijn in Nederland verboden op de openbare weg. Dat las ik bij Tweakers op gezag van het ministerie van Infrastructuur en Milieu. Deze apparaten vallen een beetje buiten de definities die de Wegenverkeerswet en aanverwante regelgeving kent, met name als het gaat om de aanwezigheid van… Lees verder

Denk je een tip te geven, krijg je een knorrige bedrijfsjurist op je dak

| AE 8093 | Aansprakelijkheid, Grappig | 19 reacties

Als je de directeur van AT&T een tip durft te geven, dan krijg je een knorrige bedrijfsjurist op je dak, las ik bij Ars Technica (dank, tipgevers!). “AT&T has a policy of not entertaining unsolicited offers to adopt, analyze, develop, license or purchase third-party intellectual property… from members of the general public,” zo klonk het… Lees verder

Gastpost: Mosterd na de maaltijd voor gamers

| AE 3095 | Auteursrecht, Innovatie | 19 reacties

Omdat ik met vakantie ben deze week nog enkele gastblogs. Vandaag een gastblog van Tim van Maarseveld over de gamingindustrie en hoe deze (in tegenstelling tot zekere andere contentindustrieën) wél snel omgaat met veranderingen in de markt. Arnoud heeft er eerder over geschreven op zijn blog: de volgens ITenRecht baanbrekende uitspraak van het Hof van… Lees verder

Moeha: “Pinnen buiten Europa vastleggen is mijn vastgelegde idee”

| AE 3008 | Innovatie | 16 reacties

Oh echt: de antiskimmaatregel van de Rabobank is mogelijk plagiaat, meldde Nu.nl woensdag. Bij het FD had ene Jan Meurs geklaagd dat zijn “juridisch vastgelegde idee” nageaapt zou zijn door de Rabobank. Hij gaat via een advocaat de bank aansprakelijk stellen, hoewel niet wordt gemeld welk bedrag. Ik ben héél benieuwd wat de juridische grondslag… Lees verder

Netneutraliteit en cookiewet zijn een feit

| AE 3009 | Innovatie, Netneutraliteit | 49 reacties

Nederland is netneutraal, juichte Bits of Freedom gisteren. De Eerste Kamer besliste gisteren dat het in Nederland wettelijk verboden gaat worden om internettoegang te filteren of beperken. Ook is de bij marketeers omstreden cookiewet aangenomen (die was deel van hetzelfde wetsvoorstel namelijk). Voor cookies is nu ondubbelzinnige browsergebaseerde impliciete uitdrukkelijke (argh) toestemming nodig en tenzij… Lees verder