Google-medewerkers luisteren Nederlandse gesprekken mee, is dat erg?

Medewerkers van Google luisteren gesprekken mee die Nederlanders voeren met hun slimme Google-assistent, zonder dat Google daar vooraf duidelijkheid over geeft. Dat meldde de NOS vorige week. Het gaat om fragmenten van gesprekken die door de AI-assistent niet werden verstaan; een mens maakt dan een transcriptie waar de AI van kan leren. Vanuit technisch perspectief volkomen normaal, als een AI een fout maakt dan is menselijk bijleren de enige manier om dat op te lossen. En zo te lezen gaat het om fragmenten zonder verdere koppeling aan Google ID of feedback naar je interesseprofiel. Desondanks een relletje, ik denk omdat mensen zich nu beseffen dat zo’n kastje niet gewoon een slim ding is dat je verstaat, maar een microfoon met héle lange kabel waar gewoon mensen een koptelefoon bij opzetten. Is dat nou erg?

De zaak is aan het rollen gekomen omdat een Google-medewerkers fragmenten deelde met de NOS, omdat “het belangrijk is dat mensen beseffen dat er mensen meeluisteren”, zo stelt de anonieme Google-medewerker. Nieuwswaardig was dat zeker: een hoop mensen blijkt ineens zeer verbaasd en geschokt dat er dus kennelijk meegeluisterd wordt.

Maar zoals gezegd, “meeluisteren” is een groot woord. Er zit niet ineens een man met gleufhoed en koptelefoon de hele dag gezellig te luisteren. Er worden fragmenten geüpload naar Google waar medewerkers dan een transcriptie van maken, zodat de spraakherkenning-engine opnieuw getraind kan worden. Daarbij gaat het echt alleen om algemene, veel gebruikte termen – met de bijnaam voor je geliefde of de geluiden van het ontbijt kan Google Home toch niets.

Maar ja, meeluisteren is het. Want er is dus wel een mens dat dat gesprek beluistert, ook al is dat met complete desinteresse en uitsluitend gericht op een betere herkenning van “uitsluitend” met Goois of Limburgs accent, of iets dergelijks. Ik snap dus desondanks de ophef wel. Je koopt zo’n kastje inderdaad omdat je wil dat er iemand meeluistert en dingen doet met wat je zegt – dat is de sales pitch van het apparaat. Maar de ‘iemand’ is dan een kastje, een apparaatje, een digitale butler. Niet een medewerker. In een winkel vind ik het ook fijn om de prijs van een pot pindakaas te kunnen scannen, maar dan wil ik niet een medewerker achter me hebben staan die zegt “oh de pot van een liter is in de bonus”. Of zelfs maar die glazig meekijkt. Dat is niet de afspraak bij het gebruik van zo’n apparaat.

Mag dat? De NOS vertelt:

Mensen die Google Home of Assistent installeren worden er niet op gewezen dat mensen de spraakopdrachten af kunnen luisteren. Wel staat in de algemene voorwaarden van Google dat het bedrijf “audiogegevens” verzamelt. Dat deze kunnen worden afgeluisterd door mensen, en dat er per ongeluk ook andere gesprekken kunnen worden opgeslagen, blijft onvermeld.

De juridische discussie is dan, is hiermee mensen “duidelijk en in eenvoudige taal” uitgelegd dat dit kon gebeuren? Ja zal Google zeggen, het staat in de privacyverklaring en die moet je gewoon even lezen. Plus je weet dat die apparaten meeluisteren dus dan is het raar om ineens te zeggen, ik wilde niet dat hij meeluisterde.

Hier wreekt zich dan het verschil tussen juridische compliance en de praktijk. Ik geloof graag dat die zin over audiogegevens verzamelen voldoet aan taalniveau B2 van het Europees Referentiekader Talen en dus “duidelijk en eenvoudig” is, in de zin dat mensen de term “audiogegevens” kennen. Maar het gaat natuurlijk om de implicaties, kunnen overzien hoe ver het gaat met dat verwerken van audiogegevens. En dat is waar de ophef vandaan komt, ook bij mensen die superveel delen op social media (de standaard tegenwerping als mensen bij Google klagen over privacy), je hebt een bepaalde verwachting van privacy en die wordt geschonden.

Arnoud

16 reacties

  1. Want er is dus wel een mens dat dat gesprek beluistert, ook al is dat met complete desinteresse en uitsluitend gericht op een betere herkenning van “uitsluitend” met Goois of Limburgs accent, of iets dergelijks.

    Ik denk dat dit echt veel te kort door de bocht is. Mensen zijn van nature nieuwsgierig, ook medewerkers van google, dus het is volstrekt voorstelbaar dat deze medewerkers acteren op het geen wat ze horen. In het extreme geval doen ze dat direct, maar in het meest voor de hand liggende geval gewoon door sappige verhalen tegen naasten te vertellen, die het vervolgens ook weer doorvertellen. En voor dat je het weet zijn er tientallen mensen in Nederland die weten van je avontuurtje met die escort dame verkleed als clown.

    En dan zal google vast allerlei policies hebben dat medewerkers niets mogen delen, maar als mensen een sappig verhalen horen delen ze het nou eenmaal.

    1. Dingen als LOVEINT hebben bewezen dat dat inderdaad een reeël risico is. En als ik kijk in mijn kennissenkring, zijn er inderdaad genoeg mensen die denken een smakelijk verhaal door te kunnen vertellen in de trant van: “wat ik nou toch weer gehoord heb…” (je weet dan wel meteen aan wie je geen persoonlijke zaken moet vertellen…)

  2. Mensen zijn van nature nieuwsgierig (Zie de ophef die er is omdat in het Haga ziekenhuis tientallen mensen in het dossier van Barbie hebben zitten neuzen). Ik zou wat dat betreft me best wel zorgen maken als ik zo’n Google of andere digitale butler zou hebben.

  3. Als we er vanuit gaan dat algemene voorwaarden geldig zijn (desnoods na aanpassing). Is het dan gewoon legaal om dit te doen ?

    Google kan namelijk ook gewoon andere methodes gebruiken zoals inhuren van meer mensen met afwijkende stemmen en accenten voor praktijktesten. De huidige methode is gewoon een goedkope manier om uit de praktijk complexe testsamples te krijgen.

    Ook kan Google een hulplijn creeren op het internet waar mensen zinnen kunnen inspreken die hun Google home niet begrijpt. Dat is niet privacy gevoelig omdat mensen dan weten dat daar door mensen naar geluisterd gaat worden.

    en er zijn waarschijnlijk nog vele alternatieve opties voor Google naast de twee die ik in één minuut bedacht Dergelijke alternatieven lijken me veel beter voor de privacy dan wat Google nu doet.

    1. Dit doet me sterk denken aan, wie was het ook alweer (IBM?), die willekeurige foto’s van Flickr plukte om de gezichtsherkenning van AI’s te verbeteren.

      “Ook kan Google een hulplijn creeren op het internet waar mensen zinnen kunnen inspreken die hun Google home niet begrijpt. Dat is niet privacy gevoelig omdat mensen dan weten dat daar door mensen naar geluisterd gaat worden.”

      Dat vind ik inderdaad een topidee!

  4. Wat het ingewikkelder maakt, is dat Google de audio niet alleen opneemt als de gebruiker bewust ‘op de knop drukt’ met de stemopdracht (‘OK Google, …’), maar dat die knop ook ‘per ongeluk’ ingedrukt kan worden door achtergrondgeluiden, technische fouten etc. De microfoon staat immers altijd aan. Juist in die gevallen kan Google de boodschap slecht geautomatiseerd begrijpen, dus juist die onbedoelde opnamen worden door mensen beluisterd. Daar is het verschil tussen de verwachte en feitelijke privacy het grootst.

  5. Mee luisteren vind ik nog niet eens zo’n erge inbreuk op mijn privacy (als ik op straat met iemand praat loop ik ook het risico dat iemand (gedeeltes) van het gesprek opvangt) maar het feit dat ze blijkbaar alles ook nog eens opnemen en bewaren (voor hoelang?) vind ik veel ernstiger.

    Kan je via Google Takeout ook al deze fragmenten terugluisteren?

  6. Tsja, ik vind het wel echt enorm naief als mensen een always-on microfoon die continue verbonden is met het internet in huis halen en dan denken dat er géén audiofragmenten op een extern systeem zouden belanden die dus ook door andere mensen beluisterd zouden kunnen worden. Wat dacht je dan dat er zou gebeuren? Die systemen moeten met internet verbonden zijn anders zijn ze enorm beperkt en voor de meeste doeleinden vrij zinloos. En die systemen moeten getrained worden en daar zal vooralsnog altijd een persoon aan te pas moeten komen om bepaalde keuzes te maken en de algoritmes bij te sturen. Dat is exact mijn verwachting wanneer ik zo’n apparaat in huis zou halen of wanneer ik een functie als Google assistant of Apple siri aan zou zetten (en zou toestaan continue te luisteren naar potentiele activatie woorden). En ook de reden dat ik geen smart home speaker heb :).

    (PS ja ik heb uiteraard wel een (anroid) smartphone en ja die kan dat in theorie ook ondanks dat ik die functionaliteit uit heb staan maar dat wil nog niet zeggen dat ik er maar een extra always-on mic bij wil hebben)

  7. Kan Google dit niet simpel oplossen met een vraag bij het eerste aanmelden ala:

    [X] Help Google Assistent beter te maken door automatisch gebruiksdata en crashrapporten naar Google te verzenden
    Hiermee communiceer je duidelijk aan de gebruiker dat er data gedeeld wordt en geef je een opt-in/out. Dit doen ze al bij andere diensten dus het verbaast me dat ze dat hier niet ook doen.

    1. Zou de gemiddelde klant van Google hieruit begrijpen dat de Assistant 24/7 meeluistert en alle onduidelijke fragmenten door een mens uit laat typen?

      Volgens mij moet het zo (en met vinkje dus initieel uit): Let op: Google Assistent luistert continu in de kamer, stuurt alles live naar Google zodat het bij Google herkend kan worden en de Assistent kan doen wat u zegt. Mensen luisteren niet mee, tenzij u onderstaand vinkje aanzet: [ ] Ik stem ermee in dat niet-verstane gespreksfragmenten door een menselijke medewerker van Google worden uitgeluisterd ter verbetering van de Assistent-functie.

      Een vinkje voor meeluisteren is niet nodig want dit is noodzakelijk voor de dienst die de Assistent levert. Maar het verbeteren is niet noodzakelijk en vereist dus opt-in. Gezien het privékarakter van de niet-verstane gesprekken denk ik niet dat een legitiem belang de grondslag kan zijn, dus het mag geen opt-out worden.

  8. De woordkeus “ophef” vind ik ongelukkig. Het brengt een eufemisme ten tonele dat vergelijkbaar lijkt te zijn met “een storm in een glas water”. De aanname er achter is dat de grote massa van gebruikers een behoorlijke mate van inzicht bezitten wat zij eigenlijk kopen en wat de functionaliteiten omvatten. Het merendeel van de mensen echter zijn echter gebruikers zonder verregaand inzicht. De overheid dient de grote massa te beschermen tegen de slimme multinationals, maar eigenlijk ook wel tegen de overheden zelf. Het is om die reden dat elk ‘intelligent’ systeem standaard de ‘opt-out’ functie actief heeft staan en dat er een weloverwogen besluit moet worden genomen om de eigen privacy (geheel of gedeeltelijk) op te heffen.

    Dat dit niet standaard gebruik is, ‘built-in design & security’ is het gevolg van de koehandel tussen overheden en multinationals c.q. grote nationale organisaties. Het publiek, de gebruiker is vrijmarkt, de commercie het middel en de prijs is de winst voor overheid (belastingen) en bedrijfsleven (overwinsten & metadata). Hier zit m.i. het fundamenteel verkeerde uitgangspunt binnen onze samenleving (democratisch of niet).

Geef een reactie

Handige HTML: <a href=""> voor hyperlinks, <blockquote> om te citeren, <UL>/<OL> voor lijsten, en <em> en <strong> voor italics en vet.