Google-medewerkers luisteren Nederlandse gesprekken mee, is dat erg?

Geplaatst op 17 juli 201915 juli 2019 in Informatiemaatschappij, 16 reacties

Medewerkers van Google luisteren gesprekken mee die Nederlanders voeren met hun slimme Google-assistent, zonder dat Google daar vooraf duidelijkheid over geeft. Dat meldde de NOS vorige week. Het gaat om fragmenten van gesprekken die door de AI-assistent niet werden verstaan; een mens maakt dan een transcriptie waar de AI van kan leren. Vanuit technisch perspectief volkomen normaal, als een AI een fout maakt dan is menselijk bijleren de enige manier om dat op te lossen. En zo te lezen gaat het om fragmenten zonder verdere koppeling aan Google ID of feedback naar je interesseprofiel. Desondanks een relletje, ik denk omdat mensen zich nu beseffen dat zo’n kastje niet gewoon een slim ding is dat je verstaat, maar een microfoon met héle lange kabel waar gewoon mensen een koptelefoon bij opzetten. Is dat nou erg?

De zaak is aan het rollen gekomen omdat een Google-medewerkers fragmenten deelde met de NOS, omdat “het belangrijk is dat mensen beseffen dat er mensen meeluisteren”, zo stelt de anonieme Google-medewerker. Nieuwswaardig was dat zeker: een hoop mensen blijkt ineens zeer verbaasd en geschokt dat er dus kennelijk meegeluisterd wordt.

Maar zoals gezegd, “meeluisteren” is een groot woord. Er zit niet ineens een man met gleufhoed en koptelefoon de hele dag gezellig te luisteren. Er worden fragmenten geüpload naar Google waar medewerkers dan een transcriptie van maken, zodat de spraakherkenning-engine opnieuw getraind kan worden. Daarbij gaat het echt alleen om algemene, veel gebruikte termen – met de bijnaam voor je geliefde of de geluiden van het ontbijt kan Google Home toch niets.

Maar ja, meeluisteren is het. Want er is dus wel een mens dat dat gesprek beluistert, ook al is dat met complete desinteresse en uitsluitend gericht op een betere herkenning van “uitsluitend” met Goois of Limburgs accent, of iets dergelijks. Ik snap dus desondanks de ophef wel. Je koopt zo’n kastje inderdaad omdat je wil dat er iemand meeluistert en dingen doet met wat je zegt – dat is de sales pitch van het apparaat. Maar de ‘iemand’ is dan een kastje, een apparaatje, een digitale butler. Niet een medewerker. In een winkel vind ik het ook fijn om de prijs van een pot pindakaas te kunnen scannen, maar dan wil ik niet een medewerker achter me hebben staan die zegt “oh de pot van een liter is in de bonus”. Of zelfs maar die glazig meekijkt. Dat is niet de afspraak bij het gebruik van zo’n apparaat.

Mag dat? De NOS vertelt:

Mensen die Google Home of Assistent installeren worden er niet op gewezen dat mensen de spraakopdrachten af kunnen luisteren. Wel staat in de algemene voorwaarden van Google dat het bedrijf “audiogegevens” verzamelt. Dat deze kunnen worden afgeluisterd door mensen, en dat er per ongeluk ook andere gesprekken kunnen worden opgeslagen, blijft onvermeld.

De juridische discussie is dan, is hiermee mensen “duidelijk en in eenvoudige taal” uitgelegd dat dit kon gebeuren? Ja zal Google zeggen, het staat in de privacyverklaring en die moet je gewoon even lezen. Plus je weet dat die apparaten meeluisteren dus dan is het raar om ineens te zeggen, ik wilde niet dat hij meeluisterde.

Hier wreekt zich dan het verschil tussen juridische compliance en de praktijk. Ik geloof graag dat die zin over audiogegevens verzamelen voldoet aan taalniveau B2 van het Europees Referentiekader Talen en dus “duidelijk en eenvoudig” is, in de zin dat mensen de term “audiogegevens” kennen. Maar het gaat natuurlijk om de implicaties, kunnen overzien hoe ver het gaat met dat verwerken van audiogegevens. En dat is waar de ophef vandaan komt, ook bij mensen die superveel delen op social media (de standaard tegenwerping als mensen bij Google klagen over privacy), je hebt een bepaalde verwachting van privacy en die wordt geschonden.

Arnoud

16 reacties

Ed schreef:

17 juli 2019 om 08:49

Want er is dus wel een mens dat dat gesprek beluistert, ook al is dat met complete desinteresse en uitsluitend gericht op een betere herkenning van “uitsluitend” met Goois of Limburgs accent, of iets dergelijks.

Ik denk dat dit echt veel te kort door de bocht is. Mensen zijn van nature nieuwsgierig, ook medewerkers van google, dus het is volstrekt voorstelbaar dat deze medewerkers acteren op het geen wat ze horen. In het extreme geval doen ze dat direct, maar in het meest voor de hand liggende geval gewoon door sappige verhalen tegen naasten te vertellen, die het vervolgens ook weer doorvertellen. En voor dat je het weet zijn er tientallen mensen in Nederland die weten van je avontuurtje met die escort dame verkleed als clown.

En dan zal google vast allerlei policies hebben dat medewerkers niets mogen delen, maar als mensen een sappig verhalen horen delen ze het nou eenmaal.

Beantwoorden

Nuttige reactie, +1! (2)
1. werkbij schreef:
  
  17 juli 2019 om 09:06
  
  Dingen als LOVEINT hebben bewezen dat dat inderdaad een reeël risico is. En als ik kijk in mijn kennissenkring, zijn er inderdaad genoeg mensen die denken een smakelijk verhaal door te kunnen vertellen in de trant van: “wat ik nou toch weer gehoord heb…” (je weet dan wel meteen aan wie je geen persoonlijke zaken moet vertellen…)
  
  Beantwoorden
  
  Nuttige reactie, +1! (1)
2. Vistaus schreef:
  
  20 juli 2019 om 12:40
  
  En wat als er medewerkers zijn die de stem herkennen? Ongetwijfeld zullen er ook fragmenten voorbijkomen van mensen die zij persoonlijk kennen.
  
  Beantwoorden
  
  Nuttige reactie, +1!
Wim schreef:

17 juli 2019 om 09:27

Mensen zijn van nature nieuwsgierig (Zie de ophef die er is omdat in het Haga ziekenhuis tientallen mensen in het dossier van Barbie hebben zitten neuzen). Ik zou wat dat betreft me best wel zorgen maken als ik zo’n Google of andere digitale butler zou hebben.

Beantwoorden

Nuttige reactie, +1! (2)
hAl schreef:

17 juli 2019 om 09:39

Als we er vanuit gaan dat algemene voorwaarden geldig zijn (desnoods na aanpassing). Is het dan gewoon legaal om dit te doen ?

Google kan namelijk ook gewoon andere methodes gebruiken zoals inhuren van meer mensen met afwijkende stemmen en accenten voor praktijktesten. De huidige methode is gewoon een goedkope manier om uit de praktijk complexe testsamples te krijgen.

Ook kan Google een hulplijn creeren op het internet waar mensen zinnen kunnen inspreken die hun Google home niet begrijpt. Dat is niet privacy gevoelig omdat mensen dan weten dat daar door mensen naar geluisterd gaat worden.

en er zijn waarschijnlijk nog vele alternatieve opties voor Google naast de twee die ik in één minuut bedacht Dergelijke alternatieven lijken me veel beter voor de privacy dan wat Google nu doet.

Beantwoorden

Nuttige reactie, +1! (4)
1. Vistaus schreef:
  
  20 juli 2019 om 12:45
  
  Dit doet me sterk denken aan, wie was het ook alweer (IBM?), die willekeurige foto’s van Flickr plukte om de gezichtsherkenning van AI’s te verbeteren.
  
  “Ook kan Google een hulplijn creeren op het internet waar mensen zinnen kunnen inspreken die hun Google home niet begrijpt. Dat is niet privacy gevoelig omdat mensen dan weten dat daar door mensen naar geluisterd gaat worden.”
  
  Dat vind ik inderdaad een topidee!
  
  Beantwoorden
  
  Nuttige reactie, +1!
Sanne de Vries schreef:

17 juli 2019 om 09:39

Wat het ingewikkelder maakt, is dat Google de audio niet alleen opneemt als de gebruiker bewust ‘op de knop drukt’ met de stemopdracht (‘OK Google, …’), maar dat die knop ook ‘per ongeluk’ ingedrukt kan worden door achtergrondgeluiden, technische fouten etc. De microfoon staat immers altijd aan. Juist in die gevallen kan Google de boodschap slecht geautomatiseerd begrijpen, dus juist die onbedoelde opnamen worden door mensen beluisterd. Daar is het verschil tussen de verwachte en feitelijke privacy het grootst.

Beantwoorden

Nuttige reactie, +1! (6)
Jan schreef:

17 juli 2019 om 10:37

‘ Zich beseffen ‘ https://onzetaal.nl/taaladvies/beseffen-zich-beseffen Sorry voor mijn taal gezeur. Bedankt voor dit duidelijke artikel.

Beantwoorden

Nuttige reactie, +1! (1)
Reiska schreef:

17 juli 2019 om 10:51

Mee luisteren vind ik nog niet eens zo’n erge inbreuk op mijn privacy (als ik op straat met iemand praat loop ik ook het risico dat iemand (gedeeltes) van het gesprek opvangt) maar het feit dat ze blijkbaar alles ook nog eens opnemen en bewaren (voor hoelang?) vind ik veel ernstiger.

Kan je via Google Takeout ook al deze fragmenten terugluisteren?

Beantwoorden

Nuttige reactie, +1! (3)
Guido Jansen schreef:

17 juli 2019 om 12:33

Tsja, ik vind het wel echt enorm naief als mensen een always-on microfoon die continue verbonden is met het internet in huis halen en dan denken dat er géén audiofragmenten op een extern systeem zouden belanden die dus ook door andere mensen beluisterd zouden kunnen worden. Wat dacht je dan dat er zou gebeuren? Die systemen moeten met internet verbonden zijn anders zijn ze enorm beperkt en voor de meeste doeleinden vrij zinloos. En die systemen moeten getrained worden en daar zal vooralsnog altijd een persoon aan te pas moeten komen om bepaalde keuzes te maken en de algoritmes bij te sturen. Dat is exact mijn verwachting wanneer ik zo’n apparaat in huis zou halen of wanneer ik een functie als Google assistant of Apple siri aan zou zetten (en zou toestaan continue te luisteren naar potentiele activatie woorden). En ook de reden dat ik geen smart home speaker heb :).

(PS ja ik heb uiteraard wel een (anroid) smartphone en ja die kan dat in theorie ook ondanks dat ik die functionaliteit uit heb staan maar dat wil nog niet zeggen dat ik er maar een extra always-on mic bij wil hebben)

Beantwoorden

Nuttige reactie, +1! (1)
Simon Donkers schreef:

17 juli 2019 om 13:41

Kan Google dit niet simpel oplossen met een vraag bij het eerste aanmelden ala:
[X] Help Google Assistent beter te maken door automatisch gebruiksdata en crashrapporten naar Google te verzenden
Hiermee communiceer je duidelijk aan de gebruiker dat er data gedeeld wordt en geef je een opt-in/out. Dit doen ze al bij andere diensten dus het verbaast me dat ze dat hier niet ook doen.

Beantwoorden

Nuttige reactie, +1! (2)
1. Arnoud Engelfriet schreef:
  
  17 juli 2019 om 13:48
  
  Zou de gemiddelde klant van Google hieruit begrijpen dat de Assistant 24/7 meeluistert en alle onduidelijke fragmenten door een mens uit laat typen?
  
  Volgens mij moet het zo (en met vinkje dus initieel uit): Let op: Google Assistent luistert continu in de kamer, stuurt alles live naar Google zodat het bij Google herkend kan worden en de Assistent kan doen wat u zegt. Mensen luisteren niet mee, tenzij u onderstaand vinkje aanzet: [ ] Ik stem ermee in dat niet-verstane gespreksfragmenten door een menselijke medewerker van Google worden uitgeluisterd ter verbetering van de Assistent-functie.
  
  Een vinkje voor meeluisteren is niet nodig want dit is noodzakelijk voor de dienst die de Assistent levert. Maar het verbeteren is niet noodzakelijk en vereist dus opt-in. Gezien het privékarakter van de niet-verstane gesprekken denk ik niet dat een legitiem belang de grondslag kan zijn, dus het mag geen opt-out worden.
  
  Beantwoorden
  
  Nuttige reactie, +1! (3)
  1. hAl schreef:
    
    17 juli 2019 om 14:30
    
    Dat lijkt me een juist interpretatie maar ik denk dat Google daar verre van zal blijven met schimmige teksten om te vermijden dat opt-in nodig is.
    
    Beantwoorden
    
    Nuttige reactie, +1! (1)
Peter S schreef:

17 juli 2019 om 17:51

Je stelt Alexa of Google een vraag en dan komt er een antwoord. Ik denk dat je dat dus kunt zien als een telecommunicatiedienst. Als die redenering houdbaar is, dan staat dit alles op gespannen voet met Artikel 11.2a Telecommunicatiewet.

Beantwoorden

Nuttige reactie, +1!
1. Arnoud Engelfriet schreef:
  
  17 juli 2019 om 19:39
  
  Nee, dit valt onder het kopje diensten van de informatiemaatschappij (art. 3:15d BW). Grofweg is het verschil of het gaat om het routeren van signalen (telecommunicatie) of het transporteren van informatie (DvdI).
  
  Beantwoorden
  
  Nuttige reactie, +1! (1)
C. de Vries schreef:

22 juli 2019 om 14:04

De woordkeus “ophef” vind ik ongelukkig. Het brengt een eufemisme ten tonele dat vergelijkbaar lijkt te zijn met “een storm in een glas water”. De aanname er achter is dat de grote massa van gebruikers een behoorlijke mate van inzicht bezitten wat zij eigenlijk kopen en wat de functionaliteiten omvatten. Het merendeel van de mensen echter zijn echter gebruikers zonder verregaand inzicht. De overheid dient de grote massa te beschermen tegen de slimme multinationals, maar eigenlijk ook wel tegen de overheden zelf. Het is om die reden dat elk ‘intelligent’ systeem standaard de ‘opt-out’ functie actief heeft staan en dat er een weloverwogen besluit moet worden genomen om de eigen privacy (geheel of gedeeltelijk) op te heffen.

Dat dit niet standaard gebruik is, ‘built-in design & security’ is het gevolg van de koehandel tussen overheden en multinationals c.q. grote nationale organisaties. Het publiek, de gebruiker is vrijmarkt, de commercie het middel en de prijs is de winst voor overheid (belastingen) en bedrijfsleven (overwinsten & metadata). Hier zit m.i. het fundamenteel verkeerde uitgangspunt binnen onze samenleving (democratisch of niet).

Beantwoorden

Nuttige reactie, +1!

16 reacties

Geef een reactie Reactie annuleren