Soms wilt u snel antwoord, maar heeft u geen tijd om alle benodigde informatie bij elkaar te zoeken. Search doet het werk voor u met AI Overviews. Met die marketingblaat maakte Google onlangs bekend dat haar zoekdienst AI gaat krijgen: deze verwerkt resultaten tot een mooi klinkend verhaal. Wat leidt tot de juridische vraag, mag dat eigenlijk wel?
Technisch gezien is “AI Overviews” niet meer dan een herziening van het resultaatscherm. In plaats van een lijst met webpagina’s neemt Google de daarop gevonden informatie en laat een genAI systeem daar een verhaaltje van maken. Dat lijkt vooral handig voor een snel overzicht en het opnemen van de informatie.
Er zit echter een fundamenteel verschil met de ouderwetse lijst. Waar die lijst niet meer doet dan suggereren waar je heen kan gaan, met bij wijze van citaat een paar mogelijk relevante frases, geeft dit verhaaltje al direct het antwoord. Doorklikken is daarmee niet meer nodig.
Dit wringt, omdat zoekmachines altijd juist vanwege die quid pro quo van het aanleveren van bezoekers in ruil voor het mogen scrapen van content als soort-van-legaal zijn gezien onder het auteursrecht.
Een genAI-zoekmachine haalt echter die balans onderuit. Wel alle content binnenhalen, maar niet als hoofdregel mensen doorverwijzen. Dat kost de contentaanbieders dus alleen maar, terwijl ze er niets (of veel minder) voor terugkrijgen.
Alleen: dit is vrij ongrijpbaar, juridisch gezien. Er is nooit letterlijk een uitspraak over geweest. We hebben wel zaken zoals het Zoekallehuizen-arrest (huizenadvertenties) gehad, maar daar ging het om het vertonen van stukjes informatie in zoekresultaatpagina’s, niet om het onderliggende scrapen en opbouwen van een databank met heel internet.
Natuurlijk, we hebben ondertussen diverse nieuwe wetten – de AI Act (bijna), de Digital Markets Act, de nodige aanpassingen aan de Auteurswet, enzovoorts. Maar geen daarvan bevat iets waarmee deze transformatie van zoekresultaten aan te pakken is.
Ja, ik ben een tikje cynisch maar sowieso erger ik me al geruime tijd aan de achteruitgang van de ooit bliksemsnelle en verrassend goed werkende zoekmachine. Als ik dan óók nog de bronsites moet gaan vissen uit een mooi klinkend verhaal dan houdt het wel een beetje op hiermee.
Arnoud
Niet zo’n problemen met zo’n verhaaltje, maar wel met de controleerbaarheid van de gegevens. Ik denk dat ze net zoals in Wikipedia, een streng beleid moeten invoeren om wel degelijk de referenties naar primaire bronnen op te nemen.
Wat we nu ook zien gebeuren, en waar ik me echt zorgen om maak is dat het Internet in zeer hoog tempo wordt volgepompt met door AI gegenereerde prut. Hierdoor wordt het van steeds groter belang dat primaire bronnen goed als dusdanig herkenbaar zijn. Ik denk niet dat je dat met auteursrecht gaat oplossen: ik zie hier veel meer een rol voor “uitgevers” (in de ruime zin van het woord) en hun merkrechten, die daarmee certificeren dat het onderliggende materiaal origineel en valide is, en zo mensen gaan helpen het kaf van het koren te scheiden.
Het toevoegen van bronnen is niet zo’n grote uitdaging. Het probleem zit hem meer in of de bronnen wel zeggen dat de AI beweert. Wikipedia heeft ook {{Failed verification}}s maar daar heb je mensen die dat nalezen én een systeem om een correctie in vast te leggen. Google heeft niet eens een feedbackknop, laat staan dat ze de AI bijtrainen als ik zeg “in je bron staat niet X maar Y”.
Zoek eens in Google op “Willemijn Veenhoven” (en zie hoe een foto van Sophie Hilbrand verschijnt). En dat is niet het enige wat mis gaat. Ik schat dat in zeker een kwart van al deze mooie AI-summaries van Google een grote fout zit.
Met zo’n zoekmachine heb je geen desinformatie meer nodig!
Als de resultaten door AI zijn gegenereerd, is er vziw. geen sprake van auteursrecht erop. Ook is er geen databankenrecht aan de orde. Zou dan iedereen een ad-loze schil over de zoekmachine kunnen leggen, of zelfs een met eigen ads? Dan zal Google er al snel geen zin meer in hebben. Of heeft Google alsnog grondslagen om dat te verbieden, naast proberen het technisch te blokkeren?
Google blokkeert technisch niet zoveel, tenzij het wel heel bont wordt. Als je iets doet dat Google liever niet heeft (zoals Firefox of een VPN gebruiken), zorgt Google liever voor een slechtere ervaring. De site trager maken, onderdelen verbergen, captcha’s tonen, en dan niet altijd maar slechts bij 1 op de x gebruikers en 1 op de y keer, zodat iedereen zegt dat het aan jou ligt als je hulp vraagt.
Klinkt leuk, maar ik gebruik tegenwoordig steeds vaker Google Gemini in plaats van Search. En dat komt omdat ik dan niet tussen 100.000 resultaten hoef te zoeken naar “Hoe schrijf ik “Hello, World” in Assembler?” Ik moet alleen even controleren of het antwoord ook correct is. Maar Gemini voegt ook extra links toe die van belang kunnen zijn.
Nu is het wel de vraag in hoeverre korte stukjes code auteursrechtelijk te beschermen zijn. Zeker als het aantal manieren waarop je een probleem kunt oplossen beperkt is tot enkele opties.
Ik gebruik Gemini daarnaast ook om stukken van mijn code te analyseren en eventueel te verbeteren. Ik gebruik ook OpenAI voor dat, plus JetBrains AI. Drie AI-toepassingen die mij helpen code te valideren en bugs te voorkomen. Wel mijn eigen code, overigens.
Echter, Gemini heeft wel een goede methode om feedback te geven. Onder het antwoord heb je een thumb-up and thumb-down button en een “modify answer” knop. En je kunt ook rapporteren dat het antwoord onrechtmatig is. En een double-check optie.
Ik heb zowel ChatGPT als Gemini getest met vragen over zaken waar ik verstand van heb en het antwoord al op weet.
Ik gebruik beide absoluut niet meer, omdat beide zonder enige indicatie de grootst mogelijke onzin uitspugen. Leuk dat je de bronnen kan lezen om dat te verifiëren, maar dan lees ik liever eerst de bronnen en dan maak ik zelf wel een samenvatting.
Interessante ontwikkeling. Zeker als dit tot gevolg heeft dat veel grote publishers simpelweg hun website niet meer laten indexeren door Google Search. Andere zoekmachines (die wel mogen blijven indexeren) worden hierdoor gelijk (nog) beter van ten opzichte van Google Search.
Er zijn bovendien al jaren betere alternatieven, die nog privacyvriendelijk zijn ook. Het zou helemaal mooi zijn als grote publishers als ‘wraak’ eens wat meer aandacht gaan geven aan sympathiekere en veelal betere zoekmachine-alternatieven als Duck.com, Qwant.com, Ecosia.com.