Verbeterde leesbaarheid van EULAs
Afgelopen weekend beklaagde Willem Kossen zich over de (on)leesbaarheid van de EULA. Nou erger ik me ook regelmatig aan rare passages, maar zijn insteek is toch net even anders:
Eula’s often contain a lot of legal jargon, which usually is gibberish to ordinary human beings. The question is, do they have to be this difficult to read?
Natuurlijk hoeft dat niet, dus waarom gebeurt het toch? Ik geloof er niets van dat juridische teksten moeilijk leesbaar moeten zijn. Mijn theorie daarover is dat mensen die EULAs schrijven geen feedback krijgen zoals ze dat bij ‘echte’ contracten wel krijgen. Als je een onbegrijpelijke exoneratie schrijft in een duur contract, zal de tegenpartij daar wat van zeggen en dan wordt het aangepast. Of op zijn minst verduidelijkt. Maar een EULA wordt door niemand beoordeeld voordat ‘ie online (of in het product) gaat, dus daar blijven de onbegrijpelijke items gewoon staan.
Willem wijst op een aantal formules waarmee de leesbaarheid van teksten automatisch berekend kan worden. Die gaan uit van de Flesch Reading Ease test voor leesbaarheid. Deze test is kort gezegd gebaseerd op het aantal woorden per zin en het aantal lettergrepen per woord. Op basis van een aantal taalafhankelijke constanten komt er dan een getal uit dat de leesbaarheid representeert.
Er zijn diverse tools die dit voor de Engelse taal doen, maar voor Nederlands kan ik er geen vinden. Ik vond wel de constanten voor Nederlands, zodat in ieder geval in theorie de leesbaarheid van een Nederlandse tekst berekend kan worden. En wel als volgt:

De leesbaarheid G wordt vervolgens gegeven door deze tabel:
| Leesbaarheid G | Stijl | Overeenkomstige schoolopleiding |
| 90 - 100 | zeer gemakkelijk | groep 6 |
| 80 - 90 | gemakkelijk | groep 7 |
| 70 - 80 | vrij gemakkelijk | groep 8 |
| 60 - 70 | standaard | vbo |
| 50 - 60 | vrij moeilijk | MAVO, onderbouw HAVO/VWO |
| 30 - 50 | moeilijk | bovenbouw HAVO/VWO |
| 0 - 30 | zeer moeilijk | universiteit |
Is er iemand met Perl- of andere relevante ervaring die deze formule in een script kan gooien en hieronder wil posten? Ik zit met name aan te hikken tegen hoe je een Nederlands woord in lettergrepen opsplitst, daar lijkt niet echt een standaardbibliotheek voor te zijn.
Arnoud
Foto: Oregon Brandon, Flickr


