Opinie | Wat kun je zeggen over de kwaliteit van romans met behulp van een computerprogramma en een grote lezersenquête?

Wanneer is een boek literair en wanneer niet? Hoe stel je dat vast? En kun je op basis van objectieve kenmerken als zinslengte en de compexiteit van het verhaal voorspellen of een boek goed gevonden gaat worden? Dat zijn de vragen waarop de onderzoekers achter Het Nationale Lezersonderzoek een antwoord willen gaan geven. Maar wat kun je zeggen over de kwaliteit van boeken met behulp van een computerprogramma en een grote lezersenquête? door Roos Geerse

hnlSinds een paar weken is de vragenlijst van Het Nationale Lezerszoek, georganiseerd door het Huijgens ING instituut, door iedereen in te vullen. Wie dit doet, krijgt na wat inleidende vragen een lijst van 400 boeken te zien. Dit zijn de 400 meest verkochte en/of uit de bibliotheek geleende boeken van niet al te lang geleden. Wie zoekt op Gerritsen, vindt dus zes boeken van Tess Gerritsen, en geen enkel boek van Esther Gerritsen. Je kunt aangeven welke daarvan je hebt gelezen, waarna je gevraagd wordt aan te geven in hoeverre je deze boeken goed en/of literair vond. En dan krijg je nog wat vragen over wat voor lezer je bent. Lees je graag romans die je kunt betrekken op je eigen leven? Hoe belangrijk vind je de schrijfstijl van een boek?

Het idee is dat de boeken die door de verschillende soorten lezers worden beoordeeld als goed en/of literair te beschrijven zullen zijn met behulp van objectieve, dat wil zeggen door computers te vinden, kenmerken als zinslengte. Dat lijkt misschien vreemd, en dat zou het ook zijn als er alleen gekeken werd naar direct vaststelbare kenmerken als zinslengte, de vocabulaire waaruit geput wordt, de gebruikte woordsoorten enzovoort. Nu kunnen dat soort dingen al veel zeggen. Als het woord ik bijvoorbeeld niet tussen de vijf meest frequente woorden zit, weet je bijna zeker dat het boek niet geschreven is in de ik-vorm.

Er zal door de onderzoekers echter ook gekeken worden naar patronen die moeilijker te herkennen zijn voor een computer, zoals de complexiteit van de verhaallijn. Voor een aantal van deze zaken is de software al voorhanden. Voor andere zullen de onderzoekers de instrumenten nog moeten ontwikkelen. Zo is Corina Koolen een instrument aan het ontwikkelen voor het categoriseren van beschrijvingen van het uiterlijk van personages. Het ontwikkelen van deze instrumeten is dan ook een belangrijk onderdeel van de studie.

Problematischer lijken mij de vragen op basis waarvan lezers ingedeeld moeten worden als zogenaamde autonome lezers, zeg maar de lezers die letten op de stijl van een literair werk, en de heteronome lezers, zij die romans betrekken op hun eigen leven. De onderzoekers geven er in de beschrijving van hun onderzoeksvoorstel blijk van te beseffen dat lezers beide rollen kunnen aannemen, maar bij het invullen van de enquete kun je niet aangeven dat je iets soms wel en soms niet belangrijk vindt en al helemaal niet wanneer.

Misschien is het antwoord op de vragen die de onderzoekers stellen ook niet het belangrijkste wat dit onderzoek op kan leveren. Instrumenten waarmee boeken beschreven kunnen worden zijn in beginsel immers ook te gebruiken om lezers te adviseren over een boek. Neem de bibliotheekdienst WelkBoek. Hiervoor worden boeken nu nog met de hand getagd, maar in de toekomst kan men daarvoor allicht gebruik maken van dit soort computationeel linguistisch onderzoek.

Roos Geerse is de initiatiefnemer Buzzboeken

Share Button

geef een reactie