Editie oktober 2015

Rubriek: 
Auteur: 
Laura van Eerten

Achter de schermen bij het Groene Boekje

Eens in de tien jaar verschijnt er een nieuwe, officiële spellinggids van het Nederlands: het Groene Boekje. Maar wie bepaalt wat er wel en wat er niet in het Groene Boekje komt? Een kijkje achter de schermen bij de makers van het Groene Boekje.

Het verhaal begint en eindigt bij de spellingcommissie: een werkgroep van taalkundigen en spellingexperts uit België en Nederland. De huidige leden werden zo'n vijf jaar geleden benoemd door de Nederlandse Taalunie.

De spellingcommissie bepaalt de spellingregels en ook de inhoud van het boekje. In de editie van 2015, die vanaf vandaag in de winkels ligt, verandert er niets aan de spellingregels. Wat was de rol van de spellingcommissie? 'We beslissen over de schrijfwijze van nieuwe woorden, vullen taaladviezen aan op Taaladvies.net en verduidelijken die waar nodig', legt Katrien Van pellicom uit, projectleider spelling bij het Instituut voor Nederlandse Lexicologie. 'Er zijn altijd grijze gebieden, woorden die tussen de regels vallen. Bijvoorbeeld verkleinvormen van Franse leenwoorden. "Compromis" is op twee manieren uit te spreken, en kan daarom op twee manieren worden verkleind: "compromistje" of "compromisje". 

De spellingcommissie is eindverantwoordelijk voor de inhoud, en gaf de opdracht om de editie van 2015 relevanter te maken door de woorden op te nemen die we het meest opzoeken en gebruiken. Daarnaast moest de lijst worden aangevuld met twintig procent nieuwe woorden, frequent gebruikte Antilliaans-Nederlandse woorden en het aantal Surinaams-Nederlandse woorden moest worden uitgebreid.

Die opdracht gaf de Taalunie aan het Instituut voor Nederlandse Lexicologie (INL). Bij het INL werd al het bronmateriaal voor het Groene Boekje (online en gedrukt) verzameld in een digitaal bestand: de spellingdatabase. Daarin zit onder andere de inhoud van het Groene Boekje 2005, nieuwe woorden die uit het Algemeen Nederlands Woordenboek (ANW) en van Twitter komen, de meest opgezochte woorden in Woordenlijst.org (het Groene Boekje online) en woordenlijsten uit het Nederlands in Suriname en de voormalige Nederlandse Antillen. 

Maar voordat al deze informatie samengevoegd kon worden, moest er eerst nog een database gebouwd worden. 'In de oude database van het Groene Boekje 2005 kon maar één persoon werken,' aldus technisch projectleider Katrien Depuydt. 'We moesten daarom een nieuwe, flexibele database ontwikkelen die overweg kon met bestanden van verschillende bronnen en formaten, en een interface waarin meerdere mensen tegelijk gegevens konden bewerken.'

Boterhamzak

Om te controleren of de woorden in de spellingdatabase frequent genoeg waren voor een plek in het uiteindelijke boekje, werden ze vergeleken met een grote verzameling teksten uit kranten, tijdschriften en journaaluitzendingen: het Corpus Hedendaags Nederlands. Woorden die niet in het corpus stonden kwamen niet in aanmerking, en werden in de database gemarkeerd. 'Je kunt nooit blindelings op frequentie afgaan', stelt Katrien Depuydt. 'Stel dat "dinsdag" veel minder vaak in het corpus voorkomt dan de andere dagen van de week, dan zou die als enige niet in het Groene Boekje terechtkomen.' De spellingcommissie stelde daarom verschillende lijstjes op met woorden die sowieso opgenomen moesten worden, ongeacht frequentie. Naast de dagen van de week waren dat bijvoorbeeld getallen en maanden. Die lijstjes werden handmatig gecontroleerd.

Er komt dus altijd mensenwerk bij kijken, maar veel voorbereiding gebeurde automatisch. Computerlinguïst Frank Landsbergen vertelt: 'Door de samenvoeging van verschillende bronbestanden was extra informatie over bijvoorbeeld woordsoort op verschillende manieren gecodeerd, of soms ontbrak werkwoordvervoeging. De gaten moesten worden opgevuld, en daar schreef ik scripts voor.' Zo moest er ook voor elk trefwoord een verkleinvorm komen, en andersom. Dat leverde nog wel eens interessante discussies op. Frank: “Neem het woord "boterhamzakje". Automatisch werd daar het basiswoord "boterhamzak" bij gevormd. Het woord is in principe goed, maar in de praktijk gebruik je dat natuurlijk nooit.' 

Carrière

Marjolijn van Bennekom is één van de medewerkers die dat handmatige werk uitvoerde. In de database controleerde ze duizenden vervoegingen en verbuigingen, woordsoorten, verwijzingen naar taaladviezen, woordafbrekingen en besluiten van de spellingcommissie. 'Soms ontbrak bijvoorbeeld de 3e persoon enkelvoud, die moest dan worden aangevuld', herinnert Marjolijn zich. De 168 pagina’s aan spellingregels kende ze uiteindelijk uit haar hoofd. Handig, maar soms ook een beetje vervelend: 'Zit je in de auto en het woord "carrière" komt voorbij op de radio: zit je dat in je hoofd onmiddellijk af te breken.'

06-nummers

Ook Van Dale, de uitgever van het Groene Boekje 2015, droeg inhoudelijk een steentje bij. Redacteur Tjerk Hacquebord: 'We ontdekten bijvoorbeeld dat "data" er wel in stond als meervoud van datum, maar niet als trefwoord (in de betekenis "gegevens") En dat woord wil je natuurlijk niet missen, omdat veel mensen zich er onzeker over voelen; of het nu een meervoud of enkelvoud is.'

Op de vraag wat de grootste uitdaging was in het hele traject wist Katrien Depuydt direct een antwoord: 'De emotie.' Het was een work in progress, niet meteen perfect en met fouten, iets waar betrokkenen snel over vielen: 'Dit woord is gek! Dit moet anders! Nee maar dit kan echt niet!' Hieruit blijkt hoe iedereen begaan is met een onderwerp als spelling en het Groene Boekje. Niet alleen de gebruikers, ook de makers.