Letters raden met rekenkundig trucje

Er komen weer koude dagen aan. Een goede reden om thuis te blijven en de gezelschapsspelen nog eens uit de kast te halen. Maar als je niet meteen een gezelschap hebt liggen, of je hebt geen zin om het te zoeken op zolder… dan bestaan er leuke spelletjes waar je enkel pen en papier voor nodig hebt. OXO, zeeslag, pictionary,… allemaal spellen die je met deze 2 eenvoudige voorwerpen kan spelen. Maar ook Galgje, of Hangman zoals het in sommige regionen genoemd wordt.
galg
Het doel van het spel is eenvoudig, … raad het woord. Nadat de uitdager een willekeurig woord gekozen heeft, en verteld uit hoeveel letters dit woord bestaat, is het aan de andere speler(s) om beurtelings een letter te gokken. Indien de letter in het woord voorkomt vertelt de uitdager op welke positie(s), en worden andere letters geraden… Indien men een letter gokt die niet voorkomt verlies je een leven. Op het begin van het spel spreek je normaal gezien af met hoeveel levens je begint.
De naam galgje of hangman is eigenlijk een knipoog naar de manier waarop het aantal levens wordt weergegeven. Telkens je een leven verliest tekent de uitdager een lijntje meer op zijn tekening van een opgehangen stokmannetje. Als de tekening af voor het woord geraden is, wint de uitdager.
galgje
Inderdaad, je vergist je niet. Dit is een taalspelletje, heeft dit dan wel plaats op een wiskundeblog?
De reden waarom ik dit aanhaal op deze blog is omdat je door wiskunde te gebruiken, een licht voordeel kan hebben in dit spelletje. Zoals het in dit soort spelletjes meestal gaat, moet je een beetje geluk hebben omdat je moet gokken, letters meer bepaald. In dit geval gaat het echter over bestaande woorden waardoor je gericht kan gokken. Stel dat je bijvoorbeeld nog 1 gok mag wagen en je hebt reeds het  S_HOEN. Een berekende gok is dan een C, omdat de lettercombinatie “sch” dikwijls voorkomt in de Nederlandse taal. Zo zal je in dit geval niet snel de letter X gokken, want (zover ik weet) bestaat er geen woord met de lettercombinatie “sxh”. Eigenlijk is het zelden een goed idee om de letter x te gokken aangezien die in zeer weinig Nederlandse woorden voorkomt.

schoen
Wat is dan wel een goede gok? Wel, de klinker E zou een zeer goede eerste keuze zijn aangezien deze het meeste voorkomt… Bijna 19% van de gebruikte letters in onze taal is de letter E.  De rest van de top 3 wordt aangevuld door de letter N op plaats 2 (+/- 10%), en op 3 met ongeveer 7.5% staat letter A. Door deze statistieken te gebruiken kan je dus een berekende gok maken. HIER heb je de volledige lijst van de frequentie van letters in onze taal. Elke letter heeft dus een andere kans om voor te komen, in tegenstelling tot een dobbelsteen waarbij elke waarde van 1 tot en met 6 evenveel namelijk 16.66% kans heeft om voor te komen.

Indien je een krant en tijd te teveel hebt, kan je van één pagina eens de letters tellen. Ongetwijfeld komen de frequenties dichtbij de gegeven tabel. (In het artikel “Wiskunde vs. belastingontduikers” deden we een soortgelijk experiment maar dan met getallen.)
scrabble
Ook Scrabble maakt gebruik van zulke letterfrequentie-lijstjes… Zo zal je merken dat de letters die hoog scoren in deze lijst, een lage puntenwaarde hebben. Minder voorkomende letters zoals Q en X hebben een hogere waarde aangezien het moeilijker is om hier woorden mee te vormen.

Dit idee werd ook gebruikt door codekrakers die in de 19de eeuw de Vigenère code kraakten. Deze code werd reeds gebruikt in de 16de eeuw en werd zeer lang als ‘onbreekbaar’ beschouwd. Maar uiteindelijk werd deze gekraakt met net dezelfde methode als waarmee je je galgje-talent kan verbeteren. De code werkte als volgt: om een tekst te coderen werd elke letter vervangen door een andere letter, de A wordt een H, de B een O, … je kan zelf kiezen in welke letter je welke verandert, zolang er maar een 1 – 1 verband is. Hiermee bedoel ik dat A  steeds verandert in dezelfde gekozen letter, in ons voorbeeld een H, en andersom is er geen ander letter die in een H verandert.  In totaal kan de sleutel er als volgt uitzien:
vigenere
Hoe kunnen we deze code nu kraken? Zoals gezegd maken we wederom gebruik van de frequentie van de letters. Als we met deze versleuteling een tekst schrijven, zal de letter B voor ongeveer 19% voorkomen, want deze letter vergvangde de letter E, de letter I zal 10% voorkomen want deze vergvangde letter N….. Zo werken we al de klinkers en medeklinkers af. Hier en daar moet je wel even logisch nadenken. Het blijft een kansrekening en dus de lijst kan altijd een beetje afwijken. Het is bijvoorbeeld mogelijk dat in de te ontcijferen tekst de verdeling van de letters ietsje anders ligt waardoor het einde van de ranglijst een beetje door elkaar geschud is… maar de top 10 zal zeer waarschijnlijk hetzelfde zijn. Indien je deze ontcijferd hebt zal je al een groot deel van de tekst kunnen lezen.
Als de tekst slechts uit enkele woorden bestaat is het natuurlijk moeilijker om de tekst te ontcijferen aangezien de frequenties dan meer zullen afwijken van de algemene. Hoe groter de tekst, hoe beter ze de tabel zal benaderen.
Dit is net zoals bij de dobbelsteen. Als je 6 keer gooit met een dobbelsteen en opschrijft welke waarden gevallen zijn, zal het niet onwaarschijnlijk zijn dat niet elk getal exact 1 maal (16.66%) voorgekomen is. Als je echter 100 of 10000 keer zal werpen, zal je grafiek al meer naar 16.66% per waarde neigen. Dit noemen we “de wet van de grote getallen” maar dat is weer voer voor een andere tekst.

Leer de top 10 van de tabel van letterfrequenties van buiten (enkel de volgorde, de procenten hoef je niet uit je hoofd te kennen), en gebruik hem bij het raden van letters bij je volgende galgje spel.

DAAROM WISKUNDE

Giedts T.

Advertisements

Leave a comment

Filed under andere, Toepassingen voor elke dag, Wiskunde vs. Misdaad

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google+ photo

You are commenting using your Google+ account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

w

Connecting to %s