Gedoe om twee enveloppen

Werken met kansen is niet altijd even makkelijk. De wiskundige theorie van de kansrekening is stevig gestoeld op algemeen aanvaarde axioma’s, maar kansrekening heeft naast een rigoureuze wiskundige kant ook een intuïtief aspect. Het valt soms niet mee om in concrete vraagstukken die twee aspecten op een goede manier met elkaar te verbinden. In dit artikel beschrijft Ronald Meester, hoogleraar kansrekening aan de Vrije Universiteit in Amsterdam, een probleem dat voor de nodige hoofdbrekens zorgt.

Je staat in de finale van een spelshow. Om te bepalen met hoeveel geld je naar huis zal gaan, haalt de quizmaster – laten we hem Willem noemen – twee enveloppen uit de binnenzak van zijn colbert. Hij zegt hierover het volgende: ‘Beste winnaar, ik heb hier twee enveloppen. In allebei de enveloppen zit een kaartje met daarop een bedrag geschreven. Kies er maar eentje uit. Het bedrag dat erop staat, neem je mee naar huis.’

Dat doe je natuurlijk, maar net voordat je de door jou gekozen envelop wilt openen, onderbreekt Willem: ‘Je hebt een envelop gekozen en hebt hem nog niet opengemaakt. Voordat je hem open maakt, geef ik je nog wat extra informatie over de bedragen die in de enveloppen zitten: de ene envelop bevat twee keer zo veel geld als de andere. Natuurlijk vertel ik je niet welke van de twee enveloppen het meeste geld bevat. Nu ik je dit verteld heb, geef ik je de gelegenheid om van envelop te wisselen, mocht je dit willen.’

Verwachtingswaarde

Deze nieuwe informatie van Willem de quizmaster zet je misschien even aan het denken, maar vast niet voor lang. Immers, je hebt gewoon een van de twee enveloppen gekozen, en de kans dat je daarbij de envelop met het hoogste bedrag hebt gekozen is simpelweg $\frac{1}{2}$. Daar verandert de extra informatie van Willem echt niets aan. Je staat dus op het punt om tegen Willem te zeggen dat zijn nieuwe informatie niet relevant is, maar dan krijg je de volgende ingeving.

Ooit heb je de beginselen van de kansrekening geleerd, en die blijken nu toch wel van pas te komen. Want hoewel je niet weet welk bedrag er op het kaartje in de gekozen envelop staat, kun je er wel mee rekenen. Stel maar even dat dit bedrag gelijk is aan $x$. Hoeveel bevat die andere envelop dan?

Dat weten we niet zeker, maar omdat je aanvankelijk met kans $\frac{1}{2}$ het hoogste, en met kans $\frac{1}{2}$ het laagste bedrag hebt gekozen, bevat de andere envelop met kans $\frac{1}{2}$ een bedrag van $2x$ en met kans $\frac{1}{2}$ een bedrag van $x/2$. We weten immers dat de ene envelop twee keer zoveel bevat als de andere, dus als de gekozen envelop het bedrag $x$ vermeldt, dan zijn er voor de andere envelop nog maar twee mogelijkheden, $2x$ en $x/2$, allebei natuurlijk met kans $\frac{1}{2}$. Maar dit betekent dat de verwachting van het bedrag in de andere envelop gelijk moet zijn aan

$$\frac{1}{2} \cdot 2x + \frac{1}{2}\cdot \frac{x}{2} = \frac{5}{4}x$$

Deze verwachting, $\frac{5}{4} x$ , zeg maar de ‘gemiddelde waarde’ van het bedrag in de andere envelop, is groter dan het bedrag in de envelop die je eerst had gekozen. Het lijkt op basis van deze redenering dus verstandig om van envelop te wisselen.

Deze laatste conclusie is natuurlijk hoogst ongemakkelijk en ongeloofwaardig. Het zou toch echt helemaal niet moeten uitmaken of je van envelop wisselt of niet, dus het moet haast wel zo zijn dat de berekening die tot $\frac{5}{4} x$ leidde op de een of andere manier onjuist is.

Maar wát is er dan precies onjuist? Dit is helemaal niet zo makkelijk om te begrijpen, maar ik zal proberen het uit te leggen. Misschien wil je voor je verder leest er zelf eerst nog even over nadenken.

Wat is er aan de hand?

Om niet verzeild te raken in technische zaken die er eigenlijk niet toe doen, doe ik eerst de aanname dat de bedragen die op de kaartjes kunnen staan alleen maar machten van 2 kunnen zijn, dus van de vorm $2^k$, met $k$ een geheel getal (eventueel negatief, dus een bedrag als $2^{–3} = \frac{1}{8}$ is ook mogelijk). Als je goed hebt begrepen wat er in dit geval aan de hand is, lukt het je misschien ook wel om uit te zoeken hoe het precies zit zonder deze aanname. De kern van de zaak wordt door deze aanname niet aangetast. 

Laten we het bedrag in de gekozen envelop aangeven met de hoofdletter $X$, en het bedrag in de andere envelop met de hoofdletter $Y$. Voor jou als finalist van de quiz zijn $X$ en $Y$ onbekend: je hebt geen idee wie de bedragen erin heeft gedaan, volgens welke regels, je weet gewoon niets. Voor jou zijn $X$ en $Y$ dus stochastisch, en zeker niet deterministisch. Maar toch, we kunnen er wel wat uitspraken over doen.

Het feit dat je gewoon op goed geluk een van de twee enveloppen hebt gekozen, betekent dat

$$\mathbb{P}(X < Y) = \mathbb{P}(X > Y) = \frac{1}{2}.$$

Immers, de kans dat je de envelop met het hoogste bedrag hebt gekozen, is gewoon $\frac{1}{2}$ . Sterker nog, de informatie van Willem vertelt je dat er maar twee opties zijn: $X = 2Y$ of $2X = Y$. Dus vinden we nu dat $$\mathbb{P}(X = 2Y) = \mathbb{P}(2X = Y) = \frac{1}{2}$.

Maar we weten nog meer. Vanwege de willekeurige gok aan het begin moet het vanuit jouw perspectief zo zijn dat als $X$ een bepaalde waarde zou aannemen met een bepaalde kans, de kans dat $Y$ die waarde aanneemt even groot is. We zeggen in zo’n geval dat $X$ en $Y$ dezelfde verdeling hebben. Ze hebben niet dezelfde uitkomst, maar de kansen op de diverse uitkomsten zijn altijd gelijk.

We kunnen deze kennis nu als volgt combineren. Wat is voor jou, als finalist van de quiz, de kans dat de niet gekozen envelop het bedrag $2^k$ bevat, dus de kans dat $Y = 2^k$? Dat weet je niet, maar je weet wel dat dit alleen maar kan gebeuren als $X$ gelijk is aan $2^{k+1}$ of aan $2^{k–1}$. Als $X = 2^{k+1}$, dan weet je dat $Y$ met kans $\frac{1}{2}$ gelijk is aan $2^k$ en met kans $\frac{1}{2}$ gelijk aan $2^{k+2}$. En als $X = 2^{k–1}$, dan weet je dat $Y$ met kans $\frac{1}{2}$ gelijk is aan $2^{k–2}$ en met kans $\frac{1}{2}$ gelijk aan $2^k$. We vinden dus dat

$$\mathbb{P}(Y = 2^k) = \frac{1}{2} \cdot \mathbb{P}(X = 2^{k+1}) +\frac{1}{2}\cdot \mathbb{P}(X = 2^{k–1})./ / / / (\star)$$

Maar omdat we al concludeerden dat $X$ en $Y$ dezelfde verdeling hebben, weten we dat $\mathbb{P}(X = 2^k) = \mathbb{P}(Y = 2^k)$, voor elk geheel getal $k$. Als we dat invullen in de linkerkant van ($\star$), vinden we

$$\mathbb{P}(X = 2^k) = \frac{1}{2}\cdot \mathbb{P}(X = 2^{k+1}) + \frac{1}{2} \cdot \mathbb{P}(X = 2^{k–1}).$$

Nu zijn we er bijna. Als we $\mathbb{P}(X = 2k)$ even $q_k$ noemen, dan hebben we nu gevonden dat

$$q_k = \frac{1}{2} (q_{k–1} + q_{k+1}),\ \ \ \ \ \ \ (\star\star)$$

waarbij $k$ weer een geheel getal is.

Probeer nu eens wat punten ($k, q_k$) in een assenstelsel te tekenen. Als je er even naar kijkt, dan zie je wel dat ($\star\star$) impliceert dat de punten $(k, q_k)$ allemaal op een rechte lijn moeten liggen. Als deze lijn niet horizontaal loopt, dan zijn er indices $k$ waarvoor $q_k$ negatief is, en dat kan natuurlijk niet, dus deze mogelijkheid valt af. De lijn moet dus wel horizontaal lopen, en dan zijn er maar twee mogelijkheden:

(1) alle $q_k$’s zijn gelijk aan 0, of

(2) alle $q_k$’s zijn gelijk aan een constante $c > 0.$

In geval (1) zijn alle kansen nul, en dat kan niet want de som van de kansen qk moet 1 zijn. Maar in geval (2) is die som oneindig en dat kan ook niet! Wat moeten we nu concluderen?

Conclusie

Uit bovenstaande redenering volgt dat eigenlijk alle opties op een tegenspraak uitlopen. Wat hebben we dan verkeerd gedaan? Nou, eigenlijk niets. Het feit dat elke optie een tegenspraak oplevert, betekent niets anders dan dat het experiment van de quizmaster met de enveloppen zoals we dat hebben geformuleerd niet uitgevoerd kan worden! Je kunt wel beweren dat als de ene envelop het bedrag $x$ bevat, de andere met kans $\frac{1}{2}$ het bedrag $2x$ bevat en met kans $\frac{1}{2}$ het bedrag $x/2$, maar er is geen manier om de bedragen op de kaartjes in de enveloppen te schrijven zodat dit waar is voor elke $x$.

Probeer het maar eens. En dat was dus de fout in onze redenering. Een nogal diepzinnige fout, eigenlijk. In de kansrekening komt het vaker voor dat je een bepaald proces met woorden kunt beschrijven, maar dat je tegelijkertijd dat proces wiskundig niet kunt construeren. Dat dit consequenties heeft voor de manier waarop we over wiskunde na moeten denken is duidelijk. Een volgende keer zal ik daar op ingaan.