Wiskundigen hebben een manier van denken die ik heel leuk vind
Het Nederlands Forensisch Instituut (NFI) heeft veel kennis in huis op het gebied van forensische producten, onderzoek en diensten, en voorziet veel organisaties op het gebied van veiligheid en recht van betrouwbare informatie uit sporen. Denk bijvoorbeeld aan biologische, chemische, digitale of fysische sporen op een plaats-delict. Wiskundige modellen worden gebruikt binnen het NFI om de bewijskracht van de gevonden sporen te kunnen doorgronden.
Marjan Sjerps werkt sinds 1993 bij het NFI. Toen Marjan begon waren er geen andere statistici bij het NFI. Marjan is momenteel lid van een team van ongeveer twintig deskundigen die onderzoek doen naar de toepassingen van machine learning, statistiek en kansrekening in de forensische wetenschappen en het strafrecht. Het gaat daarbij om het interpreteren van bewijs en de bewijskracht daarvan aan te geven. Sinds 2010 is Marjan ook bijzonder hoogleraar forensische statistiek aan de Universiteit van Amsterdam (UvA), een aanstelling die als doel heeft om de samenwerking tussen het NFI en de universiteit verder te versterken.
"Ik ben begonnen als wiskundige, afgestudeerd in de richting van statistiekbesliskunde in Nijmegen. Na mijn studie besloot ik om te gaan promoveren in de richting van de toegepaste wiskunde. Ik kwam terecht bij het instituut voor theoretische biologie in Leiden. Dat was heel erg leuk, maar ik wist dat ik hier niet mijn leven aan wilde wijden. Ik begon na mijn promotie te zoeken en zag in de krant een vacature bij het NFI. Ze zochten naar iemand met kennis van statistiek maar ook van populatiegenetica.
Dit was gerelateerd aan mijn promotieonderwerp. Zo werd ik de eerste forensisch statisticus in Nederland."
Binnen het NFI doet Marjan vooral onderzoek naar methoden om de bewijskracht van (een combinatie van) waarnemingen van forensisch onderzoekers te berekenen.
Om deze algemene methode uit te leggen is forensisch DNA-onderzoek een goed voorbeeld. Door middel van statistische modellen is het mogelijk om iets te zeggen over
hoe waarschijnlijk het is dat een gevonden spoor afkomstig is van een specifieke verdachte. Centraal in het forensisch onderzoek binnen het NFI staat de regel van Bayes die als volgt luidt:
$$P(A|B) = P(B|A) ⋅ P(A)/P(B).$$
In de formule staat $P(A)$ en $P(B)$ voor de kans dat gebeurtenis $A$ respectievelijk $B$ gebeurt en $P(A|B)$ voor de kans dat $A$ gebeurt gegeven dat $B$ gebeurt. Zulke kansen noemen wiskundigen voorwaardelijke kansen.
Stel dat er een misdaad is gepleegd en dat er DNA-sporen zijn gevonden op de plaats-delict. Dan zal het NFI deze sporen gebruiken om een DNA-profiel te maken dat mogelijk van de dader is. Als er een match is met een profiel uit de nationale DNA-database, dan kan deze persoon aangewezen worden als verdachte. De aanklager
stelt dat hypothese $H_a$ waar is, namelijk dat het DNA-spoor afkomstig is van de verdachte, de verdediging stelt dat de alternatieve hypothese $H_v$ waar is, namelijk dat het DNA-spoor niet afkomstig is van de verdachte. Het toepassen van de regel van Bayes levert dan
$$\frac{P(H_a|{\rm bewijs})}{P(H_v|{\rm bewijs})}=\frac{P({\rm bewijs}|H_a)}{P({\rm bewijs}|H_v)}\cdot\frac{P(H_a)}{P(H_v)}.$$
Het quotiënt links is de verhouding tussen de kansen van de twee hypotheses gegeven de bewijsstukken, deze heet de a posteriori kansverhouding. De middelste factor heet de likelihood-ratio en de factor helemaal rechts heet de a priori kansverhouding, de verhouding tussen de kansen van de twee hypotheses zonder de bewijsstukken.
De crux van de statistische analyse ligt in het bepalen van de likelihood-ratio. Een likelihood-ratio kleiner dan 1 betekent dat het bewijsmateriaal voordelig werkt voor de
verdachte, anderzijds een likelihood-ratio groter dan 1 betekent dat het bewijsmateriaal nadelig werkt voor de verdachte. Een voorbeeld van hoe de conclusie wordt
geformuleerd luidt ongeveer als volgt: de bevindingen van het DNA-onderzoek zijn circa 100 000 maal waarschijnlijker wanneer het celmateriaal in de bemonstering afkomstig is van de verdachte dan wanneer het celmateriaal in de bemonstering afkomstig is van een willekeurige onbekende man. Vervolgens neemt de rechter de conclusies van het forensisch onderzoek mee in het bepalen van het vonnis.
"Als er een match uitkomt dan is het klaar in televisieseries zoals CSI, maar in het echt komt dan nog de cruciale vraag wat de bewijskracht is van die match. De regel van
Bayes staat heel centraal in het forensische onderzoek en maakt het mogelijk om conclusies te trekken ook met DNA-sporen die ernstig beschadigd zijn, die bijvoorbeeld
half opgegeten zijn door bacteriën. We gebruiken geavanceerde software om een likelihood-ratio te berekenen. Een aspect waar we altijd rekening mee houden is dat
een DNA-match door toeval kan optreden. Hoe vaak het gemaakte DNA-profiel voorkomt in de populatie speelt een rol in het bepalen van de likelihood-ratio. Naast de vraag "van wie is dit DNA-spoor?" is de vraag "hoe komt het spoor daar?" steeds belangrijker. Hierbij spelen andere aspecten een rol in de likelihood-ratio, zoals de kans dat DNA wordt overgedragen bij bepaalde handelingen."
Binnen het NFI is er heel veel interactie tussen wiskundigen, scheikundigen, biologen, informatici en medici maar ook soms met politie en juristen. "Ik vind het heel leuk
om in zo’n divers team te werken. Ik word bijvoorbeeld soms geroepen om bij een rechtszaak onze conclusies te presenteren. Ik vind het ook heel leuk om op de universiteit te werken, met wiskundigen en met studenten van de master forensic science. Die hebben een bepaalde manier van denken. De diversiteit en diepgang van mijn werk zorgt ervoor dat ik me nooit verveel, en dat vind ik er zo ontzettend leuk aan."