Volledige rapport: https://www.tweedekamer.nl/kamerstukken/detail?id=2024D17777&did=2024D17777
Bias rapport Kort Verblijf Visum – SigmaRed in opdracht van het Ministerie van Buitenlandse Zaken
Bias rapport op verzoek van het Ministerie van Buitenlandse Zaken over het Kort Verblijf Visum (KVV) proces waarin een regel-gebaseerd classificatiemodel wordt gebruikt om aanvragers in te delen in een snelle, reguliere of intensieve aanvraagprocedures. Het doel van het rapport is om “potentiële bias op te sporen en te wegen door de relatie tussen risicoprofielpercentages en afwijzingspercentages tussen verschillende demografische groepen te onderzoeken”.
Op basis van een vergelijking tussen disparate impact ratios tussen 2022 en 2023 wordt geconcludeerd dat er “geen onevenredige discriminatie op basis van leeftijd, burgerlijke staat of geslacht” wordt gevonden*. In het rapport wordt voor veel biasmetrieken gemotiveerd waarom deze niet gebruikt worden. Echter ontbreekt deze verklaring voor de bias metriek conditionele demografische pariteit (CDP). Het is algemeen bekend dat CDP de voorkeur geniet boven DI, omdat het beter bestand is tegen Simpson’s paradox. De auteurs motiveren echter niet waarom van dit voorkeursscenario wordt afgeweken. Het gebruik van CDP als biasmetriek kan leiden tot andere kwantitatieve uitkomsten die de huidige conclusie van het rapport mogelijk niet ondersteunen.
Daarnaast staat het rapport niet stil bij de geschiktheid van de criteria op basis waarvan het risicoprofiel onderscheid maakt. De volgende 7 criteria worden in het profiel gebruikt:
- Verblijfsdoel
- Post (plaats van aanvraag)
- Nationaliteit
- Geslacht
- Leeftijdsklasse
- Burgetlijke staat
- Beroep.
Alvorens zulke criteria rechtmatig gebruikt kunnen worden in een risicoprofiel dient te moeten worden gemotiveerd waarom differentiatie op basis van deze criteria is proportioneel, geschikt en noodzakelijk is. Kaders van het College van de Rechten van de Mensen maken deze verplichting concreet. Bijvoorbeeld, kwantitatief bewijs voor het gerbuiken van selectiecriteria in een risicoprofiel kan worden gevonden door statistische hypothesetoetsen uit te voeren op willekeurig getrokken steekproeven van visa-aanvragers. Het is onduidelijk waarom deze triviale eerste stap in het toetsen van een risicoprofiel niet wordt behandeld in dit rapport.
Voor leeftijdsdiscriminatie licht het College van de Rechten van de Mens toe:
“[…] het is niet per se verboden dat een algoritme iemands leeftijd meeneemt. Toch zal er wel een duidelijk verband moet zijn tussen leeftijd en het doel van het algoritme. Zolang niet is aangetoond dat iemands leeftijd de kans vergroot op [het weigeren van een visumaanvraag] mag je leeftijd evengoed niet laten meewegen in de algoritmische selectie.”
Het is dus opmerkelijk dat de conclusie (dat het algoritme niet discrimineert op basis van leeftijd) enkel op kwanitatieve resultaten is gebaseerd.
In het algemeen geldt dat de organisatorische en kwalitatieve dimensie van onderzoek naar bias in algoritmes niet in het rapport wordt behandeld. Dit is opmerkelijk aangezien experts bij dergelijk onderzoek aandringen op multidisciplinaire blik. De consensus luidt dat de verantwoorde inzet van algoritmes niet zuiver kwantitatief beslecht kan worden. Het gaat niet alleen om de bias-maten, de werking van algoritmes blijft mensenwerk. Het onderzoeken van organisatorische omgangsvormen, rollen en verantwoordelijkheden en de werkcultuur om over lastige datamodellering-vraagstukken te spreken binnen de organisatie is daarbij van groot belang. Gegeven dat eer kwalitatieve interpretatie van de gebruikte selectiecriteria 1-7 in het risicoprofiel ontbreekt, is dit een tekortkoming in het rapport.
Tot slot: in het rapport worden geavanceerde methoden voor causale inferentie toegepast om het verband tussen de classificatie van het model (snel, regulier, intensief) en de beoordeling van de visumaanvraag door een ambtenaar te toetsen, onder andere door toepassing van inverse probability weighting (IPW) en instrument variable (IV) analysis. Het is onduidelijk waarom niet is gekozen voor de simpelere F-test, zoals hier toegepast op dezelfde casus.
*voor visumaanvragers met de Jemenitische nationaliteit wordt een zekere mate van ongelijke behandeling gemeten