Définition Equalized Odds -

Equalized Odds

Equalized Odds est une définition de l’équité algorithmique utilisée dans le domaine de l’apprentissage automatique et de l’intelligence artificielle. Elle stipule qu’un modèle de classification est équitable si les sujets appartenant à différents groupes protégés (par exemple, définis par l’ethnie ou le genre) ont des taux de vrais positifs égaux et des taux de faux positifs égaux. En d’autres termes, la probabilité qu’un individu réellement positif soit correctement classé comme positif doit être la même pour tous les groupes, et la probabilité qu’un individu réellement négatif soit incorrectement classé comme positif doit également être la même pour tous les groupes.

Les concepts fondamentaux sous-jacents à Equalized Odds reposent sur la notion d’égalité des chances conditionnellement au résultat réel (l’étiquette ou « ground truth »). Cela signifie que la performance du classifieur, en termes de capacité à identifier correctement les positifs (vrais positifs) et à éviter de classer incorrectement les négatifs comme positifs (faux positifs), ne doit pas dépendre de l’appartenance à un groupe protégé. Le taux de vrais positifs (également appelé sensibilité ou rappel) mesure la proportion d’individus réellement positifs qui sont correctement identifiés comme tels par le modèle. Le taux de faux positifs mesure la proportion d’individus réellement négatifs qui sont incorrectement identifiés comme positifs par le modèle. Equalized Odds exige que ces deux taux soient identiques pour chaque groupe défini par un attribut sensible (comme le genre, l’ethnie, l’âge, etc.). Cette condition est plus forte que l’exigence de taux de vrais positifs égaux seule, connue sous le nom d’Equal Opportunity.

L’importance d’Equalized Odds réside dans sa capacité à aborder des formes spécifiques de discrimination algorithmique dans des systèmes de prise de décision automatisée ayant des conséquences significatives pour les individus. Ces systèmes sont de plus en plus utilisés dans des domaines critiques tels que l’octroi de crédit, le recrutement, l’admission universitaire, la justice pénale (par exemple, l’évaluation du risque de récidive) et le diagnostic médical. Si un modèle ne satisfait pas Equalized Odds, cela signifie que certains groupes pourraient être désavantagés de manière disproportionnée, soit en étant moins susceptibles d’être correctement identifiés pour une issue favorable (par exemple, l’obtention d’un prêt pour lequel ils sont qualifiés), soit en étant plus susceptibles d’être incorrectement identifiés pour une issue défavorable (par exemple, être signalé à tort comme à haut risque). En s’efforçant d’atteindre Equalized Odds, on cherche à garantir que le modèle fonctionne de manière équitable pour tous, indépendamment de leur appartenance à un groupe protégé, conditionnellement à leur statut réel. Cela contribue non seulement à des décisions plus justes mais aussi à renforcer la confiance du public dans les technologies d’IA et à assurer la conformité avec les réglementations anti-discrimination.

Les applications pratiques d’Equalized Odds sont variées. Par exemple, dans le contexte du recrutement, un système d’aide à la sélection des CV devrait, pour satisfaire Equalized Odds, s’assurer que les candidats qualifiés (résultat réel positif) de différents groupes démographiques ont la même probabilité d’être présélectionnés (prédiction positive), et que les candidats non qualifiés (résultat réel négatif) de ces mêmes groupes ont la même probabilité d’être incorrectement présélectionnés (faux positif). Dans le domaine de l’octroi de crédit, cela signifierait que les demandeurs solvables de tous les groupes ont une chance égale d’obtenir un prêt, et que les demandeurs non solvables de tous les groupes ont une chance égale d’être incorrectement approuvés pour un prêt. En justice pénale, pour un outil évaluant le risque de récidive, Equalized Odds impliquerait que les individus qui récidiveront effectivement ont la même probabilité d’être identifiés comme à haut risque, quel que soit leur groupe ethnique, et que ceux qui ne récidiveront pas ont la même probabilité d’être incorrectement classés comme à haut risque.

Il existe des nuances et des interprétations importantes concernant Equalized Odds. Premièrement, la stricte égalité mathématique des taux peut être difficile à atteindre ; en pratique, on peut viser une égalité approximative (parfois appelée epsilon-fairness), où les différences entre les taux des groupes sont inférieures à un petit seuil epsilon. Deuxièmement, Equalized Odds est une définition parmi d’autres de l’équité. Elle est souvent comparée à l’Equal Opportunity, qui est une condition plus faible exigeant uniquement l’égalité des taux de vrais positifs. Equalized Odds est donc plus contraignante. Une autre nuance est que, bien que définie pour les classifieurs binaires, elle peut être appliquée à des modèles produisant des scores continus en choisissant un seuil de décision pour convertir les scores en prédictions binaires. Le choix de ce seuil peut impacter la satisfaction de la métrique. Il est également crucial de comprendre qu’Equalized Odds se concentre sur l’équité au niveau du groupe et ne garantit pas l’équité individuelle pour chaque personne.

Plusieurs concepts sont étroitement liés à Equalized Odds. Au cœur se trouve le concept général de « fairness » (équité algorithmique) et la lutte contre le « bias » (biais algorithmique) et la « discrimination ». Les « protected attributes » (attributs protégés) sont les caractéristiques sur lesquelles la discrimination est interdite et par rapport auxquelles l’équité est mesurée. Les composantes mathématiques essentielles sont le « True Positive Rate » (TPR), aussi appelé sensibilité ou rappel, et le « False Positive Rate » (FPR). Ces taux sont dérivés de la « Confusion Matrix » (matrice de confusion), qui résume la performance d’un classifieur. D’autres métriques d’équité incluent la « Demographic Parity » (ou parité statistique), qui exige que le taux de prédictions positives soit le même pour tous les groupes, indépendamment du résultat réel. La parité démographique est souvent incompatible avec Equalized Odds, surtout si les taux de base de l’issue positive diffèrent entre les groupes (ce qui est un aspect des théorèmes d’impossibilité de l’équité). L' »Equal Opportunity » est un cas particulier d’Equalized Odds, se concentrant uniquement sur l’égalité des TPR. La « Predictive Rate Parity » (ou parité du taux prédictif) exige que la valeur prédictive positive (précision) soit la même pour tous les groupes.

L’origine d’Equalized Odds s’inscrit dans le développement rapide de la recherche sur l’équité, la responsabilité et la transparence (FAccT) en apprentissage automatique au milieu des années 2010. Le concept a été formellement introduit et popularisé par Moritz Hardt, Eric Price et Nati Srebro dans leur article influent de 2016 intitulé « Equality of Opportunity in Supervised Learning ». Bien que cet article se concentre principalement sur la notion d’Equal Opportunity, il discute également de la condition plus forte qui deviendra connue sous le nom d’Equalized Odds, parfois initialement désignée par des termes comme « conditional procedure accuracy equality ». Ces travaux ont fourni un cadre mathématique rigoureux pour définir et analyser différentes notions d’équité dans les systèmes d’apprentissage supervisé.

Les avantages d’Equalized Odds sont significatifs. Cette métrique offre une notion d’équité intuitive et robuste, assurant que les chances d’une classification correcte (tant pour les cas positifs que pour les erreurs sur les cas négatifs) sont indépendantes de l’appartenance à un groupe protégé, une fois que le résultat réel est connu. Elle est considérée comme plus forte et souvent plus désirable que la parité démographique car elle prend en compte la performance réelle du classifieur et ne pénalise pas la sélection des candidats réellement qualifiés. Elle protège spécifiquement contre les scénarios où un groupe subit un taux d’erreur de classification plus élevé qu’un autre pour un type d’erreur donné (par exemple, être faussement accusé ou faussement exonéré).
Cependant, Equalized Odds présente aussi des inconvénients, des défis et des limitations. L’un des défis majeurs est le compromis fréquent entre l’équité et la performance globale du modèle (accuracy-fairness trade-off) ; atteindre Equalized Odds peut parfois nécessiter une réduction de la précision globale du modèle. Sa mise en œuvre et sa vérification exigent l’accès aux étiquettes de vérité terrain (ground truth) et aux attributs protégés, informations qui peuvent être sensibles, difficiles à obtenir ou dont la définition même peut être sujette à débat. De plus, les théorèmes d’impossibilité de l’équité démontrent qu’il est généralement impossible de satisfaire simultanément Equalized Odds et d’autres définitions d’équité (comme la parité prédictive ou la calibration) si les taux de base de l’issue positive diffèrent entre les groupes, à moins que le classifieur ne soit parfait ou que les prédictions soient triviales. Enfin, l’application de techniques de mitigation pour faire respecter Equalized Odds peut être complexe et nécessiter des ajustements spécifiques au modèle ou aux données.