Group Fairness
Group Fairness est un concept fondamental dans le domaine de l’intelligence artificielle (IA), de l’apprentissage automatique (machine learning) et de l’éthique algorithmique. Il désigne le principe selon lequel les systèmes algorithmiques ou les processus de prise de décision automatisés doivent traiter équitablement différents groupes démographiques. L’objectif principal est de garantir que les résultats, les performances ou les impacts d’un système ne désavantagent ou ne favorisent pas de manière disproportionnée des groupes spécifiques, généralement définis par des attributs protégés ou sensibles tels que la race, le sexe, l’âge, l’origine ethnique, la religion, le handicap ou l’orientation sexuelle.
Les concepts fondamentaux et les principes essentiels de la Group Fairness reposent sur l’idée de parité statistique entre les groupes. Plutôt que de se concentrer sur l’équité pour chaque individu (ce qui relève de l’Individual Fairness), la Group Fairness évalue l’équité au niveau agrégé des groupes. Elle exige que certaines métriques statistiques soient approximativement égales pour tous les groupes considérés. Ces métriques peuvent concerner les taux de décision (par exemple, taux d’acceptation pour un prêt), les taux d’erreur (faux positifs, faux négatifs) ou la distribution des scores de prédiction. Le choix des groupes pertinents et des attributs protégés est une étape cruciale, souvent guidée par des considérations légales, éthiques et sociales visant à prévenir la discrimination historique ou systémique.
L’importance de la Group Fairness est considérable, en particulier avec la prolifération des systèmes d’IA dans des domaines à fort enjeu. Dans des secteurs comme le recrutement, l’octroi de crédit, la justice pénale, l’accès aux soins de santé, l’éducation ou la modération de contenu, les décisions algorithmiques peuvent avoir des conséquences profondes sur la vie des individus. Assurer la Group Fairness est essentiel pour prévenir la perpétuation ou l’amplification des biais sociétaux existants par les technologies. C’est une condition nécessaire pour bâtir la confiance du public dans l’IA, pour se conformer aux législations anti-discrimination et pour promouvoir une société plus juste et équitable. L’absence de Group Fairness peut entraîner des préjudices systémiques, renforcer les inégalités et miner la légitimité des systèmes automatisés.
Les applications pratiques de la Group Fairness sont nombreuses. Dans le recrutement, on peut l’utiliser pour vérifier qu’un outil de présélection de CV ne désavantage pas systématiquement les candidats d’un certain genre ou d’une certaine origine ethnique ayant des qualifications égales. Dans le secteur bancaire, elle permet de s’assurer qu’un modèle de scoring de crédit n’attribue pas des taux de refus significativement plus élevés à un groupe racial par rapport à un autre, toutes choses égales par ailleurs en termes de solvabilité. En reconnaissance faciale, la Group Fairness exige que les taux d’erreur soient similaires pour les personnes de différentes couleurs de peau ou genres. Un autre exemple est celui des systèmes de recommandation, où l’on cherche à éviter que certains groupes démographiques soient systématiquement exposés à des contenus de moindre qualité ou à des opportunités limitées (par exemple, offres d’emploi).
Il existe plusieurs nuances et interprétations de la Group Fairness, souvent formalisées par différentes métriques mathématiques qui ne sont pas toujours compatibles entre elles. Les définitions les plus courantes incluent :
La Parité Démographique (ou Parité Statistique) : exige que la probabilité d’obtenir un résultat favorable (par exemple, être embauché, obtenir un prêt) soit la même pour tous les groupes. C’est une définition simple mais qui peut être problématique si les taux de base réels diffèrent légitimement entre les groupes.
L’Égalité des Chances (Equal Opportunity) : exige que le taux de vrais positifs soit égal pour tous les groupes. Par exemple, parmi les candidats qualifiés, la probabilité d’être embauché doit être la même quel que soit le groupe.
L’Égalité des Cotes (Equalized Odds) : une condition plus stricte qui exige à la fois l’égalité des taux de vrais positifs et l’égalité des taux de faux positifs entre les groupes. Cela signifie que le système commet des erreurs (positives et négatives) de manière équivalente pour tous les groupes.
La Calibration : exige que, pour un score de prédiction donné, la probabilité réelle de l’issue positive soit la même pour tous les groupes.
Le choix de la métrique appropriée dépend fortement du contexte d’application et des valeurs sociétales que l’on souhaite privilégier, car il est souvent mathématiquement impossible de satisfaire plusieurs de ces critères simultanément tout en maximisant la précision globale du modèle (ce qui est connu sous le nom de « théorèmes d’impossibilité de l’équité »).
Plusieurs concepts sont étroitement liés à la Group Fairness. L’Individual Fairness (Équité Individuelle) est un concept complémentaire mais distinct, qui stipule que des individus similaires devraient être traités de manière similaire par le système. L’Algorithmic Bias (Biais Algorithmique) est le phénomène que la Group Fairness cherche à mesurer et à atténuer. Les Protected Attributes (Attributs Protégés) ou Sensitive Attributes (Attributs Sensibles) sont les caractéristiques utilisées pour définir les groupes. Le Disparate Impact est un concept juridique désignant des pratiques qui ne sont pas explicitement discriminatoires mais qui ont un effet négatif disproportionné sur un groupe protégé ; la Group Fairness fournit des outils quantitatifs pour évaluer ce risque. L’Explainability (Explicabilité) et l’Interpretability (Interprétabilité) des modèles sont souvent nécessaires pour comprendre les sources potentielles de manque d’équité. Antonymes ou concepts opposés incluent la discrimination algorithmique, le biais systémique et l’iniquité de groupe.
L’origine du concept de Group Fairness dans le contexte de l’IA est relativement récente, émergeant de manière significative au cours des années 2010. Elle s’inscrit dans une longue histoire de luttes pour les droits civiques et contre la discrimination, mais son application spécifique aux algorithmes a été catalysée par la prise de conscience croissante que les systèmes d’apprentissage automatique, même entraînés sur de grandes quantités de données, pouvaient reproduire et même amplifier les biais présents dans ces données ou dans les processus de décision humains qu’ils modélisent. Des travaux de recherche pionniers ont mis en évidence des exemples concrets de biais dans des systèmes déployés, stimulant le développement de définitions formelles de l’équité et de techniques pour l’atteindre. Les discussions sur la Group Fairness sont influencées par des disciplines variées, notamment l’informatique, les statistiques, le droit, la sociologie et la philosophie éthique.
Les avantages de la prise en compte de la Group Fairness incluent la promotion de l’égalité des chances, la réduction des préjudices discriminatoires, l’amélioration de la confiance et de l’acceptabilité des systèmes d’IA, et la contribution à la conformité légale et réglementaire. Cependant, sa mise en œuvre présente des défis et des limitations importants. Un défi majeur réside dans le choix de la définition appropriée de l’équité, car différentes métriques peuvent conduire à des conclusions et des interventions contradictoires. Il existe souvent un compromis (trade-off) perçu ou réel entre l’équité de groupe et la précision ou l’utilité globale du système, bien que ce compromis ne soit pas toujours inévitable. La mesure de la Group Fairness nécessite généralement l’accès aux données sur les attributs sensibles, ce qui soulève des préoccupations en matière de vie privée et peut être légalement restreint dans certains contextes. La définition même des groupes pertinents peut être complexe et contestée, et une focalisation excessive sur des groupes prédéfinis peut masquer d’autres formes d’iniquité ou des intersections complexes de désavantages. Enfin, les techniques visant à améliorer la Group Fairness peuvent parfois être considérées comme des solutions techniques à des problèmes sociaux profondément enracinés, risquant de détourner l’attention des changements structurels nécessaires. La mise en œuvre technique elle-même peut être complexe, nécessitant des expertises spécifiques et une surveillance continue.