Définition Standardized Score (z-score) -

Score Standardisé (z-score)

Le score standardisé, communément appelé z-score ou score z, est une mesure statistique descriptive qui indique à combien d’écarts-types une observation ou un point de données spécifique se situe par rapport à la moyenne d’une distribution de référence. Il quantifie la position relative d’une valeur brute (score initial) au sein de son groupe ou de sa population, en exprimant cette position dans une unité standardisée, l’écart-type. Un z-score positif indique que la valeur brute est supérieure à la moyenne, tandis qu’un z-score négatif signifie qu’elle est inférieure à la moyenne. Un z-score de zéro indique que la valeur brute est exactement égale à la moyenne.

Les concepts fondamentaux derrière le z-score reposent sur la moyenne (mesure de tendance centrale) et l’écart-type (mesure de dispersion ou de variabilité) d’un ensemble de données. La formule pour calculer le z-score d’une valeur individuelle X dans une population est z = (X – μ) / σ, où μ est la moyenne de la population et σ est l’écart-type de la population. Si l’on travaille avec un échantillon, la formule est similaire : z = (x – x̄) / s, où x est la valeur individuelle de l’échantillon, x̄ est la moyenne de l’échantillon, et s est l’écart-type de l’échantillon. Cette transformation, appelée standardisation ou normalisation (bien que ce dernier terme puisse aussi désigner d’autres transformations), convertit la distribution originale en une nouvelle distribution (la distribution des z-scores) qui a toujours une moyenne de 0 et un écart-type de 1. Ceci est vrai quelle que soit la forme de la distribution originale.

L’importance et la pertinence du z-score sont considérables dans de nombreux domaines. Son principal avantage est de permettre la comparaison de valeurs provenant de distributions différentes, qui peuvent avoir des moyennes et des écarts-types distincts, et même des unités de mesure différentes. En ramenant toutes les valeurs à une échelle commune (le nombre d’écarts-types par rapport à la moyenne), le z-score facilite l’interprétation et la comparaison objectives. Il joue un rôle crucial en inférence statistique, notamment dans les tests d’hypothèses (par exemple, le test z) et la construction d’intervalles de confiance, particulièrement lorsque la distribution sous-jacente est approximativement normale. De plus, il est fondamental pour l’identification des valeurs aberrantes (outliers), car les observations avec des z-scores très élevés en valeur absolue (souvent |z| > 2 ou |z| > 3) sont considérées comme potentiellement inhabituelles. Dans le domaine de l’apprentissage automatique (machine learning), la standardisation via les z-scores est une étape de prétraitement des données courante pour de nombreux algorithmes sensibles à l’échelle des caractéristiques.

Les applications pratiques du z-score sont variées. En éducation, on peut comparer les performances relatives d’un étudiant à différents examens standardisés (comme le SAT et l’ACT aux États-Unis) même si leurs échelles de notation sont différentes. Par exemple, un score de 650 à un examen avec une moyenne de 500 et un écart-type de 100 (z = (650-500)/100 = 1.5) est relativement meilleur qu’un score de 28 à un autre examen avec une moyenne de 20 et un écart-type de 6 (z = (28-20)/6 ≈ 1.33). En médecine, les courbes de croissance pédiatrique utilisent des z-scores pour évaluer la taille et le poids d’un enfant par rapport aux normes de son âge et de son sexe. Les résultats de tests de laboratoire peuvent également être exprimés en z-scores pour situer la valeur d’un patient par rapport à une population de référence saine. En finance, les z-scores peuvent aider à évaluer le risque de crédit d’une entreprise (comme dans le modèle Z-score d’Altman pour la prédiction de faillite) ou à comparer la performance d’un investissement par rapport à un indice de référence. En contrôle qualité industriel, les z-scores permettent de surveiller si les mesures d’un produit restent dans les limites acceptables par rapport aux spécifications.

Il existe des nuances importantes dans l’interprétation des z-scores. Bien que le calcul lui-même ne dépende pas de la forme de la distribution, l’interprétation probabiliste (par exemple, lier un z-score à un percentile spécifique) repose souvent sur l’hypothèse que les données suivent une distribution normale (gaussienne). Dans une distribution normale, environ 68% des données se situent entre z = -1 et z = +1, 95% entre z = -2 et z = +2, et 99.7% entre z = -3 et z = +3 (règle empirique 68-95-99.7). Si la distribution originale n’est pas normale (par exemple, très asymétrique), ces pourcentages ne s’appliquent pas, bien que le z-score indique toujours la distance en écarts-types par rapport à la moyenne. Il faut aussi distinguer le z-score calculé avec les paramètres de la population (μ et σ, souvent inconnus et estimés) du z-score calculé avec les statistiques de l’échantillon (x̄ et s). D’autres types de scores standardisés existent, comme le T-score (souvent utilisé en psychométrie, avec une moyenne de 50 et un écart-type de 10, pour éviter les valeurs négatives et les décimales) ou les stanines (échelle de 1 à 9).

Plusieurs concepts sont étroitement liés au z-score. La moyenne et l’écart-type sont ses composantes de base. La distribution normale est souvent associée à son interprétation probabiliste. Le percentile ou rang centile est une autre façon d’exprimer la position relative d’une valeur, et il peut être dérivé du z-score si la distribution est connue (spécialement si elle est normale). La standardisation est le processus de transformation en z-scores. La normalisation peut être un synonyme de standardisation, mais peut aussi désigner d’autres transformations comme la mise à l’échelle min-max (ramener les valeurs dans l’intervalle [0, 1] ou [-1, 1]). Un terme synonyme courant est « score standard ». Un antonyme serait « score brut » ou « valeur brute », qui représente la mesure originale avant toute transformation.

L’origine du concept de standardisation des variables pour faciliter la comparaison et l’analyse remonte aux pionniers de la statistique moderne à la fin du 19e et au début du 20e siècle, dans le contexte du développement de la théorie de la corrélation et de l’étude de la distribution normale. Bien qu’il soit difficile d’attribuer l’invention précise du terme « z-score » à une seule personne, les travaux de statisticiens comme Karl Pearson sur la standardisation des variables ont jeté les bases. L’utilisation de la lettre « z » est devenue conventionnelle pour représenter une variable aléatoire suivant une distribution normale standard (moyenne 0, écart-type 1), et le terme « z-score » en découle naturellement pour désigner une valeur transformée sur cette échelle standard.

Les avantages du z-score incluent sa capacité à rendre comparables des mesures d’échelles différentes, sa signification intuitive en termes d’écarts-types par rapport à la moyenne, son utilité pour l’identification des valeurs aberrantes, et son rôle fondamental dans de nombreuses procédures statistiques et d’apprentissage automatique. Cependant, il présente aussi des inconvénients et limitations. Son calcul nécessite la connaissance (ou une estimation fiable) de la moyenne et de l’écart-type, qui peuvent eux-mêmes être sensibles aux valeurs extrêmes. L’interprétation des z-scores en termes de probabilités ou de percentiles est fortement dépendante de l’hypothèse de normalité de la distribution sous-jacente. La transformation en z-score ne modifie pas la forme de la distribution (elle ne la rend pas normale si elle ne l’était pas), elle ne fait que la recentrer et la redimensionner. Enfin, pour un public non initié, un z-score peut être moins intuitif qu’un score brut ou un percentile. L’utilisation des z-scores est donc plus pertinente lorsque les comparaisons relatives sont primordiales ou lorsque les hypothèses sous-jacentes (comme la normalité approximative pour certaines interprétations) sont raisonnablement satisfaites.