Articles

Que sont les Valeurs T et les valeurs P dans les statistiques?

Si vous n’êtes pas un statisticien, regarder à travers la sortie statistique peut parfois vous faire vous sentir un peu comme Alice au pays des merveilles. Soudain, vous entrez dans un monde fantastique où des fantômes étranges et mystérieux apparaissent de nulle part.

Par exemple, considérez le T et le P dans vos résultats de test t.

 » Plus curieux et plus curieux! »vous pourriez vous exclamer, comme Alice, en regardant votre sortie.

Sortie de test T à un échantillon

Quelles sont ces valeurs, vraiment? D’où viennent-ils ? Même si vous avez utilisé la valeur p pour interpréter la signification statistique de vos résultats une énième fois, son origine réelle peut rester trouble pour vous.

T &P: Le Tweedledee et le Tweedledum d’un test T

T et P sont inextricablement liés. Ils vont bras dessus bras dessous, comme Tweedledee et Tweedledum. Voici pourquoi.

Lorsque vous effectuez un test t, vous essayez généralement de trouver des preuves d’une différence significative entre la moyenne de la population (2 échantillons t) ou entre la moyenne de la population et une valeur hypothétique (1 échantillon t). La valeur t mesure la taille de la différence par rapport à la variation de vos données d’échantillon. Autrement dit, T est simplement la différence calculée représentée en unités d’erreur-type. Plus la magnitude de T est grande, plus la preuve contre l’hypothèse nulle est grande. Cela signifie qu’il y a plus de preuves qu’il existe une différence significative. Plus T est proche de 0, plus il est probable qu’il n’y ait pas de différence significative.

N’oubliez pas que la valeur t de votre sortie est calculée à partir d’un seul échantillon de la population entière. Si vous preniez des échantillons aléatoires répétés de données de la même population, vous obteniez des valeurs t légèrement différentes à chaque fois, en raison d’une erreur d’échantillonnage aléatoire (ce qui n’est vraiment pas une erreur d’aucune sorte – c’est juste la variation aléatoire attendue dans les données).

Dans quelle mesure pouvez-vous vous attendre à ce que les valeurs t de nombreux échantillons aléatoires de la même population soient différentes? Et comment la valeur t de vos données d’échantillon se compare-t-elle aux valeurs t attendues?

Vous pouvez utiliser une distribution t pour le savoir.

Utilisation d’une distribution t pour calculer la probabilité

Pour des raisons d’illustration, supposons que vous utilisez un test t à 1 échantillon pour déterminer si la moyenne de la population est supérieure à une valeur hypothétique, telle que 5, sur la base d’un échantillon de 20 observations, comme indiqué dans la sortie du test t ci-dessus.

  1. Dans Minitab, choisissez Graphique > Diagramme de distribution de probabilité.
  2. Sélectionnez Afficher la probabilité, puis cliquez sur OK.
  3. Dans Distribution, sélectionnez t.
  4. Dans Degrés de liberté, entrez 19. (Pour un test t à 1 échantillon, les degrés de liberté sont égaux à la taille de l’échantillon moins 1).
  5. Cliquez sur Zone ombrée. Sélectionnez la valeur X. Sélectionnez la queue droite.
  6. Dans la valeur X, entrez 2,8 (la valeur t), puis cliquez sur OK.

La partie la plus élevée (crête) de la courbe de distribution vous indique où vous pouvez vous attendre à ce que la plupart des valeurs t tombent. La plupart du temps, vous vous attendez à obtenir des valeurs t proches de 0. C’est logique, non ? Parce que si vous sélectionnez au hasard des échantillons représentatifs d’une population, la moyenne de la plupart de ces échantillons aléatoires de la population devrait être proche de la moyenne globale de la population, ce qui rend leurs différences (et donc les valeurs t calculées) proches de 0.

Les valeurs T, les valeurs P et les mains de poker

Les valeurs T de plus grandes magnitudes (négatives ou positives) sont moins probables. Les « queues » extrême gauche et droite de la courbe de distribution représentent des exemples d’obtention de valeurs extrêmes de t, loin de 0. Par exemple, la région ombrée représente la probabilité d’obtenir une valeur t de 2,8 ou plus. Imaginez une fléchette magique qui pourrait être lancée pour atterrir au hasard n’importe où sous la courbe de distribution. Quelle est la chance qu’il atterrisse dans la région ombragée? La probabilité calculée est de 0,005712…..qui arrondit à 0,006…ce qui est…la valeur p obtenue dans les résultats du test t !

En d’autres termes, la probabilité d’obtenir une valeur t de 2,8 ou plus, lors de l’échantillonnage de la même population (ici, une population avec une moyenne hypothétique de 5), est d’environ 0,006.

Quelle est la probabilité? Pas très! À titre de comparaison, la probabilité d’être traité 3-of-a-kind dans une main de poker à 5 cartes est plus de trois fois plus élevée (≈ 0,021).

Étant donné que la probabilité d’obtenir une valeur t aussi élevée ou plus élevée lors de l’échantillonnage de cette population est si faible, qu’y a-t-il de plus probable? Il est plus probable que cet échantillon ne provienne pas de cette population (avec la moyenne hypothétique de 5). Il est beaucoup plus probable que cet échantillon provienne d’une population différente, dont la moyenne est supérieure à 5.

À l’esprit: Parce que la valeur p est très faible (niveau alpha <), vous rejetez l’hypothèse nulle et concluez qu’il existe une différence statistiquement significative.

De cette façon, T et P sont inextricablement liés. Considérez-les simplement de différentes façons de quantifier « l’extrême » de vos résultats sous l’hypothèse nulle. Vous ne pouvez pas changer la valeur de l’un sans changer l’autre.

Plus la valeur absolue de la valeur t est grande, plus la valeur p est petite et plus la preuve contre l’hypothèse nulle est grande.(Vous pouvez le vérifier en entrant des valeurs t inférieures et supérieures pour la distribution t à l’étape 6 ci-dessus).

Essayez ce suivi à deux queues…

L’exemple de distribution t ci-dessus est basé sur un test t à une queue pour déterminer si la moyenne de la population est supérieure à une valeur hypothétique. Par conséquent, l’exemple de distribution t montre la probabilité associée à la valeur t de 2,8 uniquement dans une direction (la queue droite de la distribution).

Comment utiliseriez-vous la distribution t pour trouver la valeur p associée à une valeur t de 2,8 pour le test t à deux queues (dans les deux sens)?

Astuce : Dans Minitab, ajustez les options à l’étape 5 pour trouver la probabilité pour les deux queues. Si vous n’avez pas de copie de Minitab, téléchargez une version d’essai gratuite de 30 jours.