¿Qué son los Valores de T y los Valores de P en las Estadísticas?
Si no eres un estadístico, mirar los resultados estadísticos a veces puede hacerte sentir un poco como Alicia en el país de las Maravillas. De repente, entras en un mundo fantástico donde extraños y misteriosos fantasmas aparecen de la nada.
Por ejemplo, considere la T y la P en los resultados de su prueba t.
» ¡Más y más curiosos!»puedes exclamar, como Alicia, mientras miras tu salida.
¿Cuáles son realmente estos valores? ¿De dónde vienen? Incluso si ha utilizado el valor p para interpretar la significación estadística de sus resultados innumerables veces, su origen real puede permanecer turbio para usted.
T & P: El Patachún) y Tweedledum de un T-test
T y P están inextricablemente vinculados. Van cogidos del brazo, como Tweedledee y Tweedledum. He aquí por qué.
Cuando realiza una prueba t, por lo general está tratando de encontrar evidencia de una diferencia significativa entre las medias de la población (t de 2 muestras) o entre la media de la población y un valor hipotético (t de 1 muestra). El valor t mide el tamaño de la diferencia en relación con la variación de los datos de la muestra. Dicho de otra manera, T es simplemente la diferencia calculada representada en unidades de error estándar. Cuanto mayor es la magnitud de T, mayor es la evidencia contra la hipótesis nula. Esto significa que hay mayor evidencia de que hay una diferencia significativa. Cuanto más cerca esté T de 0, más probable es que no haya una diferencia significativa.
Recuerde, el valor t de su salida se calcula a partir de una sola muestra de toda la población. Si tomaras muestras aleatorias repetidas de datos de la misma población, obtendrías valores t ligeramente diferentes cada vez, debido a un error de muestreo aleatorio (que en realidad no es un error de ningún tipo, es solo la variación aleatoria esperada en los datos).
¿Qué tan diferentes podrían ser los valores t de muchas muestras aleatorias de la misma población? ¿Y cómo se compara el valor t de los datos de muestra con los valores t esperados?
Puede usar una distribución t para averiguarlo.
Usando una distribución t para calcular la probabilidad
Para fines ilustrativos, suponga que está utilizando una prueba t de 1 muestra para determinar si la media de la población es mayor que un valor hipotético, como 5, basado en una muestra de 20 observaciones, como se muestra en la salida de la prueba t anterior.
- En Minitab, elija Gráfico > Gráfico de Distribución de probabilidad.
- Seleccione Ver probabilidad y, a continuación, haga clic en Aceptar.
- De Distribución, seleccione t.
- En Grados de libertad, introduzca 19. (Para una prueba t de 1 muestra, los grados de libertad son iguales al tamaño de la muestra menos 1).
- Haga clic en el Área sombreada. Seleccione Valor X. Seleccione Cola Derecha.
- En Valor X, escriba 2.8 (el valor t) y, a continuación, haga clic en Aceptar.
La parte más alta (pico) de la curva de distribución le muestra dónde puede esperar que la mayoría de los valores t caigan. La mayoría de las veces, esperarías obtener valores t cercanos a 0. Eso tiene sentido, ¿verdad? Porque si selecciona aleatoriamente muestras representativas de una población, la media de la mayoría de esas muestras aleatorias de la población debe ser cercana a la media general de la población, haciendo que sus diferencias (y por lo tanto los valores t calculados) sean cercanas a 0.
Los valores de T, los valores de P y las manos de póquer
Los valores de T de magnitudes mayores (negativas o positivas) son menos probables. Las «colas» de extremo izquierdo y derecho de la curva de distribución representan instancias de obtención de valores extremos de t, lejos de 0. Por ejemplo, la región sombreada representa la probabilidad de obtener un valor t de 2,8 o superior. Imagine un dardo mágico que podría lanzarse al azar a cualquier lugar bajo la curva de distribución. ¿Cuál es la posibilidad de que aterrice en la región sombreada? La probabilidad calculada es de 0,005712…..que redondea a 0,006…que es…¡el valor p obtenido en los resultados de la prueba t!
En otras palabras, la probabilidad de obtener un valor t de 2,8 o superior, al muestrear de la misma población (aquí, una población con una media hipotética de 5), es de aproximadamente 0,006.
¿Qué tan probable es eso? ¡No mucho! A modo de comparación, la probabilidad de que se repartan 3 cartas en una mano de póquer de 5 cartas es tres veces mayor (≈ 0,021).
Dado que la probabilidad de obtener un valor t tan alto o mayor cuando el muestreo de esta población es tan bajo, ¿qué es más probable? Es más probable que esta muestra no provenga de esta población (con la media hipotética de 5). Es mucho más probable que esta muestra provenga de una población diferente, una con una media superior a 5.
A saber: Debido a que el valor de p es muy bajo (< nivel alfa), rechaza la hipótesis nula y concluye que hay una diferencia estadísticamente significativa.
De esta manera, T y P están inextricablemente vinculados. Considéralos simplemente diferentes formas de cuantificar la «extremidad» de tus resultados bajo la hipótesis nula. No se puede cambiar el valor de uno sin cambiar el otro.
Cuanto mayor sea el valor absoluto del valor t, menor será el valor p y mayor será la evidencia contra la hipótesis nula.(Puede verificar esto ingresando valores t más bajos y más altos para la distribución t en el paso 6 anterior).
Pruebe este seguimiento de dos colas…
El ejemplo de distribución t mostrado anteriormente se basa en una prueba t de una sola cola para determinar si la media de la población es mayor que un valor hipotético. Por lo tanto, el ejemplo de distribución t muestra la probabilidad asociada con el valor t de 2,8 solo en una dirección (la cola derecha de la distribución).
¿Cómo usaría la distribución t para encontrar el valor p asociado con un valor t de 2,8 para la prueba t de dos colas (en ambas direcciones)?
Sugerencia: En Minitab, ajusta las opciones del paso 5 para encontrar la probabilidad de ambas colas. Si no tiene una copia de Minitab, descargue una versión de prueba gratuita de 30 días.
Leave a Reply