Articles

Quais são os valores T E P nas estatísticas?

Se você não é um estatístico, olhar através da saída estatística pode às vezes fazer você se sentir um pouco como Alice no país das maravilhas. De repente, entras num mundo fantástico onde fantasmas estranhos e misteriosos aparecem do nada.

por exemplo, considere o T E P nos seus resultados do teste-T.

“Curiouser and curiouser!”podes exclamar, como a Alice, enquanto olhas para a tua saída.

resultado de teste de uma amostra T

Quais são estes valores, na verdade? De onde vêm? Mesmo que você tenha usado o valor-p para interpretar a significância estatística de seus resultados várias vezes, sua origem real pode permanecer Obscura para você.

T & P: o Tweedledee e o Tweedledum de um teste T

T E P estão indissociavelmente ligados. Ficam de braço dado, como o Tweedledee e o Tweedledum. Eis o porquê.

Quando você realiza um teste-t, você geralmente está tentando encontrar evidências de uma diferença significativa entre as médias da população (2-Amostra t) ou entre a média da população e um valor hipotético (1-amostra t). O valor t mede o tamanho da diferença em relação à variação dos dados da amostra. Dito de outra forma, T é simplesmente a diferença calculada representada em unidades de erro padrão. Quanto maior a magnitude de T, maior a evidência contra a hipótese nula. Isto significa que há maior evidência de que há uma diferença significativa. Quanto mais perto T é de 0, mais provável não há uma diferença significativa.

lembre-se, o valor-t na sua saída é calculado a partir de apenas uma amostra de toda a população. Ele você pegou amostras aleatórias repetidas de dados da mesma população, você obterá valores t ligeiramente diferentes de cada vez, devido a erro de amostragem aleatória (o que realmente não é um erro de qualquer tipo–é apenas a variação aleatória esperada nos dados).

Como é que se pode esperar que os valores de t de muitas amostras aleatórias da mesma população sejam diferentes? E como é que o valor t dos seus dados de amostra se compara com os valores t esperados?

pode usar uma distribuição-t para descobrir.

Utilizando a distribuição t para calcular a probabilidade

Para fins de ilustração, suponha que você está usando um 1-sample t-test para determinar se a média da população é maior do que uma hipótese de valor, tais como 5, com base numa amostra de 20 observações, como mostrado no exemplo acima teste-t de saída.

  1. In Minitab, choose Graph > Probability Distribution Plot.
  2. seleccione a probabilidade de visualização, depois carregue em OK.
  3. da distribuição, seleccione T.
  4. em graus de liberdade, indique 19. (Para um teste de 1 amostra t, os graus de liberdade são iguais ao tamanho da amostra menos 1).clique na área sombreada. Seleccione O Valor X. Escolha A Cauda Direita.
  5. no valor X, indique 2. 8( o valor t) e carregue em OK.

a parte mais elevada (pico) da curva de distribuição mostra-lhe onde pode esperar que a maior parte dos valores-t diminuam. Na maioria das vezes, você esperaria obter valores t próximos de 0. Faz sentido, certo? Porque se você seleciona aleatoriamente amostras representativas de uma população, a média da maioria dessas amostras aleatórias da população deve estar perto da média da população total, tornando suas diferenças (e, portanto, os valores t calculados) perto de 0.

t valores, P valores e mãos de poker

t valores de magnitudes maiores (negativos ou positivos) são menos prováveis. As “caudas” de extrema esquerda e direita da curva de distribuição representam instâncias de obtenção de valores extremos de t, longe de 0. Por exemplo, a região sombreada representa a probabilidade de obter um valor t igual ou superior a 2,8. Imagine um dardo mágico que poderia ser jogado para pousar aleatoriamente em qualquer lugar sob a curva de distribuição. Qual é a hipótese de aterrar na região sombreada? A probabilidade calculada é de 0.005712…..que atinge 0,006…que é…o valor p obtido nos resultados do ensaio t!

Em outras palavras, a probabilidade de obtenção de um t-valor de 2.8 ou superior, quando a amostragem da mesma população (aqui, uma população com uma média hipotética de 5), é de cerca de 0,006.quão provável é isso? Não muito! Para comparação, a probabilidade de ser tratada 3-de-um-tipo em uma mão de poker de 5 cartas é mais de três vezes mais alta (≈ 0,021).

dado que a probabilidade de obter um valor t tão elevado ou superior quando a amostragem desta população é tão baixa, o que é mais provável? É mais provável que esta amostra não venha desta população (com a hipotética média de 5). É muito mais provável que esta amostra venha de uma população diferente, uma com uma média superior a 5.

: Como o valor p é muito baixo (< nível alfa), você rejeita a hipótese nula e conclui que há uma diferença estatisticamente significativa.desta forma, T E P estão indissociavelmente ligados. Considere – os simplesmente diferentes maneiras de quantificar a “extrema” de seus resultados sob a hipótese nula. Não se pode mudar o valor de um sem mudar o outro.

Quanto maior o valor absoluto do valor-t, menor o valor-p, e maior a evidência contra a hipótese nula.(Você pode verificar isso inserindo valores t mais baixos e mais elevados para a distribuição t no Passo 6 acima).

tente este seguimento de duas caudas…

o exemplo de distribuição t mostrado acima é baseado em um teste T de uma cauda para determinar se a média da população é maior do que um valor hipotético. Portanto, o exemplo de distribuição-t mostra a probabilidade associada com o valor-t de 2,8 apenas em uma direção (a cauda direita da distribuição).

Como você usaria a distribuição-t para encontrar o valor-p associado a um valor-T de 2.8 para o teste-T de duas caudas (em ambas as direções)?

dica: no Minitab, ajuste as opções no Passo 5 para encontrar a probabilidade para ambas as caudas. Se você não tiver uma cópia do Minitab, baixe uma versão de teste gratuita de 30 dias.