análise da Pontuação da propensão
antecedentes
ao estimar os efeitos do tratamento num resultado binário nos estudos de observação, é frequentemente o caso de os tratamentos não terem sido distribuídos aleatoriamente aos indivíduos. Se, por exemplo, os doentes mais doentes eram frequentemente afectados ao tratamento, enquanto os doentes mais saudáveis não eram frequentemente tratados, uma análise simples poderia estimar erradamente o grau ou a direcção de um efeito de tratamento.
uma forma comum de tentar ajustar para o viés potencial devido a este tipo de confusão é pelo uso de modelos de regressão logística multivariáveis. Uma abordagem alternativa é a utilização da análise de pontuação de propensão. Nas secções seguintes, fornecemos um pequeno conjunto de dados de exemplo, e depois descrevemos e ilustramos estes métodos alternativos de análise estatística. Concentramo-nos no exemplo mais simples em que os doentes são designados para receber tratamento activo ou controlo (ou seja, grupos 2). No final, mencionamos brevemente possíveis extensões a três ou mais grupos de tratamento.
dados de exemplo
o conjunto de dados de exemplo a seguir será utilizado para ilustrar os conceitos básicos. Os dados incluem 400 indivíduos incluídos num estudo retrospectivo de coorte de homens entre 40 e 70 anos admitidos no hospital com suspeita de enfarte do miocárdio. O resultado do interesse é a mortalidade de 30 dias (Morte=1). De interesse é o possível efeito da rápida administração de uma nova droga redutora de coágulos (trt=1) versus uma terapia padrão (trt=0) no risco de mortalidade. Covariadas relevantes são uma pontuação pré-existente do factor de risco (numa escala de 0 a 5, 5 sendo a pior) e uma pontuação de gravidade da admissão (numa escala de 0 a 10, 10 sendo a pior). Aqui estão os dados para os primeiros 12 indivíduos:
age | male | risk | severity | trt | death |
---|---|---|---|---|---|
48 | 1 | 3 | 8 | 0 | 0 |
59 | 1 | 4 | 6 | 1 | 0 |
67 | 1 | 3 | 6 | 0 | 1 |
51 | 1 | 0 | 6 | 0 | 0 |
56 | 1 | 1 | 6 | 1 | 0 |
60 | 1 | 1 | 6 | 0 | 0 |
53 | 1 | 0 | 3 | 1 | 0 |
54 | 1 | 1 | 2 | 0 | 0 |
54 | 1 | 2 | 7 | 0 | 0 |
62 | 1 | 0 | 4 | 0 | 0 |
64 | 1 | 2 | 6 | 1 | 1 |
70 | 1 | 3 | 8 | 1 | 0 |
… | … | … | … | … | … |
Os dados também podem ser baixados como propensão.csv ou chamado diretamente em R usando o comando:
example <- read.csv("http://web.hku.hk/~bcowling/data/propensity.csv", header=TRUE)
um script R acompanhante para executar todas as seguintes análises podem ser encontradas aqui: propensão.R.
análise descritiva
um total de 192 (48%) doentes receberam o novo tratamento (trt=1). As taxas de mortalidade de 30 dias para doentes tratados e não tratados estão resumidas na tabela seguinte.:
Resultado | trt=0 | trt=1 |
---|---|---|
Sobreviveu | 168 | 162 |
Morreu | 40 | 30 |
30 dias taxa de mortalidade | 19% | 16% |
Uma maneira de investigar o potencial efeito do tratamento é com uma estimativa da diferença de risco entre os dois grupos. O risco relativo de mortalidade associado ao tratamento 1 é de 0, 375/0, 40, o que é de 0, 81, sugerindo um ligeiro benefício para o tratamento mais recente.outra forma de estimar o efeito do tratamento pode ser calcular a razão de probabilidade e não o risco relativo. A razão de probabilidade é (168×30)/(162×40), que é 0, 78, e um intervalo de confiança de 95% pode ser calculado como (0, 46, 1, 31).uma terceira forma de estimar o efeito do tratamento é analisar a redução absoluta das taxas de mortalidade. Aqui a alteração associada ao tratamento 1 é de -3, 6% (de 19, 2% para 15, 6%) e um intervalo de confiança de 95% é (-11.5%, 4,3%), ou seja, uma redução de 12% ou um aumento de 4% nas taxas de mortalidade.
no Entanto, os dois seguintes gráficos mostram que os sujeitos que dado o mais recente tratamento foram ligeiramente mais velhos do que os que receberam a terapia padrão:
além disso, a investigação revela que parece haver também diferenças nos fatores de risco e situação atual entre os dois grupos de tratamento:
Formal comparação das distribuições dessas variáveis entre os dois grupos de tratamento revela que as diferenças de idade (teste t, ppp
de regressão Logística
modelos Multivariados são, muitas vezes, para avaliar o efeito do tratamento durante o ajuste para variáveis explicativas importantes. É necessário ajustar as variáveis explicativas importantes para assegurar a comparabilidade entre os grupos de tratamento e de controlo e, se o ajustamento não for efectuado, as diferenças entre os grupos podem levar a estimativas parciais do efeito do tratamento.
A tabela abaixo mostra o rácio de probabilidades bruto do tratamento, em seguida, o efeito ajustado para outras variáveis explicativas. A comparação do critério de informação Akaike para cada modelo sugere que a pontuação de risco e o índice de gravidade não melhoram significativamente a adequação, ou seja, o modelo 2 pode ser preferido ao modelo 3. Há uma sugestão de um benefício de tratamento (embora não estatisticamente significativo), e também aparente confusão por idade como suspeito pelas análises descritivas acima.
As estimativas de um modelo assumindo efeitos lineares de covariados são muito semelhantes ao modelo 3 (resultados não apresentados).
Factor | n | Modelo 1 | Modelo 2 | Modelo 3 | |||
---|---|---|---|---|---|---|---|
OU | 95% CI | OU | 95% CI | OU | 95% CI | ||
Tratamento 0 | 208 | 1.00 | – | 1.00 | – | 1.00 | – |
Tratamento 1 | 192 | de 0,78 | (0.46, 1.31) | 0.67 | (0.39, 1.15) | 0.62 | (0.35, 1.11) |
Age 40-49 | 95 | – | – | 1.00 | – | – | – |
Age 50-59 | 131 | – | – | 1.72 | (0.77, 3.82) | 1.26 | (0.52, 3.01) |
Age 60-70 | 175 | – | – | 2.62 | (1.23, 5.62) | 2.03 | (0.84, 4.95) |
Risk score 0 | 112 | – | – | – | – | 1.00 | – |
Risk score 1 | 103 | – | – | – | – | 3.06 | (1.34, 6.97) |
Risk score 2-3 | 132 | – | – | – | – | 1.33 | (0.54, 3.28) |
Risk score 4-5 | 53 | – | – | – | – | 2.64 | (0.95, 7.35) |
Severity index 0-3 | 108 | – | – | – | – | 1.00 | – |
Severity index 4 | 69 | – | – | – | – | 1.29 | (0.56, 2.96) |
Severity index 5 | 80 | – | – | – | – | 0.78 | (0.33, 1.87) |
Severity index 6 | 56 | – | – | – | – | 1.28 | (0.53, 3.08) |
Severity index 7-10 | 87 | – | – | – | – | 1.43 | (0.65, 3.16) |
AIC | 374 | 371 | 371 |
For completeness we could also use a non-linear regression model to check the shape of the effects of age, pre-existing risk and severity in the fully adjusted model. O script R que o acompanha contém o código para estimar e traçar as funções de linha correspondentes e nós não mostramos estas aqui; notamos que os efeitos foram bastante lineares.
análise da pontuação de Propensão
uma abordagem alternativa à análise é tentar imitar as condições de um ensaio controlado aleatório (RCT). Em um RCT, a probabilidade de um participante receber um tratamento particular é a mesma para todos os participantes ou, em projetos estratificados, depende apenas das variáveis explicativas conhecidas de um paciente como idade, sexo, etc. Em outras palavras, a idade do paciente, o sexo (etc.) é informação suficiente para nos dizer a probabilidade do paciente de receber o tratamento.
Se em um estudo observacional definição tivemos todas as informações disponíveis para os profissionais de saúde que atribuiu o tratamento de assuntos, devemos ser capazes de recriar o seu processo de decisão e estimar a probabilidade de que os pacientes receberam o tratamento. Esta probabilidade é referida como a pontuação de propensão, e em seu artigo seminal de 1983 Rosenbaum e Rubin mostraram que enquanto a pontuação de propensão for uma medida apropriada da probabilidade de receber tratamento, as pontuações podem ser usadas para ajudar a estimar os efeitos causais do tratamento. Os resultados são usados para equilibrada as variáveis prognósticas entre tratados e não tratados grupos, e há (pelo menos) quatro possíveis maneiras para fazer isso:
- Estratificar os pacientes em grupos (por exemplo, os quintis) pelo escore de propensão e comparar os efeitos do tratamento em cada estrato.
- corresponde aos doentes tratados e não tratados e compara os pares correspondentes resultantes.ponderação inversa dos resultados pela pontuação de propensão.Ajuste para a pontuação de propensão num modelo de regressão logística.
5.1 estimar a pontuação de propensão
a pontuação de propensão é a probabilidade condicional de que um indivíduo seja tratado dadas as variáveis explicativas observadas; a intenção é que esta probabilidade única possa resumir a informação sobre o mecanismo de atribuição do tratamento. Devemos então ser capazes de obter estimativas imparciais dos efeitos do tratamento comparando indivíduos que tinham probabilidades semelhantes de receber um tratamento (quer eles realmente receberam ou não).as pontuações de Propensão são normalmente estimadas utilizando um modelo de regressão logística multivariável.no nosso exemplo, adaptámos um modelo de regressão logística para estimar os efeitos da Idade, Pontuação de risco e índice de gravidade na probabilidade de receber tratamento 1 em vez de tratamento 0. Encontramos que idade mais velha( p = 0, 05), pontuação de risco mais elevada (p=0, 05) e índice de gravidade mais elevado (p=0.01) estão todos associados a uma maior probabilidade de receber tratamento 1. As pontuações de propensão variam de 0,2 a 0,8, e comparamos a distribuição de pontuações entre os dois grupos de tratamento na figura abaixo. As barras mostram o intervalo mediano e inter-quartilo.
Como seria de esperar, o propensity scores (i.e. a probabilidade de receber tratamento) são, em média, ligeiramente superior no grupo de tratamento. Podemos ver que há um bom grau de sobreposição, onde podemos encontrar indivíduos em ambos os grupos de tratamento para qualquer pontuação de propensão entre 0,2 e 0,8. Este é importante, porque o princípio essencial da análise de pontuação de propensão é que se encontrarmos dois indivíduos, um em cada grupo de tratamento, podemos imaginar que esses dois indivíduos foram ‘aleatoriamente’ atribuídos a cada grupo no sentido de qualquer alocação ser igualmente provável.
5. 2 a Pontuação da propensão balança os grupos?
em qualquer análise de pontuação de propensão devemos verificar se o propensityscore nos permite equilibrar a distribuição de variáveis explicativas. Existem muitas maneiras de verificar o equilíbrio; por exemplo, poderíamos olhar para a distribuição de uma variável explicativa dentro dos quintis da pontuação de propensão. Na figura abaixo podemos marcar a mediana e intervalos interquartis de idade, em cada escore de propensão quintil:
Sem ajuste (geral) existe uma considerável discrepância. No entanto, dentro de cada quntile, as distribuições estão muito alinhadas.
podemos quantificar as diferenças iniciais calculando as estatísticas de duas amostras (isto é, um teste t para as diferenças de idade por grupo de tratamento). Isto é equivalente a encontrar a estatística t para tratamento a partir de um modelo de regressão linear (ou ANOVA) para a idade versus grupo de tratamento. Podemos ainda quantificar as diferenças após o ajustamento da pontuação de propensão, calculando as estatísticas de T para o tratamento a partir de um modelo de regressão linear multivariável (ou ANOVA) para o ajustamento da idade para o tratamento, bem como para o ajustamento dos quintis da pontuação de propensão. As estatísticas t não ajustadas (círculos preenchidos) e ajustadas (círculos abertos) são apresentadas na figura abaixo.:
podemos ver que a propensão pontuação ajuste remove quase todos os iniciais diferenças em idade, classificação de risco e índice de gravidade entre os dois grupos de tratamento.
5.3 taxas de mortalidade na escala de propensão quintis
verificámos anteriormente que as covariações estão equilibradas dentro dos quintis da escala de propensão. Rosenbaum e Rubin mostraram que o efeito médio do tratamento dentro dos estratos da Pontuação da propensão é uma estimativa imparcial do verdadeiro efeito do tratamento (desde que algumas suposições se mantenham). Nós enredo de 30 dias a taxas de mortalidade (com 95% de intervalo de confiança) por grupo de tratamento em cada escore de propensão quintil, abaixo:
as taxas de Mortalidade eram geralmente mais baixos no grupo de tratamento 1 (azul) do que aqueles no grupo de tratamento dado 0 (vermelho), exceto no Q3 onde as taxas foram semelhantes. No entanto, não há fortes evidências de que os efeitos do tratamento variem em toda a gama de pontuações de propensão.
Podemos calcular a diferença nas taxas de mortalidade entre os grupos de tratamento em cada quintilo, e derivar o efeito médio do tratamento como a média ponderada entre os quintis. A figura abaixo mostra a redução absoluta na taxa de mortalidade para o tratamento 1 versus o tratamento 0, e a média ponderada, com intervalos de confiança de 95% :
globalmente, verificou-se uma redução absoluta de 6% na taxa de mortalidade de 30 dias para o tratamento 1 em comparação com o tratamento 0, com um intervalo de confiança bastante amplo.
5.4 taxas de mortalidade entre pares emparelhados de indivíduos
uma abordagem alternativa é encontrar pares de indivíduos, um em cada grupo de tratamento, com valores de propensão muito semelhantes. Pela definição da pontuação de propensão, dois indivíduos com valores de propensão semelhantes também devem ser semelhantes em todas as covariadas importantes. Este procedimento de correspondência é computacionalmente mais simples do que a correspondência simultânea em todas as covariadas importantes.
usando um algoritmo correspondente nos dados de exemplo, encontramos 177 pares correspondentes (ou seja, 354 indivíduos) dos 400 indivíduos originais. Podemos verificar se o algoritmo de correspondência alcançou equilíbrio entre os grupos comparando as distribuições de covariados entre os dois grupos de tratamento, entre os pares correspondentes. No subconjunto combinado, houve 23 mortes no grupo com tratamento 1 e 36 mortes no grupo com tratamento 0, o que é uma redução absoluta estatisticamente significativa de 7, 8% (intervalo de confiança 95%: – 13, 7%, – 1, 8%).
5.5 ponderação inversa por valores de propensão
Rosenbaum descreve uma utilização alternativa da pontuação de propensão, como factor de ponderação. Sem entrar em detalhes da derivação, ele mostra que o esperado taxa de mortalidade se todos os subjectswere atribuído ao grupo de tratamento 1 em vez de o grupo 0 é igual a E(YT/p), onde Y é a variável de desfecho, T é o grupo de tratamento, e p é a propensão pontuação a ser atribuída ao grupo de tratamento 1. Do mesmo modo, a taxa de mortalidade esperada se todos os indivíduos forem afectados ao grupo de tratamento 0 é dada por e(Y(1-T)/(1-p)). O efeito causal médio é então a diferença entre estas duas taxas de mortalidade esperadas.usando as pontuações da propensão como pesos, estimamos que o tratamento 1 estava associado a uma redução absoluta de 6, 5% (intervalo de confiança 95%: – 13, 9%, 1, 8%) versus o tratamento 0.estimámos o efeito do tratamento 1 vs tratamento 0 num modelo de regressão logística ajustado para a pontuação de propensão (em quintis). O rácio de probabilidades para o tratamento 1 foi estimado em 0, 65 (intervalo de confiança de 95%: 0, 37, 1, 13). Nós encontramos uma relação de probabilidades estimada semelhante quando adicionamos as variáveis explicativas originais ao modelo (i.e. ajustado para a Pontuação da propensão, idade, risco e gravidade).
resumo dos resultados
as taxas de mortalidade de 30 dias observadas foram de 19% no grupo tratado 0 e 16% no grupo tratado 1. No quadro seguinte é apresentada uma comparação das estimativas dos vários métodos estatísticos.
Abordagem | diferença Absoluta | Odds ratio | ||
---|---|---|---|---|
estimativa de | 95% CI | estimativa de | 95% CI | |
Nenhum ajuste | -3.6% | (-11.5%, 4.3%) | de 0,78 | (0.46, 1.31) |
regressão Logística, ajustando para idade, classificação de risco e índice de gravidade | – | – | 0.62 | (0.35, 1.11) |
Stratifying by PS | -6.0% | (-25.8%, 13.7%) | – | – |
Matching by PS | -7.8% | (-13.7%, -1.8%) | 0.58 | (0.33, 1.04) |
Weighting by PS | -6.5% | (-13.9%, 1.8%) | 0.63 | (0.34, 1.11) |
Logistic regression adjusting for PS | – | – | 0.65 | (0.37, 1.13) |
In general the propensity score methods give similar results to the logistic regression model. Esta é uma descoberta bem conhecida de estudos empíricos e de simulação anteriores .
Note the slight discrepance in statistical significance for the Matching method, where the 95% confidence interval for the odds ratio was calculated by the standard approximation and may be too wide.
discussão
nas secções acima, foi descrita e ilustrada a utilização das Pontuações de ajuste de regressão e de propensão para a análise dos dados observacionais. É importante notar a limitação inevitável dos dados observacionais sobre os efeitos do tratamento em comparação com os dados de um ensaio aleatorizado. Ou seja, os métodos baseados no ajuste de regressão ou nas pontuações de propensão nos dados observacionais apenas permitem que a análise seja equilibrada em relação às covariadas conhecidas, enquanto que os saldos de aleatorização em relação às covariadas conhecidas e desconhecidas.quando se utiliza a análise da pontuação de propensão, é vital verificar se fatores de prognóstico importantes são equilibrados pela pontuação de propensão – sem equilíbrio, a teoria subjacente falha. No entanto, se houver um grande número de Predicadores, pode não ser razoável esperar equilíbrio perfeito em cada um deles, da mesma forma que em um RCT uma comparação de fatores de base irá ocasionalmente encontrar diferenças entre grupos por acaso.uma vez que as pontuações de propensão necessitam de equilibrar a distribuição de variáveis explicativas entre grupos, por vezes o modelo terá de incluir não só os efeitos principais, mas também Termos de interacção entre variáveis explicativas. Felizmente, o modelo que é usado para estimar os escores de propensão não é, geralmente, o foco de atenção, e, portanto, ele não precisa ser parcimonioso – ele só precisa permitir o equilíbrio. Austin et al. realizou um grande estudo de simulação e mostrou que as variáveis mais importantes a incluir em um modelo de pontuação de propensão (e para garantir o equilíbrio) são as variáveis explicativas associadas com o resultado do interesse. Por outro lado, não é essencial incluir variáveis que estão associadas com a atribuição do tratamento, mas não associadas com o resultado.uma situação particularmente adequada a uma abordagem de pontuação de propensão é quando o resultado do interesse é raro, mas o tratamento é comum . Nesta situação, pode não haver muitos dados para modelar a relação entre o desfecho e as variáveis prognósticas – uma regra de ouro é que 10 eventos devem ser observadas para cada (nível um) prognóstico variável incluída no modelo de regressão logística multivariada) – considerando que pode haver dados suficientes para construir um bom modelo para o escore de propensão. Neste caso, o ajustamento utilizando a pontuação de propensão pode ser a única abordagem viável da análise.
uma vantagem potencial dos métodos de pontuação de propensão sobre o ajuste de regressão é que pode ser mais fácil verificar que a pontuação de propensão tem variáveis medidas equilibradas entre sujeitos tratados e não tratados, enquanto é mais difícil avaliar se um modelo de regressão foi corretamente especificado .por último, é importante notar que a análise da Pontuação da propensão estima um efeito de tratamento diferente do ajustamento de regressão. A análise da Pontuação da propensão estima o efeito marginal, enquanto o ajustamento da regressão estima o efeito condicional . O efeito marginal do tratamento é interpretado ao nível da população: como é que o tratamento alteraria o número global de resultados observados na população? Quando se utiliza um modelo de regressão logística, o efeito de tratamento condicional é a alteração nas probabilidades do resultado para um indivíduo quando exposto ao tratamento em comparação com não receber tratamento, condicionado às variáveis explicativas desse indivíduo – ou seja, o efeito condicional é interpretado no nível individual. Um exemplo numérico deste efeito é dado na tabela seguinte, onde uma doença afeta 13.200 indivíduos. A maioria dos indivíduos é considerada “de baixo risco”, enquanto um pequeno número é “de alto risco”, com taxas de mortalidade de 5% e 25%, respectivamente, no tratamento anterior. Um novo altamente eficaz para o tratamento irá reduzir as chances de morte por 80% (condicional odds ratio é de 0,2), mas a razão de chances ao nível da população não é de 0,2:
grupo de Risco | n | Velho tratamento | tratamento | Rel. Risk | Odds Ratio | ||
---|---|---|---|---|---|---|---|
High risk | 1200 | 300 | (25%) | 75 | (6.25%) | 0.250 | 0.200 |
Low risk | 12000 | 600 | (5%) | 125 | (1.04%) | 0.208 | 0.200 |
Total | 13200 | 900 | (6.8%) | 200 | (1.52%) | 0.222 | 0.210 |
- Rosenbaum PR, Rubin DB. The central role of the propensity score in observational studies for causal effects. Biometrika, 1983; 70: 41-55. .
- aser O. Too Much Ado about Propensity Score Models? Comparar Métodos de correspondência de pontuação de Propensão. Valor na Saúde, 2006;9(6):377-85..Rosenbaum PR. Ajuste directo baseado em modelos. Journal of the American Statistical Association, 1987; 82: 387-94. .Shah BR, Laupacis A, Hux JE, Austin PC. Propensity score methods gave similar results to traditional regression modeling in observational studies: a systematic review. Journal of Clinical Epidemiology, 2005;58(6):550-9..Austin PC, Grootendorst P, Anderson GM. A comparison of the ability of different propensity score models to balance measured variables between treated and unless subjects: a Monte Carlo study. Estatísticas em Medicina, 2007; 26(4):734-53..
- Braitman LE, Rosenbaum PR. Resultados raros, tratamentos comuns: estratégias analíticas usando pontuações de propensão . Anais de Medicina Interna, 2002; 137:693-5. .Wang J, Donnan PT. Métodos de Pontuação da propensão em estudos de segurança em drogas: prática, pontos fortes e limitações. Farmacoepidemiologia e segurança dos medicamentos, 2001; 10(4):341-4. .Austin PC, Grootendorst P, Normand SL, Anderson GM. O condicionamento da pontuação de propensão pode resultar numa estimativa tendenciosa das medidas comuns de efeito de tratamento: um estudo de Monte Carlo. Estatísticas em Medicina, 2007; 26(4):754-68..
Leitura Adicional
- Austin PC. A critical appraisal of propensity-score matching in the medical literature between 1996 and 2003. Statistics in Medicine, 2008 (in press)..
- D’Agostino RB Jr.Propensity score methods for bias reduction in thecomparison of a treatment to a non-randomized control group. Estatísticas Da Medicina, 1998; 17(19):2265-81..Imbens GW. O papel da pontuação de propensão na estimativa das funções dose-resposta. Biometrika, 2000; 87(3):706-10..Rosenbaum PR, Rubin DB. Redução do viés nos estudos observacionais utilizando sub-classificação na pontuação de propensão. Journal of the American Statistical Association, 1984; 79(387):516-24..Winkelmayer WC, Kurth T. Pontuação de propensão: ajuda ou exagero?Nephrology Diálise Transplantation, 2004; 19: 1671-3..
agradecimentos
graças a Eric Lau por ajudar a desenvolver o exemplo ilustrativo.
This work is licensed under a Creative Commons Attribution 3.0 Unported License. Foi escrito por Ben Cowling
esta página foi modificada pela última vez em
Leave a Reply