Articles

Propensity Score Analýzy

Pozadí

Při odhadu účinků léčby na binární výsledek v observačních studiích, to je často případ, že léčba nebyla náhodně přiřazena předmětů. Pokud například nemocnější pacienti byli často zařazeni do léčby, zatímco zdravější pacienti často nebyli léčeni, jednoduchá analýza by mohla nesprávně odhadnout stupeň nebo směr léčebného účinku.

obvyklým způsobem, jak se pokusit upravit potenciální zkreslení způsobené tímto druhem zmatení, je použití vícerozměrných logistických regresních modelů. Alternativním přístupem je použití analýzy skóre sklonu. V následujících částech uvádíme malý příklad datové sady, a poté popsat a ilustrovat tyto alternativní metody statistické analýzy. Zaměřujeme se na nejjednodušší příklad, kdy jsou pacienti přiřazeni k aktivní léčbě nebo kontrole (tj. Na závěr stručně zmíníme možná rozšíření na tři nebo více léčebných skupin.

příklad Data

následující příklad dataset bude použit pro ilustraci základních pojmů. Údaje zahrnují 400 subjektů zahrnutých do retrospektivní kohortní studie mužů ve věku40-70 přijatých do nemocnice s podezřením na infarkt myokardu. Výsledkem zájmu je 30denní úmrtnost (smrt=1). Zajímavý je možný účinek rychlého podání novějšího léku na srážení sraženin (trt=1) oproti standardní terapii (trt=0) na riziko úmrtnosti. Příslušné proměnné jsou pre-existující rizikový faktor skóre (na stupnici od 0 do 5, 5 je nejhorší) a vstupné závažnosti skóre (na stupnici od 0 do 10, kde 10 je nejhorší). Zde jsou údaje za prvních 12 subjektů:

age male risk severity trt death
48 1 3 8 0 0
59 1 4 6 1 0
67 1 3 6 0 1
51 1 0 6 0 0
56 1 1 6 1 0
60 1 1 6 0 0
53 1 0 3 1 0
54 1 1 2 0 0
54 1 2 7 0 0
62 1 0 4 0 0
64 1 2 6 1 1
70 1 3 8 1 0
… jako sklon.csv nebo zavolal přímo v R pomocí příkazu:
example <- read.csv("http://web.hku.hk/~bcowling/data/propensity.csv", header=TRUE)

doprovodný R skript spustit všechny následující analýzy lze nalézt zde: sklon.R.

popisná analýza

Celkem 192 (48%) pacientů dostalo novou léčbu (trt=1). 30denní úmrtnost u léčených a neléčených pacientů je shrnuta v následující tabulce:

Výsledek trt=0 trt=1
Přežít 168 162
Zemřel 40 30
30-ti denní úmrtnost 19% 16%

Jeden způsob, jak zkoumat potenciální léčebný efekt je odhad rozdíl v riziku mezi těmito dvěma skupinami. Relativní riziko úmrtnosti spojené s léčbou 1 0.375/0.40, což je 0.81, což naznačuje mírný přínos pro novější terapie.

dalším způsobem, jak odhadnout účinek léčby, může být spíše výpočet poměru šancí než relativního rizika. Poměr šancí je(168×30)/(162×40), což je 0,78, a 95% interval spolehlivosti lze vypočítat jako (0,46, 1,31).

třetím způsobem, jak odhadnout účinek léčby, je podívat se na absolutní snížení úmrtnosti. Zde je změna spojená s léčbou 1 -3,6% (z 19,2% na 15,6%) a 95% interval spolehlivosti je (-11.5%, 4, 3%), tj. až 12% snížení nebo 4% zvýšení úmrtnosti.

Nicméně, následující dva grafy ukazují, že subjekty vzhledem novější léčby byly mírně starší než uvedené standardní terapie:

děj věk vs trt

Další vyšetřování odhalí, že tam se také zdá být rozdíly v rizikových faktorech a současný stav mezi oběma léčenými skupinami:

děj věk vs riziko
děj věk vs závažnost

Formální srovnání distribucí těchto vysvětlujících proměnných napříč oběma skupinami ukazuje, že rozdíly v věk (t-test, ppp

Logistické regrese

Vícerozměrných modelů se často používají k posouzení léčebného účinku, zatímco nastavení pro významné vysvětlující proměnné. Nastavení pro významné vysvětlující proměnné, je nutné, aby se zajistila srovnatelnost mezi experimentálních a kontrolních skupin, a pokud úprava není provedena, pak rozdíly mezi skupinami může vést ke zkreslené odhady efekt léčby.

níže uvedená tabulka ukazuje hrubý poměr šancí léčby, pak účinek upravený pro další vysvětlující proměnné. Srovnání Akaike Informační Kritérium pro každý model naznačuje, že riziko skóre a index závažnosti není výrazně zlepšit kondici, tj. Model 2 může být upřednostňována Model 3. Tam je návrh léčby prospěch (i když ne statisticky významně), a také patrné chybnou věku jako podezření popisné analýzy výše.

odhady z modelu za předpokladu lineární účinky proměnné jsou velmi podobné Modelu 3 (výsledky nejsou zobrazeny).

Faktor n Vzor 1 Model 2 Model 3
95% CI 95% CI 95% CI
0 208 1.00 1.00 1.00
1 192 0.78 (0.46, 1.31) 0.67 (0.39, 1.15) 0.62 (0.35, 1.11)
Age 40-49 95 1.00
Age 50-59 131 1.72 (0.77, 3.82) 1.26 (0.52, 3.01)
Age 60-70 175 2.62 (1.23, 5.62) 2.03 (0.84, 4.95)
Risk score 0 112 1.00
Risk score 1 103 3.06 (1.34, 6.97)
Risk score 2-3 132 1.33 (0.54, 3.28)
Risk score 4-5 53 2.64 (0.95, 7.35)
Severity index 0-3 108 1.00
Severity index 4 69 1.29 (0.56, 2.96)
Severity index 5 80 0.78 (0.33, 1.87)
Severity index 6 56 1.28 (0.53, 3.08)
Severity index 7-10 87 1.43 (0.65, 3.16)
AIC 374 371 371

For completeness we could also use a non-linear regression model to check the shape of the effects of age, pre-existing risk and severity in the fully adjusted model. Doprovodný skript R obsahuje kód pro odhad a vykreslení odpovídajících funkcí spline a my je zde neukazujeme; poznamenáváme, že efekty byly poměrně lineární.

Propensity score analysis

alternativním přístupem k analýze je pokusit se napodobit podmínky randomizované kontrolované studie (RCT). V RCT, pravděpodobnost, že účastník obdrží konkrétní léčba je stejná pro všechny účastníky, nebo v vrstevnaté konstrukce, závisí pouze na známé vysvětlující proměnné pacienta, jako je věk, pohlaví atd. Jinými slovy, věk pacienta, pohlaví (atd.) je dostatečná informace, která nám sdělí pacientovu pravděpodobnost léčby.

Pokud se v observační studie se kterým jsme měli všechny informace k dispozici na zdravotnické pracovníky, kteří přidělen zacházení se subjekty, bychom měli být schopni obnovit jejich rozhodovací proces a odhadnout pravděpodobnost, že individuální pacienti dostávali léčbu. Tato pravděpodobnost se označuje jako sklon skóre, a v jejich semenné 1983 papíru Rosenbaum a Rubin ukázal, že tak dlouho, jak propensity score je vhodným měřítkem pravděpodobnost léčby, výsledky mohou být použity k pomoci odhadnout kauzální účinky léčby. Skóre se používá k vyváženým prognostickým proměnným napříč léčenými a neléčenými skupinami a existují (alespoň) čtyři možné způsoby, jak toho dosáhnout:

  • stratifikovat pacienty do skupin (např.
  • porovnávejte léčené a neléčené pacienty a porovnejte výsledné párové páry.
  • inverzní vážení výsledků podle skensity score.
  • upravte skóre sklonu v Logistickém regresním modelu.

5.1 Odhadu propensity score

sklon skóre je podmíněná pravděpodobnost, že objekt bude zacházeno vzhledem k pozorované vysvětlující proměnné; záměrem je, aby tento jediný pravděpodobností může shrnout informace o mechanismu přiřazení léčby. Pak bychom měli být schopni získat nestranné odhady účinků léčby porovnáním subjektů, které měly podobné pravděpodobnosti léčby (ať už ji skutečně dostaly nebo ne).

sklonové skóre se obvykle odhaduje pomocí vícerozměrného logistického regresního modelu.

v našem příkladu jsme vybavili logistický regresní model k odhadu účinků věku, rizikového skóre a indexu závažnosti na pravděpodobnost léčby 1 spíše než léčba 0. Zjistili jsme, že vyšší věk (p=0,05), vyšší rizikové skóre (p=0,05) a vyšší index závažnosti (p=0.01) jsou spojeny s vyšší pravděpodobností léčby 1. Skóre sklonu se pohybuje od 0,2 do 0,8 a porovnáváme rozdělení skóre mezi dvěma léčebnými skupinami na obrázku níže. Tyče ukazují střední a mezikartilní rozsah.

srovnání distribuce skóre sklonu v každé léčebné skupině

jak by se dalo očekávat, skóre sklonu (tj. Vidíme, že existuje dobrý stupeň překrývání, kde můžeme najít jednotlivce v obou léčebných skupinách pro jakékoli skóre sklonu mezi 0,2 a 0,8. To jedůležité, protože základní princip propensity score analýzy je, že pokud najdeme dvě osoby, jeden v každé léčebné skupině, můžeme si představit, že ti dva jedinci byli ‚náhodně‘ přiřazeno každé skupině ve smyslu buď rozdělení je stejně pravděpodobně.

5.2 vyrovnává skóre sklonu skupiny?

v jakékoli analýze propensity score bychom měli zkontrolovat, zda nám propensityscore umožňuje vyvážit distribuci vysvětlujících proměnných. Existuje mnoho způsobů, jak zkontrolovat rovnováhu; například bychom se mohli podívat na rozdělení vysvětlující proměnné v rámci kvintilů skóre sklonu. Na obrázku níže jsme plot medián a mezikvartilové rozpětí věku v každé propensity score kvintil:

věkový Medián (IQR) sklon skóre quintiles

Bez úprav (celkově) je značný rozdíl. V rámci každého quntilu jsou však distribuce velmi úzce sladěny.

počáteční rozdíly můžeme kvantifikovat výpočtem statistik dvou vzorků (tj. To je ekvivalentní zjištění statistiky t pro léčbu z lineárního regresního modelu (nebo ANOVA) pro věk versus léčebná skupina. Můžeme furthermeasure rozdíly po úpravě pro sklon skóre, bycalculating t-statistiky pro léčbu z proměnných lineární regresní model (nebo ANOVA) pro nastavení věku pro léčbu, stejně jako nastavení pro quintiles z propensity score. Neupravené (vyplněné kruhy) a upravené (otevřené kruhy) t-statistiky jsou uvedeny na obrázku níže:

Absolutní t statistiky před (plná kolečka) a po (otevřené kruhy)nastavení pro sklon skóre

můžeme vidět, že sklon skóre úprava odstraňuje téměř všechny počáteční rozdíly ve věku, rizikové skóre a index závažnosti mezi oběma léčenými skupinami.

5.3 úmrtnost v kvintilech sklonu

dříve jsme zjistili, že kovariáty jsou vyvážené v kvintilech sklonu. Rosenbaum a Rubin ukázaly, že průměrný léčebný účinek ve vrstvách skóre sklonu je nestranný odhad skutečného léčebného účinku(za předpokladu, že některé předpoklady platí). Jsme plot 30-denní mortalita (s 95% intervaly spolehlivosti) na léčbu podle léčebné skupiny v každé propensity score kvintil, níže:

Srovnání úmrtnosti v propensity score quintiles

Úmrtnosti byly obecně nižší ve skupině léčba 1 (modrá) než ve skupině léčba 0 (červená), s výjimkou 3. Čtvrtletí, kdy ceny byly podobné. Neexistuje však žádný silný důkaz, že účinky léčby se liší v celém rozsahu skóre sklonu.

můžeme vypočítat rozdíl v úmrtnosti mezi skupinami v každém kvintilu, a odvodit průměrný léčebný účinek jako vážený průměr přes kvintilech. Níže uvedený obrázek ukazuje absolutní snížení úmrtnosti na léčbu 1 versus léčba 0, a vážený průměr, s 95% intervaly spolehlivosti:

Srovnání úmrtnosti v propensity score quintiles

Celkově tam byl 6% absolutní snížení 30-denní mortality rate pro léčbu 1 ve srovnání s léčbou 0, s poměrně široký interval spolehlivosti.

5.4 Úmrtnosti mezi párech osob

alternativní přístup je najít dvojice předmětů, jeden v každé léčebné skupině, s velmi podobnými sklony skóre. Podle definice skóre sklonu by dva subjekty s podobným skóre sklonu měly být také podobné ve všech důležitých kovariátech. Tento postup párování je výpočetně jednodušší než současné párování na všech důležitých kovariátech.

pomocí algoritmu shody v příkladových datech najdeme 177 odpovídajících párů (tj. Můžeme zkontrolovat, že odpovídající algoritmus dosáhl rovnováhy mezi skupinami porovnáním distribucí kovariancí mezi dvěma léčebnými skupinami, mezi párech. V odpovídající podmnožina, bylo tam 23 úmrtí ve skupině s léčbou 1 a 36 úmrtí ve skupině s léčbou 0, což je statisticky signifikantní absolutní snížení o 7,8% (95% interval spolehlivosti: -13.7%, tedy 1,8%).

5.5 inverzní vážení podle skóre sklonu

Rosenbaum popisuje alternativní použití skóre sklonu jako váhového faktoru. Bez jít do podrobností o odvození, on ukazuje, že očekávaná úmrtnost-li všechny subjectswere přiřazeny k léčbě, skupina 1. místo skupina 0 je rovna E(YT/p), kde Y je výsledná proměnná, T je experimentální skupiny, a p je sklon skóre byl přiřazen k léčbě, skupina 1. Podobně očekávaná úmrtnost, pokud jsou všichni jedinci zařazeni do léčebné skupiny 0, je dána E (Y (1-T)/(1-p)). Průměrným příčinným účinkem je pak rozdíl mezi těmito dvěma očekávanými úmrtnostmi.

Pomocí propensity skóre jako závaží, jsme se odhaduje, že léčba 1 byla spojena s absolutní snížení o 6,5% (95% interval spolehlivosti: -13.9%, 1.8%) versus léčba 0.

5.6 úprava logistické regrese pro skóre sklonu

odhadli jsme účinek léčby 1 vs. léčba 0 v modelu logistické regrese upravujícím skóre sklonu (v kvintilech). Poměr šancí pro léčbu 1 byl odhadnut na 0,65 (95% interval spolehlivosti: 0,37; 1,13). Podobný odhadovaný poměr šancí jsme našli, když jsme do modelu přidali původní vysvětlující proměnné (tj. upraveno pro skóre sklonu, věk, riziko a závažnost).

Shrnutí výsledků

pozorované 30-denní mortalita byla 19% ve skupině léčba 0 a 16% ve skupině léčba 1. Srovnání odhadů z různých statistických metod je uvedeno v následující tabulce.

Přiblížení Absolutní hodnota rozdílu poměr šancí
odhad 95% CI odhad 95% CI
Žádné nastavení -3.6% (-11.5%, 4.3%) 0.78 (0.46, 1.31)
Logistické regrese úpravou pro věk, rizikové skóre, index závažnosti 0.62 (0.35, 1.11)
Stratifying by PS -6.0% (-25.8%, 13.7%)
Matching by PS -7.8% (-13.7%, -1.8%) 0.58 (0.33, 1.04)
Weighting by PS -6.5% (-13.9%, 1.8%) 0.63 (0.34, 1.11)
Logistic regression adjusting for PS 0.65 (0.37, 1.13)

obecně sklon skóre metody dávají podobné výsledky modelu logistické regrese. Toto je dobře známé zjištění z předchozích empirických a simulačních studií .

Poznámka: mírný rozdíl ve statistické významnosti pro Odpovídající způsob, kde 95% interval spolehlivosti pro poměr šancí byl vypočítán standardní aproximace a může být příliš široký.

diskuse

ve výše uvedených oddílech bylo popsáno a ilustrováno použití regresní úpravy a skóre sklonu pro analýzu pozorovacích dat. Je důležité si uvědomit nevyhnutelné omezení pozorovacích údajů o účincích léčby ve srovnání s údaji z randomizované studie. To znamená, že metody založené na regresní úprava nebo sklon skóre v observačních dat umožňuje pouze analýzu, aby být vyrovnaná známé proměnné, zatímco randomizace zůstatky přes známé a neznámé proměnné.

při použití analýzy skóre sklonu je nezbytné zkontrolovat, zda jsou důležité prognostické faktory vyváženy skóre sklonu – bez rovnováhy základní teorie selže. Pokud však existuje velký počet prediktorů, nemusí být rozumné očekávat dokonalou rovnováhu na každém z nich, stejným způsobem, že v RCT srovnání základních faktorů občas najde rozdíly mezi skupinami náhodou.

Protože sklon skóre je třeba vyvážit rozdělení závisle proměnné mezi skupinami, někdy modelu bude muset zahrnovat nejen hlavní účinky, ale také hlediska interakce mezi vysvětlujícími proměnnými. Naštěstí model, který se používá k odhadu skóre sklonu, není obvykle středem pozornosti, a proto nemusí být šetrný – potřebuje pouze umožnit rovnováhu. Austin a kol. provedl rozsáhlou simulační studii a ukázali, že nejdůležitější proměnné patří v propensity score model (a zajistit rovnováhu), jsou tyto vysvětlující proměnné spojené s výsledkem zájmu. Na druhé straně Není nezbytné zahrnout proměnné, které jsou spojeny s přiřazením léčby, ale nejsou spojeny s výsledkem.

jedna situace zvláště vhodná pro přístup k skóre sklonu je situace, kdy je výsledek zájmu vzácný, ale léčba je běžná . V této situaci, tam nemusí být moc dat do modelu vztahu mezi výsledkem a prognostické proměnné – společné pravidlo je, že 10 události by měly být dodržovány pro každý (úroveň z) prognostické proměnné zahrnuty v proměnných logistickou regrese model) – vzhledem k tomu, že tam může být dostatečné údaje postavit dobrý model pro propensity score. V tomto případě může být úprava pomocí skóre sklonu jediným životaschopným přístupem k analýze.

jednou z možných výhod metod skóre sklonu oproti regresní úpravě je to, že může být snazší ověřit, že skóre sklonu má vyvážené měřené proměnné mezi léčenými a neléčenými subjekty, zatímco je obtížnější posoudit, zda byl regresní model správně zadán .

nakonec je důležité poznamenat, že analýza skóre sklonu odhaduje jiný účinek léčby než regresní úprava. Analýza skóre sklonu odhaduje mezní účinek, zatímco regresní úprava odhaduje podmíněný účinek . Mezní efekt léčby je interpretován na úrovni populace: jak by se léčba změnit celkový počet výsledků pozorované v populaci? Při použití logistické regrese model, podmíněný efekt léčby je změna v rozporu výsledku pro jedince, když jsou vystaveny zacházení ve srovnání se dostává žádná léčba, podmíněno, že jednotlivé vysvětlující proměnné – tj. podmíněné efekt je interpretován na individuální úrovni. Číselný příklad tohoto efektu je uveden v následující tabulce, kde onemocnění postihuje 13,200 jedinců. Většina jedinců je považována za „nízké riziko“, zatímco malý počet je „vysoké riziko“, s úmrtností 5% a 25%, podle staré léčby. Nové vysoce účinné léčby sníží pravděpodobnost úmrtí o 80% (podmíněné odds ratio 0,2), ale šance poměr na úrovni populace není 0.2:

Rizikové skupiny n Staré léčba Nová léčba Rel. Risk Odds Ratio
High risk 1200 300 (25%) 75 (6.25%) 0.250 0.200
Low risk 12000 600 (5%) 125 (1.04%) 0.208 0.200
Total 13200 900 (6.8%) 200 (1.52%) 0.222 0.210

  1. Rosenbaum PR, Rubin DB. Ústřední role skóre sklonu v observačních studiích kauzálních účinků. Biometrika, 1983; 70: 41-55. .
  2. Baser o. příliš mnoho povyku o modelech skóre sklonu? Porovnání metod porovnávání skóre sklonu. Hodnota ve zdraví, 2006;9(6):377-85..
  3. Rosenbaum PR. Přímé nastavení založené na modelu. Journal of American Statistical Association, 1987; 82: 387-94. .
  4. Shah BR, Laupacis A, Hux JE, Austin PC. Metody skóre sklonu poskytly podobné výsledky jako tradiční regresní modelování v observačních studiích: systematický přehled. Journal of Clinical Epidemiology, 2005;58(6):550-9..
  5. Austin PC, Grootendorst P, Anderson GM. Srovnání schopnosti různých modelů skóre sklonu vyvážit měřené proměnné mezi léčenými a neléčenými subjekty: studie Monte Carlo. Statistiky v medicíně, 2007; 26(4):734-53..
  6. Braitman LE, Rosenbaum PR. Vzácné výsledky, běžné léčby: analytické strategie využívající skóre sklonu . Annals of Internal Medicine, 2002; 137:693-5. .
  7. Wang J, Donnan pt. Metody skóre sklonu ve studiích bezpečnosti léčiv: praxe, silné stránky a omezení. Farmakoepidemiologie a bezpečnost léčiv, 2001; 10(4):341-4. .
  8. Austin PC, Grootendorst P, Normand SL, Anderson GM. Kondicionování na skóre sklonu může mít za následek zkreslený odhad společných měřítek léčebného účinku: studie Monte Carlo. Statistiky v medicíně, 2007; 26(4):754-68..

další čtení

  • Austin PC. Kritické hodnocení shody sklonu a skóre v lékařské literatuře mezi lety 1996 a 2003. Statistika v medicíně, 2008 (v tisku)..
  • D ‚ Agostino RB Jr. metody sklonu ke snížení zkreslení v porovnání léčby s nerandomizovanou kontrolní skupinou. Statistiky V Medicíně, 1998; 17(19):2265-81..
  • Imbens GW. Úloha skóre sklonu při odhadu funkcí reakce na dávku. Biometrika, 2000; 87(3):706-10..
  • Rosenbaum PR, Rubin DB. Snížení zaujatosti v observačních studiích pomocí subklasifikace na skóre sklonu. Journal of American Statistical Association, 1984; 79(387):516-24..
  • Winkelmayer, Kurth T. Sklon skóre: pomoc nebo humbuk?Transplantace Nefrologické Dialýzy, 2004; 19: 1671-3..

poděkování

díky Ericu Lauovi za pomoc při vývoji ilustrativního příkladu.

licence Creative Commonstoto dílo je licencováno pod licencí Creative Commons Attribution 3.0 Unported. Tato stránka byla naposledy upravena na
Valid HTML 4.01 Strict