analyse van de Neigingsscore
Achtergrond
bij het schatten van de effecten van de behandeling op een binaire uitkomst in observationele studies, is het vaak het geval dat behandelingen niet willekeurig werden toegewezen aan proefpersonen. Als, bijvoorbeeld, ziekere patiënten vaak werden toegewezen aan de behandeling terwijl gezondere patiënten vaak niet werden behandeld, een eenvoudige analyse zou verkeerd inschatten van de mate of richting van een behandeling effect.
een veel voorkomende manier om te proberen de mogelijke bias als gevolg van dit soort verstorende factoren aan te passen is door het gebruik van multivariabele logistische regressiemodellen. Een alternatieve benadering is het gebruik van neigingsscore analyse. In de volgende secties geven we een kleine voorbeelddataset en beschrijven en illustreren we deze alternatieve methoden van statistische analyse. We richten ons op het eenvoudigste voorbeeld waar patiënten worden toegewezen om ofwel actieve behandeling, of controle (dwz 2 groepen) te ontvangen. Aan het eind noemen we kort mogelijke uitbreidingen naar drie of meer behandelingsgroepen.
voorbeeld Data
de volgende voorbeelddataset zal worden gebruikt om de basisconcepten te illustreren. De gegevens omvatten 400 proefpersonen die deelnamen aan een retrospectieve cohortstudie bij mannen van 40-70 jaar die in het ziekenhuis zijn opgenomen met een vermoeden van een myocardinfarct. De uitkomst van de rente is 30-dagen mortaliteit (overlijden=1). Van belang is het mogelijke effect van de snelle toediening van een nieuwer stolselbustend geneesmiddel (trt=1) versus een standaardtherapie (trt=0) op het sterfterisico. Relevante covariabelen zijn een reeds bestaande risicofactorscore (op een schaal van 0 tot 5, waarbij 5 het slechtst is) en een toelatingsscore voor de ernst (op een schaal van 0 tot 10, waarbij 10 het slechtst is). Hier zijn de gegevens voor de eerste 12 proefpersonen:
age | male | risk | severity | trt | death |
---|---|---|---|---|---|
48 | 1 | 3 | 8 | 0 | 0 |
59 | 1 | 4 | 6 | 1 | 0 |
67 | 1 | 3 | 6 | 0 | 1 |
51 | 1 | 0 | 6 | 0 | 0 |
56 | 1 | 1 | 6 | 1 | 0 |
60 | 1 | 1 | 6 | 0 | 0 |
53 | 1 | 0 | 3 | 1 | 0 |
54 | 1 | 1 | 2 | 0 | 0 |
54 | 1 | 2 | 7 | 0 | 0 |
62 | 1 | 0 | 4 | 0 | 0 |
64 | 1 | 2 | 6 | 1 | 1 |
70 | 1 | 3 | 8 | 1 | 0 | … | … | … | … | … | … |
de gegevens kunnen ook worden gedownload als neiging.csv of direct aangeroepen in R met het commando:example <- read.csv("http://web.hku.hk/~bcowling/data/propensity.csv", header=TRUE)
een begeleidend R script om alle volgende analyses uit te voeren kan hier gevonden worden: neiging.R.
beschrijvende analyse
in totaal kregen 192 (48%) patiënten de nieuwe behandeling (trt=1). De sterftecijfers van 30 dagen voor behandelde en onbehandelde patiënten zijn samengevat in de volgende tabel:
Resultaat | trt=0 | trt=1 |
---|---|---|
Overleefd | 168 | 162 |
Overleden | 40 | 30 |
30-dagen mortaliteit | 19% | 16% |
Een manier om te onderzoeken wat de mogelijke behandeling effect is een schatting van het verschil in risico tussen de twee groepen. Het relatieve risico op mortaliteit geassocieerd met behandeling 1 is 0,375/0,40, dat is 0,81, wat wijst op een licht voordeel voor de nieuwere therapie.
een andere manier om het behandelingseffect te schatten is het berekenen van de odds ratio in plaats van het relatieve risico. De odds ratio is (168×30)/(162×40), dat is 0,78, en een 95% betrouwbaarheidsinterval kan worden berekend als (0,46, 1,31).
een derde manier om het effect van de behandeling te schatten is door te kijken naar de absolute daling van het sterftecijfer. Hier is de verandering geassocieerd met behandeling 1 -3,6% (van 19,2% naar 15,6%) en een 95% betrouwbaarheidsinterval is (-11.5%, 4,3%), dat wil zeggen een daling met 12% of een stijging met 4% van de sterftecijfers.
De volgende twee grafieken tonen echter aan dat proefpersonen die de nieuwere behandeling kregen iets ouder waren dan degenen die de standaardtherapie kregen:
nader onderzoek toont aan dat er ook verschillen lijken te zijn in risicofactoren en huidige toestand tussen de twee behandelingsgroepen:
formele vergelijking van de verdelingen van deze verklarende variabelen over de twee behandelingsgroepen laat zien dat de verschillen in leeftijd (t-test, ppp
logistische regressie
multivariabele modellen vaak worden gebruikt om het behandelingseffect te beoordelen bij aanpassing voor belangrijke verklarende variabelen. Aanpassing voor belangrijke verklarende variabelen is noodzakelijk om de vergelijkbaarheid tussen de behandelingsgroepen en de controlegroepen te waarborgen, en als de aanpassing niet wordt uitgevoerd, kunnen de verschillen tussen de groepen leiden tot bevooroordeelde schattingen van het behandelingseffect.
onderstaande tabel toont de ruwe odds ratio van de behandeling, vervolgens het effect gecorrigeerd voor andere verklarende variabelen. Vergelijking van het Akaike-Informatiecriterium voor elk model suggereert dat risicoscore en severity index de fit niet significant verbeteren, dat wil zeggen dat Model 2 de voorkeur heeft Boven Model 3. Er is een suggestie van een behandeling voordeel (hoewel niet statistisch significant), en ook duidelijke verstorende door leeftijd zoals vermoed door de beschrijvende analyses hierboven.
De schattingen van een model uitgaande van lineaire effecten van covariabelen zijn zeer vergelijkbaar met Model 3 (Resultaten niet getoond).
Factor | n | Model 1 | Model 2 | Model 3 | |||
---|---|---|---|---|---|---|---|
OF | 95% CI | OF | 95% CI | OF | 95% CI | ||
Behandeling 0 | 208 | 1.00 | – | 1.00 | – | 1.00 | – |
Behandeling 1 | 192 | 0.78 | (0.46, 1.31) | 0.67 | (0.39, 1.15) | 0.62 | (0.35, 1.11) |
Age 40-49 | 95 | – | – | 1.00 | – | – | – |
Age 50-59 | 131 | – | – | 1.72 | (0.77, 3.82) | 1.26 | (0.52, 3.01) |
Age 60-70 | 175 | – | – | 2.62 | (1.23, 5.62) | 2.03 | (0.84, 4.95) |
Risk score 0 | 112 | – | – | – | – | 1.00 | – |
Risk score 1 | 103 | – | – | – | – | 3.06 | (1.34, 6.97) |
Risk score 2-3 | 132 | – | – | – | – | 1.33 | (0.54, 3.28) |
Risk score 4-5 | 53 | – | – | – | – | 2.64 | (0.95, 7.35) |
Severity index 0-3 | 108 | – | – | – | – | 1.00 | – |
Severity index 4 | 69 | – | – | – | – | 1.29 | (0.56, 2.96) |
Severity index 5 | 80 | – | – | – | – | 0.78 | (0.33, 1.87) |
Severity index 6 | 56 | – | – | – | – | 1.28 | (0.53, 3.08) |
Severity index 7-10 | 87 | – | – | – | – | 1.43 | (0.65, 3.16) |
AIC | 374 | 371 | 371 |
For completeness we could also use a non-linear regression model to check the shape of the effects of age, pre-existing risk and severity in the fully adjusted model. Het begeleidende R script bevat de code om de corresponderende spline functies te schatten en te plotten en we laten deze hier niet zien; we merken op dat de effecten vrij lineair waren.
Neigingsscore analyse
een alternatieve benadering van de analyse is om te proberen de condities van een gerandomiseerde gecontroleerde studie (RCT) na te bootsen. In een RCT is de kans dat een deelnemer een bepaalde behandeling krijgt voor alle deelnemers hetzelfde of, in gestratificeerde ontwerpen, hangt alleen af van de bekende verklarende variabelen van een patiënt zoals leeftijd, geslacht enz. Met andere woorden, de leeftijd, het geslacht van de patiënt (enz.) voldoende informatie is om ons de kans van de patiënt op het ontvangen van de behandeling te vertellen.
als we in een observationele onderzoeksomgeving over alle informatie beschikten voor de beroepsbeoefenaren in de gezondheidszorg die de behandeling aan proefpersonen hadden toegewezen, zouden we in staat moeten zijn om hun beslissingsproces opnieuw te maken en de kans te schatten dat individuele patiënten de behandeling kregen. Deze waarschijnlijkheid wordt aangeduid als de neiging score, en in hun baanbrekende 1983 paper Rosenbaum en Rubin aangetoond dat zolang de neiging score is een geschikte maat voor de waarschijnlijkheid van het ontvangen van de behandeling, de scores kunnen worden gebruikt om te helpen schatten van de causale effecten van de behandeling. De scores worden gebruikt voor evenwichtige prognostische variabelen over behandelde en onbehandelde groepen, en er zijn (ten minste) vier mogelijke manieren om dit te doen:
- stratificatie van patiënten in groepen (bijv. quintiles) op basis van neigingsscore en vergelijking van behandelingseffecten in elke strata.
- Match behandelde en onbehandelde patiënten en vergelijk resulterende overeenkomende paren.
- Inverse weging van de resultaten met de neigenheidsscore.
- aanpassen voor de neigingsscore in een logistisch regressiemodel.
5.1 inschatting van de neigingsscore
De neigingsscore is de voorwaardelijke kans dat een proefpersoon zal worden behandeld gezien de waargenomen verklarende variabelen; de bedoeling is dat deze enkele waarschijnlijkheid de informatie over het mechanisme van de toewijzing van de behandeling kan samenvatten. We zouden dan in staat moeten zijn onbevooroordeelde schattingen van de behandelingseffecten te verkrijgen door proefpersonen te vergelijken die vergelijkbare kansen hadden om een behandeling te ontvangen (of ze deze nu daadwerkelijk kregen of niet).
Neigingsscores worden doorgaans geschat met behulp van een multivariabel logistisch regressiemodel.
in ons voorbeeld hebben we een logistiek regressiemodel toegepast om de effecten van leeftijd, risicoscore en severity index op de kans op behandeling 1 in plaats van behandeling 0 te schatten. We vinden dat oudere leeftijd (p = 0,05), hogere risicoscore (p=0,05) en hogere severity index (p=0.01) worden allemaal geassocieerd met een hogere kans op behandeling 1. De neigingsscores variëren van 0,2 tot 0,8, en we vergelijken de verdeling van de scores tussen de twee behandelingsgroepen in de onderstaande figuur. De balken tonen het mediaan-en interkwartielbereik.
zoals te verwachten is, zijn de neigingsscores (d.w.z. de kans op behandeling) gemiddeld iets hoger in de behandelingsgroep. We kunnen zien dat er een goede mate van overlap is, waar we individuen in beide behandelingsgroepen kunnen vinden voor elke neiging scores tussen 0,2 en 0,8. Dit is belangrijk, omdat het essentiële principe van de analyse van de neigingsscore is dat als we twee individuen vinden, één in elke behandelingsgroep, we ons kunnen voorstellen dat die twee individuen ‘willekeurig’ werden toegewezen aan elke groep in de zin van beide allocatie die even waarschijnlijk is.
5.2 is de neiging score evenwicht tussen de groepen?
bij elke analyse van de tendensiteitsscore moeten we controleren of de propensityscore ons in staat stelt om de verdeling van verklarende variabelen in evenwicht te brengen. Er zijn vele manieren om de balans te controleren ; we zouden bijvoorbeeld kunnen kijken naar de verdeling van een verklarende variabele binnen de kwintielen van de neigingsscore. In de onderstaande figuur geven we de mediane en interkwartielafstand van de leeftijd in elke neigingsscore kwintiel:
zonder aanpassing (over het geheel genomen) is er een aanzienlijke discrepantie. Binnen elk quntiel zijn de distributies echter zeer nauw op elkaar afgestemd.
We kunnen de initiële verschillen kwantificeren door de twee-samplet-statistieken te berekenen (d.w.z. een t-test voor verschillen in leeftijd per behandelingsgroep). Dit komt overeen met het vinden van de T-statistiek voor behandeling uit een lineair regressiemodel (of ANOVA) voor leeftijd versus behandelingsgroep. We kunnen de verschillen verder meten na aanpassing voor de neigenheidsscore, door de T-statistieken voor behandeling te berekenen aan de hand van een multivariabel lineair regressiemodel (of ANOVA) voor leeftijdsaanpassing voor behandeling en voor de kwintielen van de neigenheidsscore. De niet-aangepaste (gevulde cirkels) en aangepaste (open cirkels) t-statistieken worden weergegeven in de onderstaande figuur:
We kunnen zien dat de aanpassing van de neigingsscores bijna alle aanvankelijke verschillen in leeftijd, risicoscore en ernstindex tussen de twee behandelingsgroepen verwijdert.
5.3 sterftecijfers binnen neigingsscore kwintielen
eerder vonden we dat covariabelen evenwichtig zijn binnen kwintielen van de neigingsscore. Rosenbaum en Rubin toonden aan dat het gemiddelde behandelingseffect binnen de strata van de tendensiteitsscore een onbevooroordeelde schatting is van het werkelijke behandelingseffect (op voorwaarde dat sommige aannames kloppen). We zetten de sterftecijfers van 30 dagen (met 95% betrouwbaarheidsintervallen) per behandelingsgroep in elke neigingsscore kwintiel hieronder:
sterftecijfers waren over het algemeen lager in de groep die behandeling 1 (Blauw) kreeg dan in de groep die behandeling 0 (rood) kreeg, behalve in Q3 waar de percentages vergelijkbaar waren. Er is echter geen sterk bewijs dat de effecten van de behandeling variëren over het bereik van de neiging scores.
We kunnen het verschil in sterftecijfers tussen de behandelingsgroepen in elk kwintiel berekenen en het gemiddelde behandelingseffect afleiden als het gewogen gemiddelde over de kwintielen. Onderstaande figuur toont de absolute daling van het sterftecijfer voor behandeling 1 versus behandeling 0, en het gewogen gemiddelde, met 95% betrouwbaarheidsintervallen:
over het algemeen was er een absolute afname van 6% in het sterftecijfer van 30 dagen voor behandeling 1 in vergelijking met behandeling 0, met een vrij breed betrouwbaarheidsinterval.
5.4 sterftecijfers tussen gematchte paren van individuen
een alternatieve benadering is het vinden van paren van proefpersonen, één in elke behandelingsgroep, met zeer vergelijkbare neigingsscores. Volgens de definitie van de neigingsscore zouden twee proefpersonen met vergelijkbare neigingsscores ook op alle belangrijke covariabelen gelijk moeten zijn. Deze matching procedure is rekenkundig eenvoudiger dan gelijktijdige matching op alle belangrijke covariaten.
met behulp van een matching algoritme in de voorbeeldgegevens vinden we 177 overeenkomende paren (d.w.z. 354 individuen) van de oorspronkelijke 400 proefpersonen. We zouden kunnen controleren of het matching algoritme evenwicht heeft bereikt tussen de groepen door het vergelijken van de distributies van covariaten tussen de twee behandelingsgroepen, tussen de overeenkomende paren. In de overeenkomstige subgroep waren er 23 sterfgevallen in de groep met behandeling 1 en 36 sterfgevallen in de groep met behandeling 0, wat een statistisch significante absolute reductie van 7,8% is (95% betrouwbaarheidsinterval: -13,7%, -1,8%).
5,5 Inverse weging volgens neigingsscores
Rosenbaum beschrijft een alternatief gebruik van de neigingsscores als wegingsfactor. Zonder in detail in te gaan op de afleiding, toont hij aan dat het verwachte sterftecijfer als alle proefpersonen in behandelingsgroep 1 in plaats van groep 0 werden ingedeeld, gelijk is aan E(YT/p), waarbij Y de uitkomstvariabele is, T de behandelingsgroep is en p de neigingsscore is om in behandelingsgroep 1 te worden ingedeeld. Evenzo wordt het verwachte sterftecijfer als alle individuen in behandelingsgroep 0 worden ingedeeld, gegeven door E (Y (1-T)/(1-p)). Het gemiddelde causale effect is dan het verschil tussen deze twee verwachte sterftecijfers.
aan de hand van de tendensiteitsscores als gewicht schatten we dat behandeling 1 geassocieerd was met een absolute reductie van 6,5% (95% betrouwbaarheidsinterval: -13,9%, 1,8%) versus behandeling 0.
5.6 logistische regressie correctie voor de neiging score
we schatten het effect van behandeling 1 versus behandeling 0 in een logistisch regressiemodel aanpassing voor de neiging score (in quintiles). De odds ratio voor behandeling 1 werd geschat op 0,65 (95% betrouwbaarheidsinterval: 0,37; 1,13). We vonden een vergelijkbare geschatte odds ratio toen we de oorspronkelijke verklarende variabelen aan het model (d.w.z. aangepast voor de neigingsscore, leeftijd, Risico en ernst).
samenvatting van de resultaten
de waargenomen sterftecijfers van 30 dagen waren 19% in de groep die behandeling 0 kreeg en 16% in de groep die behandeling 1 kreeg. In onderstaande tabel worden de ramingen van de verschillende statistische methoden vergeleken.
Aanpak | het Absolute verschil | Odds ratio | ||
---|---|---|---|---|
raming | 95% CI | raming | 95% CI | |
Geen aanpassing plaats | -3.6% | (-11.5%, 4.3%) | 0.78 | (0.46, 1.31) |
Logistische regressie gecorrigeerd voor leeftijd, risico-score en de ernst-index | – | – | 0.62 | (0.35, p.1.11) |
Stratifying by PS | -6.0% | (-25.8%, 13.7%) | – | – |
Matching by PS | -7.8% | (-13.7%, -1.8%) | 0.58 | (0.33, 1.04) |
Weighting by PS | -6.5% | (-13.9%, 1.8%) | 0.63 | (0.34, 1.11) |
Logistic regression adjusting for PS | – | – | 0.65 | (0.37, 1.13) |
in het algemeen geven de methoden voor de neigingsscore vergelijkbare resultaten als het logistische regressiemodel. Dit is een bekende bevinding uit eerdere empirische en simulatiestudies .
Let op het geringe verschil in statistische significantie voor de Matchingmethode, waarbij het 95% betrouwbaarheidsinterval voor de odds ratio werd berekend door de standaardbenadering en mogelijk te breed is.
discussie
in de bovenstaande paragrafen is het gebruik van regressiecorrectie en neigensscores voor de analyse van observationele gegevens beschreven en geïllustreerd. Het is belangrijk om de onvermijdelijke beperking van observationele gegevens over behandelingseffecten op te merken in vergelijking met gegevens uit een gerandomiseerd onderzoek. Dat wil zeggen dat methoden gebaseerd op regressiecorrectie of neigensscores in observationele gegevens alleen toelaten om de analyse te balanceren over bekende covariabelen, terwijl randomisatie balanceert over bekende en onbekende covariabelen.
bij de analyse van de neigingsscore is het van vitaal belang om te controleren of belangrijke prognostische factoren in evenwicht zijn met de neigingsscore – zonder balans faalt de onderliggende theorie. Maar als er een groot aantal voorspellers is, is het misschien niet redelijk om op elk een perfecte balans te verwachten, op dezelfde manier dat in een RCT een vergelijking van baseline factoren af en toe verschillen tussen groepen bij toeval zal vinden.
omdat de neigingsscores de verdeling van verklarende variabelen tussen groepen moeten balanceren, moet het model soms niet alleen de belangrijkste effecten omvatten, maar ook de interactietermen tussen verklarende variabelen. Gelukkig is het model dat wordt gebruikt om de neiging scores te schatten meestal niet de focus van de aandacht, en daarom hoeft het niet zuinig te zijn – het hoeft alleen maar om evenwicht toe te staan. Austin et al. uitgevoerd een grote simulatie studie en toonde aan dat de belangrijkste variabelen op te nemen in een neiging score model (en om evenwicht te verzekeren over) zijn die verklarende variabelen geassocieerd met de uitkomst van belang. Aan de andere kant is het niet essentieel om variabelen op te nemen die geassocieerd zijn met de toewijzing van de behandeling, maar niet geassocieerd zijn met de uitkomst.
een situatie die bijzonder geschikt is voor een benadering met een neigingsscore is wanneer de uitkomst van interesse zeldzaam is, maar de behandeling vaak voorkomt . In deze situatie zijn er misschien niet veel gegevens om de relatie tussen de uitkomst en de prognostische variabelen te modelleren – een veelgebruikte vuistregel is dat 10 gebeurtenissen moeten worden waargenomen voor elke (niveau van A) prognostische variabele in een multivariabel logistisch regressiemodel) – terwijl er voldoende gegevens kunnen zijn om een goed model voor de neigingsscore te construeren. In dit geval kan een aanpassing met behulp van de neigingsscore de enige haalbare benadering van de analyse zijn.
een potentieel voordeel van methoden voor de neigingsscore ten opzichte van regressieaanpassing is dat het gemakkelijker kan zijn om na te gaan of de neigingsscore gemeten variabelen tussen behandelde en onbehandelde proefpersonen in evenwicht heeft gebracht, terwijl het moeilijker is om te beoordelen of een regressiemodel correct is gespecificeerd .
ten slotte is het belangrijk op te merken dat de analyse van de neigingsscore een ander behandelingseffect schat dan de regressieaanpassing. De analyse van de tendensiteitsscore schat het marginale effect, terwijl de regressieaanpassing het voorwaardelijke effect schat . Het marginale behandelingseffect wordt geïnterpreteerd op het populatieniveau: hoe zou de behandeling het totale aantal waargenomen uitkomsten in de populatie veranderen? Bij gebruik van een logistisch regressiemodel is het voorwaardelijke behandelingseffect de verandering in de kans op het resultaat voor een individu bij blootstelling aan een behandeling in vergelijking met het ontvangen van geen behandeling, afhankelijk van de verklarende variabelen van die persoon – dat wil zeggen het voorwaardelijke effect wordt geïnterpreteerd op het individuele niveau. Een numeriek voorbeeld van dit effect wordt gegeven in de volgende tabel, waar een ziekte 13.200 individuen treft. De meeste personen worden beschouwd als ‘laag risico’, terwijl een klein aantal ‘hoog risico’ heeft, met sterftecijfers van respectievelijk 5% en 25%, onder de oude behandeling. Een nieuwe zeer effectieve behandeling zal de kans op overlijden met 80% verminderen (de voorwaardelijke odds ratio is 0,2), maar de odds ratio op populatieniveau is niet 0,2:
risicogroep | n | Oude behandeling | nieuwe behandeling | rel. Risk | Odds Ratio | ||
---|---|---|---|---|---|---|---|
High risk | 1200 | 300 | (25%) | 75 | (6.25%) | 0.250 | 0.200 |
Low risk | 12000 | 600 | (5%) | 125 | (1.04%) | 0.208 | 0.200 |
Total | 13200 | 900 | (6.8%) | 200 | (1.52%) | 0.222 | 0.210 |
- Rosenbaum PR, Rubin DB. De centrale rol van de neigingsscore in observationele studies voor causale effecten. Biometrika, 1983; 70: 41-55. .
- Baser O. te veel ophef over Neigingsscore modellen? Het vergelijken van methoden van neiging Score Matching. Waarde in gezondheid, 2006;9(6):377-85..
- Rosenbaum PR. Modelgebaseerde directe aanpassing. Journal of the American Statistical Association, 1987; 82: 387-94. .
- Shah BR, Laupacis A, Hux je, Austin PC. De methodes van de neigingsscore gaven gelijkaardige resultaten aan traditionele regressiemodellering in observationele studies: een systematische beoordeling. Tijdschrift voor klinische epidemiologie, 2005;58(6):550-9..
- Austin PC, Grootendorst P, Anderson GM. Een vergelijking van het vermogen van verschillende modellen van de neigingsscore om gemeten variabelen tussen behandelde en onbehandelde proefpersonen in evenwicht te brengen: een Monte Carlo-studie. Statistieken in geneeskunde, 2007; 26(4):734-53..
- Braitman LE, Rosenbaum PR. Zeldzame resultaten, gemeenschappelijke behandelingen: analytische strategieën met behulp van neiging scores . Annalen van de interne geneeskunde, 2002; 137:693-5. .
- Wang J, Donnan PT. Neigingsscore-methoden in onderzoeken naar de veiligheid van geneesmiddelen: praktijk, sterke punten en beperkingen. Farmacoepidemiologie en geneesmiddelenveiligheid, 2001; 10(4):341-4. .Austin PC, Grootendorst P, Normand SL, Anderson GM. Conditionering van de neigingsscore kan resulteren in een partijdige schatting van gemeenschappelijke maatstaven voor het effect van de behandeling: een Monte Carlo-studie. Statistieken in geneeskunde, 2007; 26(4):754-68..
verder lezen
- Austin PC. Een kritische beoordeling van de neiging-score matching in de medische literatuur tussen 1996 en 2003. Statistics in Medicine, 2008 (in press)..
- D ‘ Agostino RB Jr.Neigingsscore methoden voor bias reductie in de vergelijking van een behandeling met een niet-gerandomiseerde controlegroep. Statistiekenin De Geneeskunde, 1998; 17(19):2265-81..
- Imbens GW. De rol van de neigingsscore bij het schatten van de dosis-responsfuncties. Biometrika, 2000; 87(3):706-10..
- Rosenbaum PR, Rubin DB. Het verminderen van bias in observationele studies met behulp van subclassificatie op de neiging score. Tijdschrift van de American Statistical Association, 1984; 79(387):516-24..
- Winkelmayer WC, Kurth T. Neigingsscores: hulp of hype?Nephrology Dialysis Transplantation, 2004; 19: 1671-3..
Dankbetuigingen
dank aan Eric Lau voor zijn hulp bij de ontwikkeling van het illustratieve voorbeeld.
dit werk valt onder een Creative Commons Attribution 3.0 Unported licentie. Deze pagina is het laatst gewijzigd op
Leave a Reply