|
拿到了等于学会psm所有过程!包括PSM(近邻匹配、核匹配、半径匹配、马氏匹配、样条匹配等等最全)以及共同支撑假设检验、平衡性假设检验作图等
F* Y( h) w! W: V) T6 D3 V
3 z/ {, R% k8 w" U: J0 ^* _% \7 q/ m1 B/ a6 y( L' k# B- C
倾向评分匹配,简称PSM,是使用非实验数据或观测数据进行干预效应分析的一类统计方法。倾向得分匹配的理论框架是“反事实推断模型”。“反事实推断模型”假定任何因果分析的研究对象都有两种条件下的结果:观测到的和未被观测到的结果。如果我们说“A是导致B的原因”,用的就是一种“事实陈述法”。3 b6 ^, L* w1 o( b% e1 ~9 I
) r$ z: x7 C$ ~, I0 ?6 Y$ ~% J" t6 G- ~% P5 q" I7 C
倾向评分匹配(Propensity Score Matching,简称PSM)是一种统计学方法,用于处理观察研究(Observational Study)的数据。在观察研究中,由于种种原因,数据偏差(bias)和混杂变量(confounding variable)较多,倾向评分匹配的方法正是为了减少这些偏差和混杂变量的影响,以便对实验组和对照组进行更合理的比较。这种方法最早由Paul Rosenbaum和Donald Rubin在1983年提出,一般常用于医学、公共卫生、经济学等领域。 以公共卫生学为例,假设研究问题是吸烟对于大众健康的影响,研究人员常常得到的数据是观察研究数据,而不是随机对照实验数据(Randomized Controlled Trial data),因为吸烟者的行为和结果,以及不吸烟者的行为和结果,是很容易观察到的。但如果要进行随机对照实验,招收大量被试,然后随机分配到吸烟组和不吸烟组,这种实验设计不太容易实现,也并不符合科研伦理。这种情况下观察研究是最合适的研究方法。但是面对最容易获得的观察研究数据,如果不加调整,很容易获得错误的结论,比如拿吸烟组健康状况最好的一些人和不吸烟组健康状况最不好的一些人作对比,得出吸烟对于健康并无负面影响的结论。从统计学角度分析原因,这是因为观察研究并未采用随机分组的方法,无法基于大数定理的作用,在实验组和对照组之间削弱混杂变量的影响,很容易产生系统性的偏差。倾向评分匹配就是用来解决这个问题,消除组别之间的干扰因素。
1 y5 a! t5 K' P
; H" I2 t$ F( ^6 o% K) m
. _& m/ M( `0 B+ f
2 G% y5 Y# P& X! o4 J; z |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
|