原标题:一键实现倾向性评分匹配(PSM)
“各位用Propensity Score写论文的老师,肿瘤方面已经出了一个论文报告标准了,其他的疾病基本可以参照。”昨日华西的邱实学友留言。
参考文献:Reporting and Guidelines in Propensity Score Analysis: A Systematic Review of Cancer and Cancer Surgical Studies[J]. JNCI: Journal of the National Cancer Institute, 2017,109(8) , SCI IF=12.58
下面看如何实现PSM的统计分析,首先看数据结构:
数据中的HBP(是否高血压)是分组变量,0为对照组,1为病例组,NA代表缺失。每个人有一个唯一编码ID,以及性别sex、年龄age、体质指数BMI等变量信息。现在,我想根据性别、年龄和BMI,对分组变量做1:2配对。
使用易侕软件“数据操作”菜单下的“病例对照配对”模块。
选择分组变量(HBP)、需要配对的变量(sex、age、BMI)、研究对象编号(ID)变量。研究者根据需要设置匹配比例,例如这里设置匹配数1:2。勾选“计算倾向性评分再按评分配对”。这里要定义评分差值为匹配条件,例如这里选择0.05。点击查看结果。就是这么简单!
易侕软件采用了智能化的优先顺序进行匹配,尽可能最大限定地为每个病例找到对照。自动编写R程序,自动摘录结果制表,直接输出需要用到的图表结果:
给出PSM配对组号、倾向性评分的值、配对的编号等。
上图标明病例与对照的倾向性评分分布,以判断哪些区间可用于匹配的资源有限。
如果匹配条件中用于计算倾向性评分的变量里有连续性变量,软件自动再运行曲线拟合模型。
本例中对AGE和BMI进行平滑曲线拟合,重新计算评分,重新匹配。输出图表结果同上。输出的xls文件名带“_gam”以标明用
GAM(广义相加模型)
计算倾向性评分进行的匹配。图表结果略。
原理可以简单粗暴的理解为:用配对变量跟分组变量Y建立回归方程,然后把每位研究对象的配对变量带入方程,可以算出一个值作为评分(score),评分相差小于一定范围的研究对象匹配。
更详细的软件操作和结果解读视频如下:
相关内容链接
返回搜狐,查看更多
责任编辑:
声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。