有时候列联表的情况很负责,比如某个因素的每个水平上都有一个2×2列联表,一种用于分析多层2×2表的方法是Mantel-Haenszel卡方统计量,这个技术有时也叫元分析。用sas软件计算分层表的卡方值非常简单,只需要在PROC FREQ中输入三向表,并加上选项ALL。
下面有一个例子,假设我们有两个2×2表,一个针对男性,一个针对女性,每个表给出了睡眠时间和体能测试达标之间的关系。
|
|
男性检验结果
|
|
|
|
女性检验结果
|
|
|
|
失败
|
通过
|
|
|
失败
|
通过
|
睡眠
|
低
|
20
|
100
|
睡眠
|
低
|
30
|
100
|
|
高
|
15
|
150
|
|
高
|
25
|
200
|
***Program to compute a Mantel-Haenszel Chi-squre Test;
DATA ABILITY;
INPUT GENDER $ RESULTS $ SLEEP $ COUNT;
DATALINES;
BOYS FALL 1-LOW 20
BOYS FALL 2-HIGH 15
BOYS PASS 1-LOW 100
BOYS PASS 2-HIGH 150
GIRLS FALL 1-LOW 30
GIRLS FALL 2-HIGH 25
GIRLS PASS 1-LOW 100
GIRLS PASS 2-HIGH 200
PROC FREQ DATA=ABILITY;
TITLE "Mantel-Haenszel Chi-squre Test";
TABLES GENDER*SLEEP*RESULTS/ALL; *第一个为分情况讨论的变量,gender在第一个则分为男女两个表格输出sleep*results;
WEIGHT COUNT;
(部分结果输出图)
有时候列联表的情况很负责,比如某个因素的每个水平上都有一个2×2列联表,一种用于分析多层2×2表的方法是Mantel-Haenszel卡方统计量,这个技术有时也叫元分析。用sas软件计算分层表的卡方值非常简单,只需要在PROC FREQ中输入三向表,并加上选项ALL。下面有一个例子,假设我们有两个2×2表,一个针对男性,一个针对女性,每个表给出了睡眠时间和体能测试达标之间的关系。
对 2x2 表的 k 层执行 Mantel-Haenszel 检验。 Mantel 和 Haenszel 基于 chi-2 分布提出了这种渐近检验。 假设没有三向交互(k 个独立层)。 参考:DeltaProt 工具箱位于http://services.cbu.uib.no/software/deltaprot/
输入: X:观察到的频率单元的数据矩阵(大小为 2x2xK),每个层 k 的 (a,b,c,d)。 tail:所需的测试(“lt”或“gt”:单尾;“ne”:双尾(默认))。
输出: P值
使用:P = MantelHaenTest(Observed,'ne') 每个层 k 必须是一个 2x2 的表设计,例如:
S 非 S ---------- 样本 1:ab 示例 2:cd ...... (S=成功;非S=失败)。
该检验对于小层大小的功效较低,并且应该将使用限制在每
data sc;
input lt@@; /*输入变量lt*/
if lt<0 then censor=1; /*若lt小于0(代表数据删失),则变量censor赋值为1,否则,赋值为0*/
一.基本规则
1.DATA步骤:定义数据和创建数据集,以DATA 开始,以DATALINES结束;PROC步骤:定义
统计分析的类型,每个PROC过程后接一个run语句。
2.
SAS变量名必须遵循以下原则:以字母或者下划线开头,不超过32个字符长度,不能使用空格或者特殊字符。
二.例子解释
对一个数据集进行分析
卡方检验(chi-square test)是英国统计学家Pearson提出的一种主要用于分析分类变量数据的假设检验方法,该方法主要目的是推断两个或多个总体率或构成比之间有无差别。
卡方分布界值表的依据是卡方分布,其分布是连续型分布,而计数资料中的实际频数为分类资料,是不连续的。因此,计算出来的卡方值查界值表所得的概率P偏小,特别是对自由度为1的四格表资料的影响更大。 为此,美国统计学家F.Yate...
数据点:datalabel datalabelposition datalabelattrs
线值: curvelabel curvelabelposition curvelabelattrs- scatterplot:散点图(以sashelp.class数据集为例)
scatterplot x=height y =weight / options;
group = sex:分组;
datalabel = name/age:每个点的展示值;
name = ‘a’:给该图命名;
- seriespl
假设
检验的第一个重要话题是两组比较。当满足一些假设时,我们采用T
检验;不满足时,我们采用非参数比较。
2.T
检验:两个平均数间的差异
检验
实施T
检验之前,需要满足一些假设:第一,两组必须是独立的;第二,样本平均数理论分布应该是正态的;第三,两个组的方差必须要大致相同。第3个假设在进行T
检验时会自动检查。
通常实验设计都是将被试随机分配到处理组或者控制组,零假设H0表示,如果我们大
对于Excel导入后日期错乱的问题,可以考虑以下几个方面:
1. 检查Excel中日期格式是否正确,确保日期格式与SAS中一致。可以在Excel中选择日期列,右键选择“格式单元格”,选择日期格式。
2. 在SAS中导入Excel数据时,可以使用“guessingrows”选项来指定读取Excel文件的行数,可以增加该选项的值来提高读取Excel文件的准确性。
3. 在SAS中导入Excel数据时,可以使用“dbms”选项来指定数据源类型,可以尝试使用“xlsx”或“xlsb”等Excel文件格式。
4. 在SAS中导入Excel数据时,可以使用“range”选项来指定读取Excel文件的区域,可以指定具体的单元格范围。
5. 如果Excel文件中存在日期的格式不规范或者存在非日期格式的数据,可以在导入数据前先对Excel文件进行预处理,将日期格式标准化,并删除非日期格式的数据。