1. 每周一讲,全方位的SPSS 教程粉墨登场
2. SPSS教程学习准备:“研究设计”视频
3. 正态性检验(SPSS详版、SPSS简版、R语言版)
4. 两样本t检验(SPSS详版、SPSS简版、R语言版)
5. 两样本秩和检验(SPSS详版、SPSS简版、R语言版)
第2讲 实验性研究定量数据统计策略(4):
t检验主要用于两组定量正态分布的数据比较,但是如果需要比较多组定量数据,t检验分析方法很可能不合适,此时,必须要借助另外一种方法,方差分析,英文缩写ANOVA(ANlysis Of VAriance)。
实例分析
在评价某临床新药耐受性及安全性的2a期临床试验中,对符合纳入标准的30名健康自愿者随机分为3组,每组10名。各组注射剂量分别为0.5U、1U、2U,观察48小时部分凝血活酶时间(s),试问不同剂量的部分凝血活酶时间有无不同?数据库见time48.sav1:思考
这个案例来源于上一讲,需要思考:
-这个案例由几个变量组成?
-研究的结局变量是什么?
-结局变量属于什么类型的变量?
-如果是定量变量数据,是偏态还是正态分布?
-研究目的是比较,那比较的组数是多少?2:案情分析
这个案例包括2个变量,一个是活酶时间(s),另外一个是分组变量。主要研究的结局指标是活酶时间,为定量变量数据;比较的组数是3组(0.5单位/1单位/2单位)。本案例目的是比较多组总体有无统计学差异。3:统计分析策略
多组定量数据的比较,基本的方法有2种。一种是成组F检验,一种是多样本的非参数秩和检验(Kruskal Wallis 秩和检验)。
究竟采用哪种方法,必须考虑“三个性”的条件:正态性、独立性、方差齐性。关于“三个性”的解释,可以看之前的文章,此处不再赘述:SPSS 统计分析策略(2): 两样本t检验
总的来说,方差分析针对两组或以上、定量、正态、独立、方差齐的数据比较。前面2个要求和多样本的非参数秩和检相同,差别在于F检验要求数据符合正态性、独立性、方差齐性三个要求。此外,如果细心的朋友可能会注意到,这里方差分析的条件是2组或以上,也就是方差分析不仅处理多样本,也同样可以处理2样本,关于这一点,我最后进行解释。
总结来说,对于本例:
本例采用随机化分组设计,独立性符合。
正态性方面,采用的是多样本正态性检验方法,探讨各组是否均来自于正态分布总体。经SW检验,0.5个单位P=0.531,1个单位P=0.250,2个单位P=0.605,没有统计学意义,三组数据正态性均符合。
SPSS 操作1:F检验SPSS操作界面:
“检验变量”放入活酶时间(time),“分组变量”放入分组(group),同时进行“定义组”。
① 检验变量:即放入结局指标,本例为凝血活酶时间(time)
② 分组变量:放入group,无须如同t检验“定义组”
③ 选项:此处内容较为丰富,见下图:
① 描述:描述不同组的结局的均数、标准差、95%CI置信区间
④平均值:大致比较多组之间的均数,意义不大。3:F检验分析结果及解释
根据上述SPSS操作,F检验统计分析以下结果:第一,统计描述,给出均数、标准差、95%CI置信区间
第二,方差齐性检验。可选择第一行结果,结果显示方差齐性检验P=0.186,方差差不多一致。可采用F检验。
第三,F检验结果,结果显示F=0.63,P值=0.005,说明多组总体均数存在着统计学差异。
①F值,为本表中两个均方值的比值(45.6/6.98=9)
②显著性,即P值
第四,韦尔奇检验,这是F检验的在方差不齐时的替代,Welch 检验,P值=0.002,意味着多组存在着统计学差异。
结果及表格的规范表达
根据上表,我们可以得到以下的规范的结论:
规范文字:0.5个单位剂量组平均凝血活酶时间为(36.6±2.3)s,1个单位剂量组平均凝血活酶时间为(37.8±2.2)s,2个单位剂量组平均凝血活酶时间为(35.1±3.3)s,三组时间总体均数存在着统计差异(F=6.5,P=0.005)。
规范的统计表(其中一种形式)为:
F检验在统计分析中的实际应用
1.F检验结论取决于研究设计F检验是最基本的假设检验方法,在随机、对照、平行的实验性研究中,F检验的结论十分可靠,完全证明一个干预措施是否真正产生效果,或者干预措施和定量结局是否存在着因果关系。
但是F检验如果用在观察性研究,比如比较男性、女性的体重有无差别,其结论不能说性别是体重的影响因素,只能说男性和女性体重存在着统计学差异,仅此而已。关于观察性研究F检验,后期再进行分析。
因此,同t检验一样,F检验结果到底能够说明什么问题,取决于研究设计。
3. 两样本比较,也可以用F检验
很多时候,如果进行多次方差分析,多个方差分析结果需要呈现在同一表中,有些分组变量为二分类,有些是多分类,此时,需要同时包括t检验和F检验吗?其实不用,两样本比较,也可以用F检验,而且两样本t检验和两样本F检验的结果是一致的。比如以下案例:
将出生28天的20只大白鼠随机分成两组,分别饲以高蛋白和低蛋白饲料,8周后观察其体重(g)。问两种不同饲料对大白鼠的体重影响有无差别?
高蛋白组:133,145,112,138,99,157,126,121,139,106,115
低蛋白组:118,75,106,87,94,110,102,124,130
t检验的结果
F检验的结果
可以看出,两个结果P=0.016,没有任何差别。所以,两组比较别就盯着两样本t检验了!
2.F检验“三个性”同t检验,是原则,不是铁标准关于“正态性、独立性和方差齐性”,与t检验一样,差不多即可,不用严格执行。总体上,独立性一般成组设计即可,无论是随机化设计还是自然成组,方差不齐,亦可以采用校正F检验(wetch检验),关键的主要是在于t检验。当F检验遇见正态性问题
是否采用F检验,要看其指标理论上是何分布,直方图形态是否大致中间多或者两边少,观其是否极端异常值;正态性检验是辅助的作用。以下分析习惯,与t检验套路相同,仅供参考:
如果指标理论上属于偏态分布,则放弃F检验
如果该指标理论上属于正态分布,无论大小样本,该只要直方图大致中间多或者两边少,无特别异常值,均可采用F检验
如果指标理论分布不明确,但样本量较大(>100),该只要直方图大致中间多或者两边少,无特别异常值,均可采用F检验,无需考虑正态性检验结果。
如果指标理论分布不明确,但样本量不大(<100),若两组数据正态性检验p值均>0.01,可以考虑采用F检验,若至少一组<0.01,建议放弃F检验
无论大小样本,如果直方图呈一边倒趋势,或者存在若干个极端异常值,放弃F检验
最后,多组数据比较,任何一组P<0.05,均可以放弃F检验而选择秩和检验(但我也很少这么做)
SPSS 课程视频和操作录屏
SPSS课程视频
带字幕去水印的视频可复制以下地址浏览器打开
https://evod.zcmu.edu.cn/resource.html?stationID=1&resourceid=415&isprivate=false&cateid=102SPSS课程录屏
-本讲结束-,敬请阅读同期R语言教程推文-
meta分析R语言
真实世界研究统计技巧