第1个问题
Question 1: 郑老师您好,我想请教您个问题[呲牙],我现在做的试验是干预性非随机对照试验,比较两种治疗方法的疗效优劣,最后统计结果是阴性,想针对不同年龄层进行一下亚组分析。但是不明白事后亚组分析的分组原则是有专门的统计方法进行分组呢,还是基于已有文献的论证,自己对可能有关的变量进行分组呢?(统计小白,问的问题有点弱智[捂脸][捂脸]老师不要嫌弃)
Answer1:亚组分析其实不是特别的方法,比如我们可以总体评价干预组和对照组的疗效,如果是有效率的话,可以采用卡方检验;如果是亚组分析呢?分年龄进行亚组分析,意味着在每个年龄层都开展一次卡方检验,计算P值,便是亚组分析。所以亚组分析统计学方法和总分析方法无异。临床试验亚组分析没有特别的,可以事先设定,也可以事后分析,但事先设定的意义更大一些。
--临床试验设计分析--
第2个问题
Question2:为什么以下研究结论不妥当,不够严谨
这是一项回顾性队列研究,所有180病例为医院手足口病的住院患者。按患者是否应用中药治疗分为常规治疗组(对照组)与中药治疗组(治疗组)。比较中、西医治疗的效果。结果方面,两组患者的有效率情况采用卡方检验,差异有统计学意义(P<0.01),该论文认为中医药治疗效果较好。显然这样的结论不妥当,不够严谨。
Answer2:无论是t检验、卡方、秩和、方差分析的分析结果,其结论是否可靠均需要严谨的设计。只有在随机化设计、合理均衡对照、一定样本量的基础上,通过假设检验的方法得到的结果,才能够被认为是处理因素发挥作用。而随意分组、自身前后配对研究、甚至空白对照,都没法证明处理因素的作用。观察性研究比如调查研究,差异性的统计分析方法更说明不了什么问题,只能说组与组有差别!不能说明有真的有疗效。
--观察性研究统计分析策略--
第3个问题
Question3: 请教一下,大家有没有发现杂志里有好多不符合正态分布的数据都是用均数加减标准差表示的,还是这样表示可以。
Answer3:好多杂志不正态用均数加减标准差,最可能的原因是我们数据分析不规范,不进行正态性判断,无论什么类型的数据,都用均数来描述。一把来说,正态或者近似正态分布的可以用均数来描述,严重偏态分布的,应该用中位数来描述更为妥当。详细可见本公众号推文:SPSS 统计分析策略(1):正态性检验与判断
--定量数据统计分析策略--
第4个问题
Question4:郑老师,您讲过Logistic回归计算样本量一般阳性个数是自变量个数的10倍以上。那么算的时候,自变量数目是一开始纳入的全部还是分析后剔除留下有意义的?比如我有12个因变量,目前收集80例,阳性结果50例,那自变量只能有5个。如果说我经过分析校验后有统计学意义的只有5个,这样样本量是够了还是不够?
Answer4:Logistic回归计算样本量一般阳性个数是自变量个数的10倍以上,这句话一般指的是纳入回归分析时,通常是最终模型,比如如果我们采用全因子模型(SPSS操作位“输入”)而不剔除自变量,那么最后要考虑50个阳性个数只能纳入5个,如果采用逐步回归法,最后剩下2个自变量有统计学意义,那么要求阳性个数是至少10个。因此,逐步回归法在小样本研究中相对更有优势。此外,这里的阳性个数应该是二分类结局中发生数的结局为准,比如本例80例中,50例是阳性,30例是阴性,那么算样本量以30例作为依据,而不是以50例。
--样本量计算--
meta分析
R语言
真实世界研究
统计技巧