《新英格兰医学杂志》论文统计解读：秩和检..._综合_教育

置信区很重要。

无论是均数、中位数、率的置信区间，都应该在统计分析结果中强化。均数的置信区间一般的统计分析软件都可方便计算。比如SPSS软件，统计描述时会给出均数的95%置信区间，t检验时会给出均数差值的95%置信区间。率的置信区间，我们在之前一篇推文已经介绍过：小技巧！如何用SPSS计算率的置信区间

那么如果是偏态分布，采用中位数描述和非参数秩和检验，如何估计中位数差值的置信区间呢？答案是：Hodges-Lehmann估计法或bootstrap估计法。

SPSS能否操作呢？能！现在，本文结合一篇临床试验论文来探讨下如何利用SPSS和R语言基于Hodges-Lehmann法开展中位数差值的置信区间估计。

案例所采用的文章是2019年9月5日发表在《新英格兰医学杂志》的一篇临床试验论文。它大多数定量指标差值的置信区间采用HodgesLehmann法估计得到。

本临床试验介绍

肺泡蛋白沉积症是一种以肺泡中表面活性剂异常积聚为特征的疾病。大多数病例是自身免疫性的，并且与抗粒细胞巨噬细胞集落刺激因子（GM-CSF）的自身抗体有关，该自身抗体可防止肺泡巨噬细胞清除肺表面活性物质。一项开放标签的2期研究显示吸入重组人GM-CSF对严重肺泡蛋白沉积症患者有一定疗效；然而，轻度至中度疾病患者的疗效尚不清楚。

为此，研究人员进行了一项双盲、安慰剂对照试验。64例自身免疫性肺病患者肺泡蛋白沉积症每日吸入重组人GM-CSF（sargramostim），剂量为125 g，每日两次，共7天，隔周一次，共24周，或安慰剂治疗，这些患者当呼吸环境空气低于70毫米汞柱（或症状患者<75毫米汞柱）时，记录了动脉氧分压（Pao2）。排除患有严重肺泡蛋白沉积症（Pao2<50 mmHg）的患者，以避免被指定接受安慰剂治疗的患者可能加剧该疾病。该研究的主要终点是基线和第25周之间的肺泡血氧梯度的变化。

一句话：RCT研究，患者共64例，随机分为两组，比较重组人GM-CSF与安慰剂组肺泡血氧梯度的变化。

结果发现，GM-CSF组（33例患者）的平均（SD）肺泡血氧梯度变化明显好于安慰剂组（30例）（平均从基线变化为-4.50±9.03 mmHg vs. 0.17±10.50 mmHg; P=0.02）。CT扫描肺野密度的基线和第25周之间的变化在GM-CSF组中也更好（组间差异为-36.08 95％置信区间为-61.58至-6.99，使用MannWhitney U检验和HodgesLehmann估计伪中位数的置信区间）。GM-CSF组6例患者和安慰剂组3例患者出现严重不良事件。

主要结局指标基本为正态分布

其中一个次要结局指标CT密度，偏态分布

该研究统计描述采用均数加减标准差，差异性比较采用两样本秩和检验，置信区间采用Hodges-Lehmann估计法估计

文章最后结论是：在这项随机对照试验中，吸入重组人GM-CSF与动脉氧张力实验室结果改善相关，但未发现临床益处。

本案例的主要统计学方法

1. 统计描述

Numerical results are presented as means (±SD) or medians with interquartile ranges.

2.两组数据的比较

The Mann–Whitney U test was used to assess the difference between

the two groups, and the sign test was used to assess the differences from baseline to week 25 within each group.

For categorical end points, the data were compared with the use of either the chi-square test or Fisher’s exact test. For continuous variables, the medians were compared with a Mann–Whitney U test.

3.关于P值

The P value was two-sided and used for the primary end point only. A P value of less than 0.05 was considered to indicate statistical significance.

郑老师：从统计分析来看，作者直接采用Mann–Whitney U test方法进行分析，这个方法即两样本秩和检验。有些人好奇了，那么正态分布的怎么办？结局指标既有正态分布，又有偏态分布，是不是要t检验和秩和检验结合呢? 其实也大可不必，因为秩和检验即可以用于正态分布数据比较，也可以用于偏态分布数据比较，为了统一用一种方法，研究人员干脆就统一用了两样本秩和检验。

统计方法还采用了比如混合效应模型来提供支持性的数据，这里不再做介绍。方法里面未提及置信区间的估计，作者在结果的表和论文的摘要中提到了置信区间估计的方法“a pseudo-median difference calculated with the use of the Hodges–Lehmann estimate based on the Mann–Whitney U test”

利用SPSS计算中位数差值置信区间

SPSS如何进行中位数差值置信区间估计呢？我们以下案例为例，进行Hodges–Lehmann估计。该方法就镶嵌在两样本秩和检验的SPSS操作界面之中。

某研究者将小鼠随机分为两组，观察局部加热治疗小鼠移植肿瘤的疗效，以生存时间（日）作为观察指标，实验结果见下表，试检验两组小鼠生存日数有无差别？

局部加热组：10，12，15， 15， 15，16，20，23 30，40

空白对照组：2，3， 3， 3，4， 4， 4，6，9，11，12，14

Hodges–Lehmann法的界面：它在SPSS 的非参数检验方法中。

首先，非参数检验，在“字段”界面，设置检验变量（生产日期）和分组变量（分组）

然后，在“设置”界面中，定制检验，选择“曼-惠特尼”（即两样本秩和检验），界面底部选择“霍奇斯-莱曼估算”（即Hodges–Lehmann）计算置信区间。

最后得到，中位数差值的置信区间了！首先，展现给我们的是一个总表,，是秩和检验的P值。

接着，双击总表，得到下图后，选择下图左侧底部“置信区间汇总视图”，即可

最后，基于秩和检验的得到中位数差值置信区间估计值，95%CI为7.00-18.00。

利用R语言计算中位数差值置信区间

数据从SPSS导入

library(foreign) # 利用foreign直接将数据库从SPSS中导入

e3=read.spss("rat.sav") #读取数据集，

e3<-as.data.frame(e3)

str(e3) # 浏览变量

is.factor(e3$group)# group变量是因子吗？

is.numeric(e3$time)# group变量是数值吗？

秩和检验和置信区间估计

wilcox.test(time~group,data=e3,mu=0,exact = F,

paired = FALSE,conf.int = T, conf.level = 0.95)

参考文献：

Ryushi Tazawa,et al.Inhaled GM-CSF for Pulmonary Alveolar Proteinosis. NEJM.2019.

另外有两篇中文的翻译，也探讨了中位数差别的置信区间，有兴趣可以看看

http://kuaibao.qq.com/s/20190902AZPJJ200

https://xw.qq.com/cmsid/20181213A0A7PL00

本文毕，更多基于论文的案例解读请点击下方“统计技巧”。

meta分析

R语言

真实世界研究

统计技巧

快好知 kuaihz

《新英格兰医学杂志》论文统计解读：秩和检...

如何计算二进制减法

文献综述怎么写？这篇文章说的透彻...

孩子上幼儿园哭怎么办，家长应该怎...

最新