2.4. 方差分析#
通过软件内的 “方差分析” 功能,可以对数据进行单因素方差分析(one-way ANOVA)。
单因素方差分析一般用于检验互相独立且符合正态分布的各组数据间的均值是否相等,且可以进行组间均值的两两比较(pairwise comparison)。
2.4.1. 数据映射关系#

图 2.127 方差分析数据映射示意图#
变量 (必选项,多选):需要检验的变量数据。若有多个变量,则将分别进行检验。
组别 (必选项,单选):组别数据。用于区分变量数据所属的组别,拥有相同组别值的变量数据将被视作同一组。
2.4.2. 分析选项#
事后比较#

图 2.128 事后比较选项示意图#
2.4.3. 分析结果#
分析选项#
本次方差分析的分析选项设置。示例可见 图 2.129。

图 2.129 分析选项表格示意图#
描述性统计#
各组数据以及全部数据的描述性统计结果,包括均值、标准差、中位数等。示例可见 图 2.130。

图 2.130 描述性统计表格示意图#
单因素方差分析#
单因素方差分析的结果,包括组间与组内的均方(mean square)、统计量 F 值及对应的 P 值,其详细计算方法可参考 统计理论 小节。示例可见 图 2.131。

图 2.131 单因素方差分析表格示意图#
LSD 事后比较#
LSD 事后比较的结果,包括各组两两间的均值差、检验 P 值与均值差置信区间。仅当在 事后比较 选项内选择 LSD (最小显著性差异法)
才会出现此表格。示例可见 图 2.132。

图 2.132 LSD 事后比较表格示意图#
运行日志#
方差分析的运行日志,包含软件版本、运行时间、运行成功与否等信息。示例可见 图 2.133。

图 2.133 运行日志示意图#
2.4.4. 统计理论#
方差分析的统计假设#
某因素
此时单因素方差分析的原假设为:
备择假设为:
我们引入
当且仅当
所以原假设可以修改为:
计算均方#
为了计算与上述假设相关的统计量,我们首先引入总偏差平方和
根据卡方分布的定义,可知:
对于
对于
一般而言,我们称
构建统计量#
此时我们可以构建似然比检验统计量 F:
由于
计算均值差置信区间#
已知因素
易知:
因此均值差的无偏估计为
类似于在 双样本 t 检验 中的思路,我们可以证明:
其中
综上所述,均值差在置信水平为
LSD 两两比较#
方差分析的结果仅能说明各组间均值是否不全相等,若想知晓具体的两组间均值是否相等,则需要使用两两比较的方法。
LSD(least significant difference)是方差分析中常用的两两比较方法之一。对于元素
我们发现 LSD 的思路与假设等方差的独立双样本 t 检验类似(区别是 LSD 使用了所有样本的联合方差
在显著性水平为
2.4.5. 案例#
我们现有一份患者年龄的数据数据(如下表所示),这些患者即将分别服用 A 药、B 药与 C 药。在服药之前,我们想先获知各组患者的平均年龄是否显著差异,以避免因年龄不同而导致试验结果的偏倚。我们可以使用方差分析功能来完成上述目的:
年龄 组别
24 A
33 A
35 A
46 A
22 A
36 A
37 B
32 B
23 B
28 B
19 B
32 B
25 C
23 C
44 C
43 C
35 C
38 C
新建一个 “方差分析”,并在
变量
和组别
列内分别输入上述数据(图 2.134)。

图 2.134 输入数据示意图#
数据输入完成后,点击 “下一步” 按钮,在选项页面中选择事后比较方法为
LSD (最小显著性差异法)
以执行两两比较(图 2.135)。

图 2.135 事后比较选项示意图#
随后点击 “运行” 按钮执行方差分析。在结果的 “单因素方差分析” 表格(图 2.136)中我们可以获知组间均方为 59.389、统计量 F 值为 0.892、P 值 0.430。因此我们可以认为各组患者间的平均年龄相仿,不存在显著差异。在 “LSD 事后比较” 表格中则可以进一步获知各组的均值差及相关计算结果。

图 2.136 方差分析结果示意图#