Mann-Whitney U检验,也称为Wilcoxon秩和检验,是一种非参数统计检验方法,用于比较两个独立样本的中位数是否存在显著差异。这种检验方法适用于两组样本,其中样本不满足正态分布假设或方差齐性假设。它是对独立样本t检验的一种非参数替代方法。
Mann-Whitney U检验的基本思想是将两组数据合并起来,然后按照数值的大小进行排序,接着计算每个样本中的秩次(rank),然后将这些秩次相加。最后,通过比较这两组秩次和来确定两组数据是否存在显著的差异。
检验步骤如下:
1. 收集数据:首先,收集两组不满足正态分布假设的独立样本数据。
2. 合并数据:将两组数据合并成一个单一的数据集,并为每个数据点标记其来源组别。
3. 排序数据:按照数值的大小对合并后的数据进行排序。
4. 计算秩次:为每个数据点分配秩次,即根据数据在排序后的位置确定其秩次。对于秩次相同的数据点,通常采用平均秩次。
5. 计算U值:计算两组样本的秩和(U值)。其中,一个样本的U值表示其中一个组的所有秩次之和,另一个样本的U值表示另一个组的所有秩次之和。
6. 比较U值:通过比较两个样本的U值,可以确定它们是否存在显著的差异。这通常涉及到与临界值或基于置信水平的临界值进行比较。
7. 做出统计推断:根据比较结果,做出是否拒绝零假设的决策。
Mann-Whitney U检验的优点包括:
无需复杂的操作过程,一键生成分析报告。
避免个人的计算失误,后台帮你算法分析。
对异常值不敏感,使用秩而非原始数据,减少了异常值的影响。
适用于顺序变量,可以处理定性的顺序数据。
在正态分布假设不成立时,比t检验更有效。
在实际应用中,当样本量较小(通常小于30)且数据不服从正态分布时,Mann-Whitney U检验是一个合适的选择。
在报告Mann-Whitney U检验的结果时,通常包括U统计量和p值,有时还会提供中位数差异的置信区间。如果p值小于显著性水平(通常为0.05),则拒绝零假设,认为两组之间存在显著差异。