本文打印自www.cabit.com.cn 字体大小:- + 
解释结果:正态性检验
2020/7/16


正态性回答什么问题?

正态性检验均报告P值。 要了解P值,您需要了解原假设。 在这种情况下,零假设是所有值都是从遵循高斯分布的总体中采样的。

P值回答下面的问题:

如果该零假设成立,那么随机抽样数据与这些数据一样偏离理想高斯的机会是多少?

Prism还使用传统的0.05临界值来回答数据是否通过正态性检验的问题。 如果P值大于0.05,则答案为“是”。 如果P值小于或等于0.05,则答案为“否”。

如果正态性检验的P值高,我应该得出什么结论?

您只能说数据与高斯分布并不矛盾。 正态性检验不能证明数据是从高斯分布中采样的。 正态性检验所能做的就是证明与理想高斯的偏差不超过您仅凭偶然发现的偏差。 对于大型数据集,这令人放心。 对于较小的数据集,正态性检验没有足够的能力来检测与理想高斯值的适度偏差。

如果正态性检验的P值低,我应该得出什么结论?

零假设是从高斯分布中采样数据。 如果P值足够小,则您拒绝该原假设,并接受另一个假设,即该数据不是从高斯总体中采样的。 分布可能接近高斯分布(具有大数据集),也可能相距很远。 正态性检验不会告诉您关于替代分布的任何信息。

如果您的P值足够小,足以宣布与理想高斯的偏差为“统计上显著的”,那么您有四个选择:

•数据可能来自另一个可识别的分布。 如果是这样,您可能可以转换您的值以创建高斯分布。 例如,如果数据来自对数正态分布,则将所有值转换为其对数。

•一个或几个异常值的存在可能导致正态性检验失败。 运行离群值检验。 考虑排除异常值。

•如果偏离正常值的幅度很小,则可以选择不执行任何操作。 对于轻度违反高斯假设的情况,统计检验往往非常可靠。

•切换到非假设为高斯分布的非参数检验。 但是使用(或不使用)非参数检验的决定是一个重大决定。 它不应基于单个正态性检验,也不应自动化。