迪瑞科特和大家分享用“格鲁布斯(Grubbs)检验”来判断和提出离群数据。
首先我们熟悉下“格鲁布斯(Grubbs)检验”
格鲁布斯(Grubbs)检验 是离散值检验的一种,主要目的是剔除异常数据,这种异常数据不是系统误差,也不 是随机误差,而是由过失误差引起的,这种数据应一律舍去。
对任何一组数据进行处理,首先要检验其 是否存在有过失误差带来的异常数据,即进行离散值检验
“格鲁布斯(Grubbs)检验”的步骤为:
1.将一组数据从小到大按顺序排列:x1、x2、x3、……xn;
2.求这组数据的平均值x及标准偏差S,然后求统计量T,
T= (xn-x)/s;
3.假设若xn为离散值,则T= (xn-x)/s;所得结果T与格鲁布斯检验值表所得临界值Ta,n值比较(a为显著性水平,n为样本量)。
4.如果T≥Ta,n,说明是离散值,必须舍去;
反之,予以保留,Ta,n由查表得到。
格鲁布斯检验临界表
实例分析
土壤中水含量测定含量为:
0.1025 0.1031 0.1028 0.1051 0.102
判断离群数据:
第一步:数据按照从小到大排列:
0.102 0.1025 0.1028 0.1031 0.1051
第二步:计算平均值和标准差
平均值x = 0. 10315, s=0.00105
第三部:计算T
T= (xn-x)/s
从最大的数据和最小的数据开始检验,检验0.102
T0.102=(0.102-0.10315)/ 0.00105=1.095
四步:查表判断
按照95%的置信概率(显著性水平0.05),n=6
查格鲁布斯临界值 T临界=1.822
T0.102<T临界
那么0.102不是离群数据,不应该舍弃