24小时咨询热线:0755-26567373 / 13691710821 / 13922811897 / 15539086575 / 13427366193
新闻资讯 / NEWS
实验室认证认可
当前位置: 首页 >新闻资讯

真实案例教您如何剔除离群数据

时间:2015-07-23 15:09:33    作者:admin    查看次数:2296

迪瑞科特和大家分享用“格鲁布斯(Grubbs)检验”来判断和提出离群数据。
首先我们熟悉下“格鲁布斯(Grubbs)检验”
格鲁布斯(Grubbs)检验 是离散值检验的一种,主要目的是剔除异常数据,这种异常数据不是系统误差,也不 是随机误差,而是由过失误差引起的,这种数据应一律舍去。
对任何一组数据进行处理,首先要检验其 是否存在有过失误差带来的异常数据,即进行离散值检验

“格鲁布斯(Grubbs)检验”的步骤为:

1.将一组数据从小到大按顺序排列:x1、x2、x3、……xn;

2.求这组数据的平均值x及标准偏差S,然后求统计量T,
T= (xn-x)/s;

3.假设若xn为离散值,则T= (xn-x)/s;所得结果T与格鲁布斯检验值表所得临界值Ta,n值比较(a为显著性水平,n为样本量)。

4.如果T≥Ta,n,说明是离散值,必须舍去;
反之,予以保留,Ta,n由查表得到。

格鲁布斯检验临界表

 


实例分析

土壤中水含量测定含量为:
0.1025 0.1031  0.1028 0.1051 0.102
判断离群数据:

第一步:数据按照从小到大排列:
0.102 0.1025 0.1028 0.1031  0.1051

第二步:计算平均值和标准差
平均值x = 0. 10315, s=0.00105

第三部:计算T
T= (xn-x)/s
从最大的数据和最小的数据开始检验,检验0.102
T0.102=(0.102-0.10315)/ 0.00105=1.095


四步:查表判断
按照95%的置信概率(显著性水平0.05),n=6
查格鲁布斯临界值 T临界=1.822

T0.102<T临界
那么0.102不是离群数据,不应该舍弃