异常检测-箱线图
2015-10-17 14:53
225 查看
箱线图法:
设有容量为n的样本观察值x1,x2,…,xn,将n个样本值按自小到大排序x(1)<=x(2)<=…<=x(n),样本p分位数(0< p<1)记为xp,则
f(x)={x([np]+1),1/2[x(np)+(np+1)],当np不是整数当np是整数
1、将n个样本自小到大排序x(1)<=x(2)<=…<=x(n)
2、取样本中的最小、第一、二(中位)、三分位数:Min,Q1,M,Q3,Max,
Q1 = x(n*0.25)
3、若样本中数据小于Q1-1.5(Q3-Q1)或大于Q3-1.5(Q3-Q1),则认为它是疑似异常值。
设有容量为n的样本观察值x1,x2,…,xn,将n个样本值按自小到大排序x(1)<=x(2)<=…<=x(n),样本p分位数(0< p<1)记为xp,则
f(x)={x([np]+1),1/2[x(np)+(np+1)],当np不是整数当np是整数
1、将n个样本自小到大排序x(1)<=x(2)<=…<=x(n)
2、取样本中的最小、第一、二(中位)、三分位数:Min,Q1,M,Q3,Max,
Q1 = x(n*0.25)
3、若样本中数据小于Q1-1.5(Q3-Q1)或大于Q3-1.5(Q3-Q1),则认为它是疑似异常值。