离群值处理方法
2018-03-14 15:45
120 查看
目录
基于标准差(SD)法基于MAD的中心距离计算法
1.基于标准差(Standard2Deviations, SD)法a为一组数的平均数,b为这组数的标准差,则超出[a-2b, a+2b]范围的值即被认为离群值。总结这种方法不是特别的靠谱,因为离群值的出现可能反过来很大程度影响平均数和标准差,所以平均数或者标准差受离群值的制约而使得这个检测方法不靠谱。
2.基于绝对离差中位数(Median Absolute Deviation, MAD)的中心距离计算法(1)计算所有观察点的中位数median(X);(2)计算每个观察点与中位数的绝对偏差值abs(X-median(X));(3)计算(2)中的绝对偏差值的中位数,即MAD = median(abs(X - median(X)));(4)将(2)得到的值除以(3)的值,得到一组基于MAD的所有观察点的离中心的距离值abs(X - median(X))/MAD.
总结这是一种稳健对抗离群数据的距离值方法,采用计算各观测值与平均值的距离总和的方法。放大了离群值的影响,相比基于SD的中位数距离法,它可以更清晰地从正常观察点中检测出离群值来。
相关文章推荐
- ASP.NET的HTTP请求处理方法?
- 教你一招 Linux常见紧急情况处理方法
- FLEX日期处理方法
- 处理getdrawable的方法引起的OOM异常
- jquery的ajax提交时“加载中”提示的处理方法
- OC-Xcode中导入runtime框架,函数参数没有提示的处理方法
- 简介JavaScript中用于处理正切的Math.tan()方法
- SpringMVC日期类型转换问题三大处理方法归纳
- TCP粘包处理-RingBuf方法(转)
- SGIP/SMGP长短信处理方法与改造建议
- 十道海量数据处理面试题与十个方法大总结
- linux下shell处理cgi的方法--post get
- 数据大于long long最大值,处理方法 子串加法运算
- 使用Aspect来对访问方法进行预处理和后处理
- 数字图像处理的技术方法和应用
- 在C#中利用Keep-Alive处理Socket网络异常断开的方法
- Yii中处理前后台登录新方法
- PHP处理Excel插件PHPExcel常用方法详解
- window.showModalDialog参数传递中含有特殊字符的处理方法
- 关于RDLC子报表添加参数 错误“本地报表处理期间出错 。值不能为空。 参数名:value” 错误解决方法