您的位置:首页 > 其它

样本有偏时的思考

2015-09-14 10:54 211 查看
如何避免样本抽样有偏的情况发生

在关联规则中,对于辛普森悖论的出现,即是由于样本有偏所导致规则提取的错误,在进行抽样时,如果没有比较客观地反映原始总体的信息,那么基于此,所得到的统计分析的结论以及假设检验,都是有错误的。

对于这个问题的解决方案,

1,  多次抽样,将多次抽样的分布绘制出来,取相对集中部分的均值或者众数

2,  对于大的样本按照可利用的商业信息进行分层,再按照恰当比例在每个层中进行抽样。

3,  对于抽样而言,很多情况下,我们想要利用的是,利用样本估计总体,那么如果我们已经可以估计出样本密度函数,那么就可以解决总体估计问题。这里可以利用非参数估计,如:矩估计,ML估计,分位数估计等方法进行样本估计,而对于样本有偏的情况时,对相应的估计进行适当地调整来比较完整地反映总体信息。

     个人感觉,我的思路有很大局限性,欢迎大牛和大侠,批评指正,指点迷津!!
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: