您的位置：首页 > 数据库

SQL 数据排重，去掉重复数据

2005-04-03 09:55 435 查看

最大的错误：
在对数据排重的时候，首先想到的就是Distinct，虽然这很管用，但多数场合下不适用，因为通常排重后还要做进一步处理，比如对编号排重后要按日期统计等。
无法排重的Group by ... having ...
虽然可以用Group by userid having count(*) =1 或者>1 ，但只能找出重复或者不重复的记录，好像达不到distinct 的效果（我是没做到，啊笨）。
这个可以：
用select * from table t where not exists (select 1 from table where userid=t.userid and submit_time > submit_time) （submit_time为记录入库时间，或者可以用其他的只要是数据库中不重复的字段就成），同时还达到了一个效果，第一次入库的userid才被计算在内，这在许多情况下还是比较有用的（比如处理误操作什么的）。
值得注意：
另外在用上面的方法排重的时候，如果外面的select * .... where ... 后还有其他条件，则这些条件也要写入 select 1 from .... where .... 中，即内、外条件要相同（我就是没注意到这点，发现结果比Distinct 上下差几条，郁闷了好久:( ）

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航