MySQL Help 答朋友问:5000W记录的Innodb表如何快速的去重复数据
2014-02-25 14:24
696 查看
朋友问:
5000万数据的一张表,怎么去重快,根据两个字段判断是否重复。
回复之:把2个字段以及主键id select 出来建立一张临时表t1,
t1建立好主键索引以及2个对比的字段联合索引。
然后在临时表里面 比对重复的记录,把重复的记录录入第二张临时表t2,t2表结构和t1一模一样。
然后根据你的业务来决定如何处理t2表里面的重复记录,用t2关联原来的5000W记录的表来进行处理,
大概通常的是group by2个字段,取出主键id较大的值的记录删除掉。
相关文章推荐
- Mysql创建新用户
- MySQL:日期函数、时间函数总结(MySQL 5.X)
- Ubuntu下无法使用root登录Mysql的解决办法
- CYYMysql 源码解读 4
- 修改Ubuntu默认的MySQL表名大小写区分
- MySQL性能优化
- MySQL Benchmark(全文)
- mysql汉字按字母顺序排序
- MySQL global Log
- mysql : 常用管理命令
- mysql优化Analyze Table
- SqlServer和Mysql 时间字段格式化
- mysql创建定时任务(V2.10)
- 17 mysql XA事务
- mysql缓存设置
- MySQL中EXPLAIN解释命令
- mysql配置文件my.cnf详解
- mysql互为主从配置(双主模型) 推荐
- MySQL 5.1升级到MySQL 5.5的步骤
- mysql触发器