您的位置:首页 > 数据库

access 如果删除相同行-转 sqlite也可

2016-01-16 11:49 169 查看
不好意思,之前回答有些笔误。
这么大的数据量,实现楼主这个目的我看可以分步予以实现:

a. 如果原始表不含唯一标识字段
第一步 取出原始表(假设表名为“A”)中无重复的记录行,到一个新表中取名“NewA”
运行SQL生成表查询: select distinct *  into NewA from A
即可将原始无重复的记录存入新表“NewA”中
第二步 检查新表中记录无误后,删除原始表
第三步 重命名新表为原始表名,到此大功告成。

b. 如果原始表含有唯一标识字段,假设该字段名为“id”,其它字段名为:A,B.C,...
方法1)运行下列查询即可。此法一步完成,但是由于数据量非常大,耗时可能会很长,例如几个小或者十几小时以上等
delete from A where id not in(select max(id) from A group by A,B,C,...)
方法2)如果原始表唯一标识字段(id)没有特定的意义,则可以这样做以减少耗时
第一步 创建一个新表(NewA),创建唯一标识字段(id)数据类型为自增ID,其它字段与原始表对应字段同名兼同数据类型(即结构一样)
第二步 运行下列追加SQL查询,将原始表中无重复的记录(注意:不含id字段)追加到新表中
insert into NewA(A,B,C,...) select distinct A,B,C,... from A
第三步 检查新表中记录无误后,删除原始表
第四步 重命名新表为原始表名,到此大功告成。

由于方法1)使用"Not In" 运算,数据库引擎完全不能优化,大数据表时效率极低,不建议使用。下面再给出一个不使用“Not”关键字的方法。
方法3)此方法也可以像方法1)一样,一步到位,一次性删除有两条或以上重复的记录,仅保留有重复记录中id 最小的那条记录,其效率要比方法1)高出至少一个数量级。只适合含有唯一标识的数据表(假设数据表有id,A,B,C四个字段,下列语句中T、T1、id1分别是子查询表别名和字段别名)
DELETE FROM A
WHERE id IN(SELECT id FROM
(SELECT A.id,T.id1 FROM A LEFT JOIN
(SELECT MIN(id) AS id1 FROM A GROUP BY A,B,C)T
ON A.id=T.id1)T1 WHERE T1.id1 IS NULL);

***请注意:运行上列步骤时,请备份原始ACCESS数据库以免造成数据丢失!!!
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: