这是他们一个开发写的sql,目的是删除重复数据,且id是最小值的行不删除:deletefromjd_chapterawherea.`id`in(select`id`fromjd_chaptergroup&nbs..
这是他们一个开发写的sql,目的是删除重复数据,且id是最小值的行不删除:
因为表大(千万级别),且使用了两个子查询,执行了很久没有执行完。
--------------------------思路----------------------------
采用临时表做关联,以下是步骤:
一、先到slave库上把重复数据导出来,网站空间,避免造成主库压力过大。
into outfile '/tmp/jd_chapter.sql' fields terminated by ','; 二、拷贝导出的sql到master主库的/tmp/目录下
三、在master主库上,建立一张临时表,并创建主键:
query ok, 0 rows affected (0.07 sec) 四、在master主库上,load方式导入至临时表里
load data infile '/tmp/jd_chapter.sql' into table tmp fields terminated by ','; 五、在master主库上,删除临时表最小的id
delete from tmp limit 1; 六、用临时表做关联,删除jd_chapter表重复数据
本文出自 “贺春旸的技术专栏” 博客,网站空间,请务必保留此出处
,虚拟主机