我知道这个问题已被问了一百次,但不幸的是,这些答案都没有帮助,因为大多数都是很多年,它应该证明另一个问题的合理性.
我有两个表,140kk行/ 24GB的记录和额外的89kk行/ 70GB.
每个额外的行都有一个与记录的外键关系,索引在两个表之间正确设置.记录中的删除会将删除级联到相关的额外行.
我需要在制作过程中清除旧记录.
运行DELETE FROM记录WHERE WHERE创建< UNIX_TIMESTAMP(DATE_SUB(Now(),INTERVAL 30天))ORDER BY id LIMIT 1000;需要无休止的(我在20分钟后将它杀死了,它仍处于初始状态).使用SELECT执行相同操作只需几毫秒即可完成.
由于SELECT是那么快我用ID IN(SELECT id子查询^)尝试它,不幸的是没有改变一个东西,所以我在15分钟后杀了它.
由于删除单个记录很快,我最终完成了这项工作:
for i in `seq 1 100000`; do
MysqL database -e "SELECT id FROM records WHERE created < UNIX_TIMESTAMP(DATE_SUB(Now(), INTERVAL 30 DAY)) ORDER BY id LIMIT 1000;" | sed 's;/|;;g' | awk '{if(NR>1)print "DELETE FROM records WHERE id = ",$1,";" }' | MysqL database;
Now=$(date +"%Y/%m/%d %T")
echo "[ $Now ] $i.000"
done
这可以在开始时每秒处理一千条记录,但是在几次循环之后它每10-20秒就会下降到一千条记录.由于我需要清除100k行,这需要将近一个月的时间才能完成,这与清除记录的时间差大致相同,因此它永远不会完成(特别是因为有多个数据库需要这样做).
数据库存储在SSD Crucial_CT500MX200SSD1上,软件是带有InnoDB引擎的MariaDB 10.1. innodb_flush_log_at_trx_commit设置为0以避免不必要的磁盘工具.
根据atop瓶颈是磁盘,cpu几乎正在睡眠,大部分内存都在系统缓存中.
结构转储:https://gist.github.com/Slind14/0da34e09dba91cf411db2ead5ad666ef
解决方法:
见http://mysql.rjweb.org/doc.php/deletebig
可能效果最好的是基于PRIMARY KEY(它有这样的?)遍历表,删除该块中符合条件的行.
这是有效的原因是它一次看100行,与它们一起工作,然后继续前进到接下来的100行.相反,使用LIMIT和无界WHERE子句可能需要反复扫描相同的行.
你提到了加入.根据成本的高低,100可能是一个很好的限制.如果JOIN不是太繁重,也许1000会很好.
如果这将是一个重复的任务,请考虑使用PARTITIONing,以便DROP PARTITION可用于“立即”执行契约.
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。