sql优化-in数据量太多导致索引不生效

使用in导致索引不生效的常见解决方案

m0_37367981

474人浏览 · 2024-12-23 10:31:03

m0_37367981 · 2024-12-23 10:31:03 发布

场景为：

table_a 是一个超过250万行的表

CREATE TABLE `table_a` (
  `id` varchar(32) NOT NULL COMMENT 'id',
  `user_id` int NOT NULL DEFAULT '0' COMMENT '用户id',
  `status` tinyint NOT NULL DEFAULT '0',
  ...
  ...
  `create_time` '创建时间',
  `update_time` '更新时间',
  PRIMARY KEY (`id`) USING BTREE,
  KEY `idx_user_id_status` (`user_id`,`status`) USING BTREE,
)ENGINE=InnoDB DEFAULT CHARSET=utf8mb3 COMMENT='';

问题:

- 1,2,3只表示数量 真实数据非有序或连续
select * from table_a where user_id in(1,2,3, ... ,700) and status in(1,2);

查询需要大几十秒

问题分析:

使用explain 解析sql查询计划，发现mysql优化器未选择索引，idx_user_id_status索引失效，原因是条件user_id in的数据量大于700个，全表扫描导致查询时间长。

解决方案:

1.数据拆分

将in查询的数据拆分,将700条分为7条查询sql 每条只in100以内。
优点：避开优化器该机制，好理解
缺点：实现复杂，需要额外写代码组装sql。

2.使用虚拟表

将700个userId放入虚拟表中然后使用连表查询,这样也会走索引查询时间为毫秒级。

create table tmp_user_id(user_id) as select * from (1,2,3,...700) ;
select * from table_a t1, tmp_user_id t2 where t1.user_id = t2.user_id and status in(1,2);

优点：原理简单，不需要额外写代码
缺点：sql相对复杂，需要建立虚拟表,及销毁该虚拟表。

3.强制索引（推荐）

使用强制索引 ,查询中增加关键字**FORCE INDEX (idx_user_id_status)**指定mysql的优化选择器强制使用该索引，使用索引后查询时间为毫秒级

 select * from table_a FORCE INDEX (idx_user_id_status) where user_id in(1,2,3,...700) and status in(1,2);

优点：实现简单
缺点：强制该查询指定了索引，只能用于特定的某个方法

4.优化mysql配置

优先选择多索引而不是单索引

永洪数据分析社区

永洪科技，致力于打造全球领先的数据技术厂商，具备从数据应用方案咨询、BI、AIGC智能分析、数字孪生、数据资产、数据治理、数据实施的端到端大数据价值服务能力。

更多推荐

java计算机毕业设计教师工作量统计系统基于SpringBoot的高校教师绩效测算与可视化平台教师教学任务与工作量智能汇总系统

永洪数据分析社区

BI是报表？BI是可视化？BI到底是什么？

永洪数据分析社区

BackstopJS 与 Prettier 集成：配置文件格式化与团队规范统一

在当今的前端开发环境中，**BackstopJS** 作为一款强大的视觉回归测试工具，已经成为保障UI一致性的重要武器。然而，随着团队规模的扩大和项目的复杂度提升，如何确保所有开发人员遵循统一的配置规范成为了一个挑战。本文将为您详细介绍如何通过 Prettier 工具实现 BackstopJS 配置文件的自动格式化，从而提升团队协作效率和代码质量。💪## 为什么需要 BackstopJS 配