11 | 索引:怎么提高查询的速度?

你好,我是朱晓峰。

在我们的超市信息系统刚刚开始运营的时候,因为数据量很少,每一次的查询都能很快拿到结果。但是,系统运转时间长了以后,数据量不断地累积,变得越来越庞大,很多查询的速度就变得特别慢。这个时候,我们就采用了MySQL 提供的高效访问数据的方法—— 索引,有效地解决了这个问题,甚至之前的一个需要8秒钟才能完成的查询,现在只用0.3秒就搞定了,速度提升了20多倍。

那么,索引到底是啥呢?该怎么使用呢?这节课,我们就来聊一聊。

索引是什么?

如果你去过图书馆,应该会知道图书馆的检索系统。图书馆为图书准备了检索目录,包括书名、书号、对应的位置信息,包括在哪个区、哪个书架、哪一层。我们可以通过书名或书号,快速获知书的位置,拿到需要的书。

MySQL中的索引,就相当于图书馆的检索目录,它是帮助MySQL系统快速检索数据的一种存储结构。我们可以在索引中按照查询条件,检索索引字段的值,然后快速定位数据记录的位置,这样就不需要遍历整个数据表了。而且,数据表中的字段越多,表中数据记录越多,速度提升越是明显。

我来举个例子,进一步解释下索引的作用。这里要用到销售流水表(demo.trans),表结构如下:

mysql> describe demo.trans;
+---------------+----------+------+-----+---------+-------+
| Field         | Type     | Null | Key | Default | Extra |
+---------------+----------+------+-----+---------+-------+
| itemnumber    | int      | YES  | MUL | NULL    |       |
| quantity      | text     | YES  |     | NULL    |       |
| price         | text     | YES  |     | NULL    |       |
| transdate     | datetime | YES  | MUL | NULL    |       |
| actualvalue   | text     | YES  |     | NULL    |       |
| barcode       | text     | YES  |     | NULL    |       |
| cashiernumber | int      | YES  | MUL | NULL    |       |
| branchnumber  | int      | YES  | MUL | NULL    |       |
| transuniqueid | text     | YES  |     | NULL    |       |
+---------------+----------+------+-----+---------+-------+
9 rows in set (0.02 sec)

某个门店的销售流水表有400万条数据,现在我要查看一下商品编号是100的商品在2020-12-12这一天的销售情况,查询代码如下:

mysql> SELECT
-> quantity,price,transdate
-> FROM
-> demo.trans
-> WHERE
-> transdate > '2020-12-12'
-> AND transdate < '2020-12-13'
-> AND itemnumber = 100;
+----------+--------+---------------------+
| quantity | price | transdate |
+----------+--------+---------------------+
| 1.000 | 220.00 | 2020-12-12 19:45:36 |
| 1.000 | 220.00 | 2020-12-12 08:56:37 |
+----------+--------+---------------------+
2 rows in set (8.08 sec)

可以看到,结果总共有2条记录,可是却花了8秒钟,非常慢。同时,这里我没有做表的关联,这只是单表的查询,而且只是一个门店几个月的数据而已。而总部是把所有门店的数据都汇总到一起,查询速度更慢,这样的查询效率,我们肯定是不能接受的。

怎么解决这个问题呢?这时,我们就可以给数据表添加索引。

单字段索引

MySQL支持单字段索引和组合索引,而单字段索引比较常用,我们先来学习下创建单字段索引的方法。

如何创建单字段索引?

创建单字段索引,一般有3种方式:

  1. 你可以通过CREATE语句直接给已经存在的表创建索引,这种方式比较简单,我就不多解释了;
  2. 可以在创建表的同时创建索引;
  3. 可以通过修改表来创建索引。

直接给数据表创建索引的语法如下:

CREATE INDEX 索引名 ON TABLE 表名 (字段);

创建表的同时创建索引的语法如下所示:

CREATE TABLE 表名
(
字段 数据类型,
….
{ INDEX | KEY } 索引名(字段)
)

修改表时创建索引的语法如下所示:

ALTER TABLE 表名 ADD { INDEX | KEY } 索引名 (字段);

这里有个小问题要提醒你一下,给表设定主键约束或者唯一性约束的时候,MySQL会自动创建主键索引或唯一性索引。这也是我建议你在创建表的时候,一定要定义主键的原因之一。

举个小例子,我们可以给表demo.trans创建索引如下:

mysql> CREATE INDEX index_trans ON demo.trans (transdate(10));
Query OK, 0 rows affected (1 min 8.71 sec)
Records: 0 Duplicates: 0 Warnings: 0
 
mysql> SELECT
-> quantity,price,transdate
-> FROM
-> demo.trans
-> WHERE
-> transdate > '2020-12-12'
-> AND transdate < '2020-12-13'
-> AND itemnumber = 100;
+----------+--------+---------------------+
| quantity | price | transdate |
+----------+--------+---------------------+
| 1.000 | 220.00 | 2020-12-12 19:45:36 |
| 1.000 | 220.00 | 2020-12-12 08:56:37 |
+----------+--------+---------------------+
2 rows in set (0.30 sec)

可以看到,加了索引之后,这一次我们只用了0.3秒,比没有索引的时候,快了20多倍。这么大的差距,说明索引对提高查询的速度确实很有帮助。那么,索引是如何做到这一点的呢?下面我们来学习下单字段索引的作用原理。

单字段索引的作用原理

要知道索引是怎么起作用的,我们需要借助MySQL中的EXPLAIN 这个关键字。

EXPLAIN关键字能够查看SQL语句的执行细节,包括表的加载顺序,表是如何连接的,以及索引使用情况等。

mysql> EXPLAIN SELECT
-> quantity,price,transdate
-> FROM
-> demo.trans
-> WHERE
-> transdate > '2020-12-12'
-> AND transdate < '2020-12-13'
-> AND itemnumber = 100;
+----+-------------+-------------+------------+-------+-------------------+-------------------+---------+------+------+----------+-----------------------------------------------+
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
+----+-------------+-------------+------------+-------+-------------------+-------------------+---------+------+------+----------+-----------------------------------------------+
| 1 | SIMPLE | trans | NULL | range | index_trans | index_trans | 6 | NULL | 5411 | 10.00 | Using index condition; Using where; Using MRR |
+----+-------------+-------------+------------+-------+-------------------+-------------------+---------+------+------+----------+-----------------------------------------------+
1 row in set, 1 warning (0.00 sec)

我来解释下代码里的关键内容。

  • type=range:表示使用索引查询特定范围的数据记录。
  • rows=5411:表示需要读取的记录数。
  • possible_keys=index_trans:表示可以选择的索引是index_trans。
  • key=index_trans:表示实际选择的索引是index_trans。
  • extra=Using index condition;Using where;Using MRR:这里面的信息对SQL语句的执行细节做了进一步的解释,包含了3层含义:第一个是执行时使用了索引,第二个是执行时通过WHERE条件进行了筛选,第三个是使用了顺序磁盘读取的策略。

通过这个小例子,我们可以发现,有了索引之后,MySQL在执行SQL语句的时候多了一种优化的手段。也就是说,在查询的时候,可以先通过查询索引快速定位,然后再找到对应的数据进行读取,这样就大大提高了查询的速度。

如何选择索引字段?

在刚刚的查询中,我们是选择transdate(交易时间)字段来当索引字段,你可能会问,为啥不选别的字段呢?这是因为,交易时间是查询条件。MySQL可以按照交易时间的限定“2020年12月12日”,在索引中而不是数据表中寻找满足条件的索引记录,再通过索引记录中的指针来定位数据表中的数据。这样,索引就能发挥作用了。

不过,你有没有想过,itemnumber字段也是查询条件,能不能用itemnumber来创建一个索引呢?我们来试一试:

mysql> CREATE INDEX index_trans_itemnumber ON demo.trans (itemnumber);
Query OK, 0 rows affected (43.88 sec)
Records: 0 Duplicates: 0 Warnings: 0

然后看看效果:

mysql> SELECT
-> quantity,price,transdate
-> FROM
-> demo.trans
-> WHERE
-> transdate > '2020-12-12'      -- 对交易时间的筛选,可以在transdate的索引中定位
-> AND transdate < '2020-12-13'
-> AND itemnumber = 100;         -- 对商品编号的筛选,可以在itemnumber的索引中定位
+----------+--------+---------------------+
| quantity | price | transdate |
+----------+--------+---------------------+
| 1.000 | 220.00 | 2020-12-12 19:45:36 |
| 1.000 | 220.00 | 2020-12-12 08:56:37 |
+----------+--------+---------------------+
2 rows in set (0.38 sec)

我们发现,用itemnumber创建索引之后,查询速度跟之前差不多,基本在同一个数量级。

这是为啥呢?我们来看看MySQL的运行计划:

mysql> EXPLAIN SELECT
-> quantity,price,transdate
-> FROM
-> demo.trans
-> WHERE
-> transdate > '2020-12-12'
-> AND transdate < '2020-12-13'
-> AND itemnumber = 100;                 -- 对itemnumber 进行限定
+----+-------------+-------------+------------+------+------------------------------------------------+------------------------------+---------+-------+------+----------+-------------+
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
+----+-------------+-------------+------------+------+------------------------------------------------+------------------------------+---------+-------+------+----------+-------------+
| 1 | SIMPLE | trans | NULL | ref | index_trans,index_trans_itemnumber | index_trans_itemnumber | 5 | const | 1192 | 0.14 | Using where |
+----+-------------+-------------+------------+------+------------------------------------------------+------------------------------+---------+-------+------+----------+-------------+
1 row in set, 1 warning (0.01 sec)

我们发现,“possible_keys= index_trans,index_trans_itemnumber ”,就是说MySQL认为可以选择的索引确实有2个,一个是用transdate字段创建的索引index_trans,另一个是用itemnumber字段创建的索引index_trans_itemnumber。

key= index_trans_itemnumber, 说明MySQL实际选择使用的索引是itemnumber字段创建的索引index_trans_itemnumber。而rows=1192,就表示实际读取的数据记录数只有1192个,比用transdate创建的索引index_trans的实际读取记录数要少,这就是MySQL选择使用itemnumber索引的原因。

所以,我建议你在选择索引字段的时候,要选择那些经常被用做筛选条件的字段。这样才能发挥索引的作用,提升检索的效率。

组合索引

在实际工作中,有时会遇到比较复杂的数据表,这种表包括的字段比较多,经常需要通过不同的字段筛选数据,特别是数据表中包含多个层级信息。比如我们的销售流水表就包含了门店信息、收款机信息和商品信息这3个层级信息。门店对应多个门店里的收款机,每个收款机对应多个从这台收款机销售出去的商品。我们经常要把这些层次信息作为筛选条件,来进行查询。这个时候单字段的索引往往不容易发挥出索引的最大功效,可以使用组合索引。

现在,先看看单字段索引的效果,我们分别用branchnumber和cashiernumber来创建索引:

mysql> CREATE INDEX index_trans_branchnumber ON demo.trans (branchnumber);
Query OK, 0 rows affected (41.49 sec)
Records: 0 Duplicates: 0 Warnings: 0

 mysql> CREATE INDEX index_trans_cashiernumber ON demo.trans (cashiernumber);
Query OK, 0 rows affected (41.95 sec)
Records: 0 Duplicates: 0 Warnings: 0

有了门店编号和收款机编号的索引,现在我们就尝试一下以门店编号、收款机编号和商品编号为查询条件,来验证一下索引是不是起了作用。

mysql> SELECT
-> itemnumber,quantity,price,transdate
-> FROM
-> demo.trans
-> WHERE
-> branchnumber = 11 AND cashiernumber = 1 -- 门店编号和收款机号为筛选条件
-> AND itemnumber = 100;    -- 商品编号为筛选条件
+------------+----------+--------+---------------------+
| itemnumber | quantity | price | transdate |
+------------+----------+--------+---------------------+
| 100 | 1.000 | 220.00 | 2020-07-11 09:18:35 |
| 100 | 1.000 | 220.00 | 2020-09-06 21:21:58 |
| 100 | 1.000 | 220.00 | 2020-11-10 15:00:11 |
| 100 | 1.000 | 220.00 | 2020-12-25 14:28:06 |
| 100 | 1.000 | 220.00 | 2021-01-09 20:21:44 |
| 100 | 1.000 | 220.00 | 2021-02-08 10:45:05 |
+------------+----------+--------+---------------------+
6 rows in set (0.31 sec)

结果有6条记录,查询时间是0.31秒,跟只创建商品编号索引差不多。下面我们就来查看一下执行计划,看看新建的索引有没有起作用。

mysql> EXPLAIN SELECT
-> itemnumber,quantity,price,transdate
-> FROM
-> demo.trans
-> WHERE
-> branchnumber = 11 AND cashiernumber = 1
-> AND itemnumber = 100;
+----+-------------+-------+------------+------+---------------------------------------------------------------------------+------------------------+---------+-------+------+----------+-------------+
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
+----+-------------+-------+------------+------+---------------------------------------------------------------------------+------------------------+---------+-------+------+----------+-------------+
| 1 | SIMPLE | trans | NULL | ref | index_trans_itemnumber,index_trans_branchnumber,index_trans_cashiernumber | index_trans_itemnumber | 5 | const | 1192 | 20.50 | Using where |
+----+-------------+-------+------------+------+---------------------------------------------------------------------------+------------------------+---------+-------+------+----------+-------------+
1 row in set, 1 warning (0.01 sec)

MySQL有3个索引可以用,分别是用branchnumber创建的index_trans_branchnumber、用cashiernumber创建的index_trans_cashiernumber和用itemnumber创建的index_trans_itemnumber。

最后,MySQL还是选择了index_trans_itemnumber,实际筛选的记录数是1192,花费了0.31秒。

为什么MySQL会这样选呢?这是因为,优化器现在有3种索引可以用,分别是商品编号索引、门店编号索引和收款机号索引。优化器发现,商品编号索引实际搜索的记录数最少,所以最后就选择了这种索引。

所以,如果有多个索引,而这些索引的字段同时作为筛选字段出现在查询中的时候,MySQL会选择使用最优的索引来执行查询操作

能不能让这几个筛选字段同时发挥作用呢?这就用到组合索引了。组合索引,就是包含多个字段的索引。MySQL最多支持由16个字段组成的组合索引。

如何创建组合索引?

创建组合索引的语法结构与创建单字段索引相同,不同的是相比单字段索引,组合索引使用了多个字段。

直接给数据表创建索引的语法如下:

CREATE INDEX 索引名 ON TABLE 表名 (字段1,字段2,...);

创建表的同时创建索引:

CREATE TABLE 表名
(
字段 数据类型,
….
{ INDEX | KEY } 索引名(字段1,字段2,...)
)

修改表时创建索引:

ALTER TABLE 表名 ADD { INDEX | KEY } 索引名 (字段1,字段2,...);

现在,针对刚刚的查询场景,我们就可以通过创建组合索引,发挥多个字段的筛选作用。

具体做法是,我们给销售流水表创建一个由3个字段branchnumber、cashiernumber、itemnumber组成的组合索引,如下所示:

mysql> CREATE INDEX Index_branchnumber_cashiernumber_itemnumber ON demo.trans (branchnumber,cashiernumber,itemnumber);
Query OK, 0 rows affected (59.26 sec)
Records: 0 Duplicates: 0 Warnings: 0

有了组合索引,刚刚的查询速度就更快了:

mysql> SELECT
-> itemnumber,quantity,price,transdate
-> FROM
-> demo.trans
-> WHERE
-> branchnumber = 11 AND cashiernumber = 1
-> AND itemnumber = 100;
+------------+----------+--------+---------------------+
| itemnumber | quantity | price | transdate |
+------------+----------+--------+---------------------+
| 100 | 1.000 | 220.00 | 2020-07-11 09:18:35 |
| 100 | 1.000 | 220.00 | 2020-09-06 21:21:58 |
| 100 | 1.000 | 220.00 | 2020-11-10 15:00:11 |
| 100 | 1.000 | 220.00 | 2020-12-25 14:28:06 |
| 100 | 1.000 | 220.00 | 2021-01-09 20:21:44 |
| 100 | 1.000 | 220.00 | 2021-02-08 10:45:05 |
+------------+----------+--------+---------------------+
6 rows in set (0.00 sec)

几乎是瞬间就完成了,不超过10毫秒。我们看看MySQL的执行计划:

mysql> EXPLAIN SELECT
-> itemnumber,quantity,price,transdate
-> FROM
-> demo.trans
-> WHERE                         -- 同时筛选门店编号、收款机号和商品编号
-> branchnumber = 11 AND cashiernumber = 1 
-> AND itemnumber = 100;
+----+-------------+-------+------------+------+-----------------------------------------------------------------------------------------------------------------------+---------------------------------------------+---------+-------------------+------+----------+-------+
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
+----+-------------+-------+------------+------+-----------------------------------------------------------------------------------------------------------------------+---------------------------------------------+---------+-------------------+------+----------+-------+
| 1 | SIMPLE | trans | NULL | ref | index_trans_itemnumber,index_trans_branchnumber,index_trans_cashiernumber,index_branchnumber_cashiernumber_itemnumber | index_branchnumber_cashiernumber_itemnumber | 15 | const,const,const | 6 | 100.00 | NULL |
+----+-------------+-------+------------+------+-----------------------------------------------------------------------------------------------------------------------+---------------------------------------------+---------+-------------------+------+----------+-------+
1 row in set, 1 warning (0.01 sec)

这个查询,MySQL可以用到的索引有4个:

  • index_trans_itemnumber;
  • index_trans_branchnumber;
  • index_trans_cashiernumber;
  • 我们刚才用branchnumber、cashiernumber和itemnumber创建的组合索引Index_branchnumber_cashiernumber_itemnumber。

MySQL选择了组合索引,筛选后读取的记录只有6条。组合索引被充分利用,筛选更加精准,所以非常快。

组合索引的原理

下面我就来讲讲组合索引的工作原理。

组合索引的多个字段是有序的,遵循左对齐的原则。比如我们创建的组合索引,排序的方式是branchnumber、cashiernumber和itemnumber。因此,筛选的条件也要遵循从左向右的原则,如果中断,那么,断点后面的条件就没有办法利用索引了。

比如说我们刚才的条件,branchnumber = 11 AND cashiernumber = 1 AND itemnumber = 100,包含了从左到右的所有字段,所以可以最大限度使用全部组合索引。

假如把条件换成“cashiernumber = 1 AND itemnumber = 100”,由于我们的组合索引是按照branchnumber、cashiernumber和itemnumber的顺序建立的,最左边的字段branchnumber没有包含到条件当中,中断了,所以这个条件完全不能使用组合索引。

类似的,如果筛选的是一个范围,如果没有办法无法精确定位,也相当于中断。比如“branchnumber > 10 AND cashiernumber = 1 AND itemnumber = 100”这个条件,只能用到组合索引中branchnumber>10的部分,后面的索引就都用不上了。我们来看看MySQL的运行计划:

mysql> EXPLAIN SELECT
-> itemnumber,quantity,price,transdate
-> FROM
-> demo.trans
-> WHERE
-> branchnumber > 10 AND cashiernumber = 1 AND itemnumber = 100;
+----+-------------+-------+------------+------+-----------------------------------------------------------------------------------------------------------------------+------------------------+---------+-------+------+----------+-------------+
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
+----+-------------+-------+------------+------+-----------------------------------------------------------------------------------------------------------------------+------------------------+---------+-------+------+----------+-------------+
| 1 | SIMPLE | trans | NULL | ref | index_trans_itemnumber,index_trans_branchnumber,index_trans_cashiernumber,index_branchnumber_cashiernumber_itemnumber | index_trans_itemnumber | 5 | const | 1192 | 20.50 | Using where |
+----+-------------+-------+------------+------+-----------------------------------------------------------------------------------------------------------------------+------------------------+---------+-------+------+----------+-------------+
1 row in set, 1 warning (0.02 sec)

果然,MySQL没有选择组合索引,而是选择了用itemnumber创建的普通索引index_trans_itemnumber。因为如果只用组合索引的一部分,效果没有单字段索引那么好

总结

这节课,我们学习了什么是索引、如何创建和使用索引。索引可以非常显著地提高数据查询的速度,数据表里包含的数据越多,效果越显著。我们应该选择经常被用做筛选条件的字段来创建索引,这样才能通过索引缩小实际读取数据表中数据的范围,发挥出索引的优势。如果有多个筛选的字段,而且经常一起出现,也可以用多个字段来创建组合索引。

如果你要删除索引,就可以用:

DROP INDEX 索引名 ON 表名;

当然, 有的索引不能用这种方法删除,比如主键索引,你就必须通过修改表来删除索引。语法如下:

ALTER TABLE 表名 DROP PRIMARY KEY;

最后,我来跟你说说索引的成本。索引能够提升查询的效率,但是建索引也是有成本的,主要有2个方面,一个存储空间的开销,还有一个是数据操作上的开销。

  • 存储空间的开销,是指索引需要单独占用存储空间。
  • 数据操作上的开销,是指一旦数据表有变动,无论是插入一条新数据,还是删除一条旧的数据,甚至是修改数据,如果涉及索引字段,都需要对索引本身进行修改,以确保索引能够指向正确的记录。

因此,索引也不是越多越好,创建索引有存储开销和操作开销,需要综合考虑。

思考题

假如我有一个单品销售统计表,包括门店编号、销售日期(年月日)、商品编号、销售数量、销售金额、成本、毛利,而用户经常需要对销售情况进行查询,你会对这个表建什么样的索引呢?为什么?

欢迎在留言区写下你的思考和答案,我们一起交流讨论。如果你觉得今天的内容对你有所帮助,也欢迎你分享给你的朋友或同事,我们下节课见。

精选留言

  • 朱晓峰

    2021-04-21 15:06:48

    你好,我是朱晓峰,下面我就来公布一下上节课思考题的答案:

    上节课,我们学习了数学函数、字符串函数和条件判断函数。下面是思考题的答案:

    计算会员积分,我们可以假设actualvalue>=0,这样的话就可以使用求余函数MOD来代替FLOOR:

    FLOOR(acutalvalue)替换成actualvalue - MOD(actualvalue,1)
  • giteebravo

    2021-04-01 08:32:55


    CREATE INDEX index_trans ON demo.trans (transdate(10));

    ——括号里面的 10 有什么具体含义吗?
    作者回复

    这里的10,表示用日期时间的前10位数据创建索引

    2021-05-20 14:57:25

  • 阿文

    2021-04-01 09:04:53

    我会选择(商品编号,[门店编号],销售日期)的联合索引,主要依据是商品编号一般是等值查询且区分度较高,门店编号这个字段我觉得可以看具体查询场景选择,销售日期一般是范围,放在末位直接扫链表效果较好,请老师指正,谢谢!
    作者回复

    建议还是先创建单字段索引,使用率比较高,如果创建联合索引,可以考虑把门店编号放在最前面,原因是一般查询会遵循从大范围到小范围逐步递进的原则

    2021-05-20 15:04:13

  • lesserror

    2021-04-01 22:22:07

    总结一下这一讲的收获吧。

    MySQL 最多支持由 16 个字段组成的组合索引。

    组合索引的所有组成字段都被查询条件用到,且符合最左匹配原则,查询效率有可能会比单字段索引快!

    关于索引这块的知识,建议去了解一下B+树的相关概念,会更容易理解索引的内部运行机制。比单纯背结论更加有效,并且会根深蒂固!

    作者回复

    说得好

    2021-05-20 16:10:25

  • giteebravo

    2021-04-01 08:26:55


    在为字段 itemnumber 创建索引 index_trans_itemnumber 后,实际读取的记录数下降了 80% (与使用索引 index_trans 相比),但为什么查询速度反而下降了 0.08 秒呢?
    作者回复

    你是不是说课上的例子,使用index_trans索引比使用index_trans_itemnumber要更快呢?课上的例子中,优化器除了使用索引之外,使用index_trans索引的时候,还使用了MRR(顺序磁盘读取策略),这样综合的效果比单纯使用index_trans_itemnumber更快一些。

    2021-05-20 14:45:11

  • 青石雨巷

    2021-12-01 10:56:55


    CREATE INDEX 索引名 ON TABLE 表名 (字段);

    这里TABLE字段要删掉,容易让别人产生误解
    作者回复

    说得很对,这里“TABLE”不是关键字,容易产生误解,不够严谨,我已经请后台去掉“TABLE”,感谢你的指正。

    2022-01-16 12:01:07

  • 彭彬

    2021-09-22 08:24:39

    CREATE INDEX index_trans ON demo.trans (transdate(10));
    执行上述语句出错,提示transdate不是字符串
    作者回复

    这个地方确实错了,应该是“CREATE INDEX index_trans ON demo.trans (transdate); ”,索引应该使用字段名。我已经请后台进行改正,非常感谢你指出我的错误。

    2022-01-16 11:21:11

  • 重洋

    2021-08-02 09:08:12

    对字段a、b、c建立组合索引,选择a、b为查询条件时,此时组合索引的效果相当于只对a、b建立组合索引吗?
    作者回复

    是的,这里要注意的是组合索引与字段的顺序有关。

    2021-09-06 10:28:44

  • Damon

    2025-03-24 22:23:26

    组合索引
    索引 1:(门店编号, 销售日期)
    原因:用户可能经常按门店和时间范围来查询销售情况,例如查看某个门店在特定月份或季度的销售数据。该索引可以先根据门店编号快速定位到相关门店的数据,然后在该门店的数据子集内再根据销售日期进行筛选,能显著提高这类查询的效率。
    索引 2:(商品编号, 销售日期)
    原因:便于按商品和时间来分析销售趋势,比如了解某款商品在不同时间段的销售表现。先通过商品编号定位到该商品的所有销售记录,再依据销售日期进行进一步的查询和统计,能加快查询速度。
    索引 3:(门店编号, 商品编号, 销售日期)
    原因:如果用户需要查询某个门店特定商品在不同时间的销售情况,这个索引可以直接定位到具体的记录,无需全表扫描。它将三个常用的查询条件组合在一起,能够高效地满足这类多条件查询的需求。
    单个字段索引
    索引 4:(销售日期)
    原因:当用户仅对销售日期进行查询,如统计某一天或某一时间段内所有门店、所有商品的销售汇总情况时,该索引可以快速定位到相应日期的记录,提高查询效率。
    索引 5:(商品编号)
    原因:若用户想要了解某一商品在所有门店的销售情况,通过该索引可以迅速定位到该商品的所有销售记录,方便进行汇总和分析。
  • SharpBB

    2022-02-10 10:57:08

    单字段索引
    create index 索引名 on table 表名(字段);
    注意
    创建主键约束/唯一约束 会自动创建主键索引 唯一性索引
    经常被筛选的字段当索引
    组合索引
    create index 索引名 on table 表名(字段1,字段2);
    删除索引
    DROP INDEX 索引名 ON 表名;
    如果是主键 不能直接删除 得先去掉主键
    ALTER TABLE 表名 DROP PRIMARY KEY;
    作者回复

    好的

    2022-03-12 16:56:15

  • 木木

    2021-11-07 14:32:52

    老师你好,咱课程中提到的数据有提供吗?

    方便跟着操作练习
    作者回复

    课程中用到的数据都是实际项目中的数据,是无法提供的。

    2021-11-11 15:51:29

  • 彭彬

    2021-09-22 09:04:04

    老师:如果创建索引的顺序是 A,B,C; 而查询的where子句中是 C,B,A的顺序,那是不是索引就失效了
    作者回复

    可以用到A部分索引

    2021-11-11 17:15:17

  • SevenMonths

    2021-09-01 19:18:34

    这里留个坑。以后回来补上 explain 慢查询的思维导图。
    作者回复

    可以参考MySQL的官方文档,获取所需的细节。

    2021-09-28 11:06:11

  • 大聖

    2021-06-21 13:21:39

    文中还有一个部分不理解 - “比如“branchnumber > 10 AND cashiernumber = 1 AND itemnumber = 100”这个条件,只能用到组合索引中 branchnumber>10 的部分,后面的索引就都用不上了” 为什么组合索引中用到branchnumber>10以后就中断了,cashiernumber和itemnumber不是也是组合索引的一部分么?
    作者回复

    组合索引(branchnumber,casheirnumber,itemnumber),遵循左对齐的原则,现在branchnumber>10,那么就意味着第一个字段给出的是一个区间,MySQL无法对后面的字段进行定位,也就没有办法用到后面字段的索引了。

    2021-08-02 09:53:14

  • 大聖

    2021-06-21 13:20:04

    我测试的时候,我的trans表里数据很少,只有不到10条,我发现一个现象:如果transdate是text类型,那么根据transdate > '2018-01-01'的时候,用explain查看发现索引没有起作用,但是如果换成datetime类型,索引就起作用,这个是为什么呢?
    作者回复

    由于TEXT类型是不定长的,不能创建索引,是不是搞错了,用的其他类型?

    2021-08-02 09:38:13

  • ly

    2021-04-17 14:24:06

    老师您好,我理解的联合索引的创建将等值查询字段放前面,范围查询放后面,这样理解对吗,那如果都是等值查询,怎么样确定字段先后顺序能使索引最优
    作者回复

    第一,组合索引遵循左对齐的原则,所以,应该按照字段在查询条件中使用的频度高低,从左到右顺序创建组合索引。
    第二,组合索引中,遇到范围查询的字段,意味着后面的字段就不起作用了,所以等值查询字段尽量放在前面是正确的

    2021-05-21 09:15:20

  • giteebravo

    2021-04-01 23:56:24


    小结部分总结得太好了,从索引的好处、使用方法,到如何选择索引字段,以及索引的使用成本,都覆盖到了。
    作者回复

    谢谢鼓励

    2021-05-20 16:10:39

  • 右耳朵猫咪

    2021-04-01 08:07:30

    如果执行计划的key是多个单字段索引,它和一个单字段索引有什么区别呢?
    作者回复

    执行计划的key是指MySQL优化器决定使用的索引,不会是多个索引的,possible_key是可以使用的所有索引,MySQL优化器会从中选择一个使用

    2021-05-20 14:37:40