侯体宗的博客
  • 首页
  • 人生(杂谈)
  • 技术
  • 关于我
  • 更多分类
    • 文件下载
    • 文字修仙
    • 中国象棋ai
    • 群聊
    • 九宫格抽奖
    • 拼图
    • 消消乐
    • 相册

MySQL普通索引和唯一索引的深入讲解

数据库  /  管理员 发布于 6年前   173

场景

1、维护一个市民系统,有一个字段为身份证号

2、业务代码能保证不会写入两个重复的身份证号(如果业务无法保证,可以依赖数据库的唯一索引来进行约束)

3、常用SQL查询语句:SELECT name FROM CUser WHERE id_card = 'XXX'

4、建立索引

  • 身份证号比较大,不建议设置为主键
  • 从性能角度出发,选择普通索引还是唯一索引?

假设字段k上的值都不重复


查询过程

1、查询语句:SELECT id FROM T WHERE k=5

2、查询过程

  • 通过B+树从树根开始,按层搜索到叶子节点,即上图中右下角的数据页
  • 在数据页内部通过二分法来定位具体的记录

3、针对普通索引

  • 查找满足条件的第一个记录(5,500),然后查找下一个记录,直到找到第一个不满足k=5的记录

4、针对唯一索引

  • 由于索引定义了唯一性,查找到第一个满足条件的记录后,就会停止继续查找

性能差异

1、性能差异:微乎其微

2、InnoDB的数据是按照数据页为单位进行读写的,默认为16KB

3、当需要读取一条记录时,并不是将这个记录本身从磁盘读出来,而是以数据页为单位进行读取的

4、当找到k=5的记录时,它所在的数据页都已经在内存里了

5、对于普通索引而言,只需要多一次指针寻找和多一次计算 C CPU消耗很低

  • 如果k=5这个记录恰好是所在数据页的最后一个记录,那么如果要取下一个记录,就需要读取下一个数据页
  • 概率很低:对于整型字段索引,一个数据页(16KB,compact格式)可以存放大概745个值

change buffer

1、当需要更新一个数据页时,如果数据页在内存中就直接更新

2、如果这个数据页不在内存中,在不影响数据一致性的前提下

  • InnoDB会将这些更新操作缓存在change buffer
  • 不需要从磁盘读入这个数据页(随机读)
  • 在下次查询需要访问这个数据页的时候,将数据页读入内存
    然后执行change buffer中与这个数据页有关的操作(merge)

3、change buffer是可以持久化的数据,在内存中有拷贝,也会被写入到磁盘上

4、将更新操作先记录在channge buffer,减少随机读磁盘,提升语句的执行速度

5、另外数据页读入内存需要占用buffer pool,使用channge buffer能避免占用内存,提高内存利用率

6、change buffer用到是buffer pool里的内存,不能无限增大,控制参数innodb_change_buffer_max_size

# 默认25,最大50mysql> SHOW VARIABLES LIKE '%innodb_change_buffer_max_size%';+-------------------------------+-------+| Variable_name   | Value |+-------------------------------+-------+| innodb_change_buffer_max_size | 25 |+-------------------------------+-------+

merge

1、merge:将change buffer中的操作应用到原数据页

2、merge的执行过程

  • 从磁盘读入数据页到内存(老版本的数据页)
  • 从change buffer里找出这个数据页的change buffer记录(可能多个)
    然后依次执行,得到新版本的数据页
  • 写入redolog,包含内容:数据页的表更+change buffer的变更

3、merge执行完后,内存中的数据页和change buffer所对应的磁盘页都还没修改,属于脏页

  • 通过其他机制,脏页会被刷新到对应的物理磁盘页

4、触发时机

  • 访问这个数据页
  • 系统后台线程定期merge
  • 数据库正常关闭

使用条件

1、对于唯一索引来说,所有的更新操作需要先判断这个操作是否违反唯一性约束

2、唯一索引的更新无法使用change buffer,只有普通索引可以使用change buffer

  • 主键也是无法使用change buffer的
  • 例如要插入(4,400),必须先判断表中是否存在k=4的记录,这个判断的前提是将数据页读入内存
  • 既然数据页已经读入到了内存,直接更新内存中的数据页就好,无需再写change buffer

使用场景

1、一个数据页在merge之前,change buffer记录关于这个数据页的变更越多,收益越大

2、对于写多读少的业务,页面在写完后马上被访问的概率极低,此时change buffer的使用效果最好

  • 例如账单类、日志类的系统

3、如果一个业务的更新模式为:写入之后马上会做查询

  • 虽然更新操作被记录到change buffer,但之后马上查询,又会从磁盘读取数据页,触发merge过程
  • 没有减少随机读,反而增加了维护change buffer的代价

更新过程

插入(4,400)

目标页在内存中

  • 对于唯一索引来说,找到3~5之间的位置,判断没有冲突,插入这个值
  • 对于普通索引来说,找到3~5之间的位置,插入这个值
  • 性能差异:微乎其微

目标页不在内存中

1、对于唯一索引来说,需要将数据页读入内存,判断没有冲突,插入这个值

  • 磁盘随机读,成本很高

对于普通索引来说,将更新操作记录在change buffer即可

  • 减少了磁盘随机读,性能提升明显

索引选择

1、普通索引与唯一索引,在查询性能上并没有太大差异,主要考虑的是更新性能,推荐选择普通索引

2、建议关闭change buffer的场景

  • 如果所有的更新后面,都伴随着对这个记录的查询
  • 控制参数innodb_change_buffering
mysql> SHOW VARIABLES LIKE '%innodb_change_buffering%';+-------------------------+-------+| Variable_name   | Value |+-------------------------+-------+| innodb_change_buffering | all |+-------------------------+-------+# Valid Values (>= 5.5.4)none / inserts / deletes / changes / purges / all# Valid Values (<= 5.5.3)none / inserts# change buffer的前身是insert buffer,只能对insert操作进行优化

change buffer + redolog

更新过程

当前k树的状态:找到对应的位置后,k1所在的数据页Page 1在内存中,k2所在的数据页Page 2不在内存中

INSERT INTO t(id,k) VALUES (id1,k1),(id2,k2);


# 内存:buffer pool# redolog:ib_logfileX# 数据表空间:t.ibd# 系统表空间:ibdata1

1、Page 1在内存中,直接更新内存

2、Page 2不在内存中,在changer buffer中记录:add (id2,k2) to Page 2

3、上述两个动作计入redolog(磁盘顺序写)

4、至此事务完成,执行更新语句的成本很低

  • 写两次内存+一次磁盘

5、由于在事务提交时,会把change buffer的操作记录也记录到redolog

  • 因此可以在崩溃恢复时,恢复change buffer

虚线为后台操作,不影响更新操作的响应时间

读过程

假设:读语句发生在更新语句后不久,内存中的数据都还在,与系统表空间(ibdata1)和redolog(ib_logfileX)无关

SELECT * FROM t WHERE k IN (k1,k2);


1、读Page 1,直接从内存返回(此时Page 1有可能还是脏页,并未真正落盘)

2、读Page 2,通过磁盘随机读将数据页读入内存,然后应用change buffer里面的操作日志(merge)

  • 生成一个正确的版本并返回

提升更新性能

1、redolog:节省随机写磁盘的IO消耗(顺序写)

2、change buffer:节省随机读磁盘的IO消耗

参考资料

《MySQL实战45讲》

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,如果有疑问大家可以留言交流,谢谢大家对的支持。


  • 上一条:
    MySQL limit性能分析与优化
    下一条:
    使用MySQL的geometry类型处理经纬度距离问题的方法
  • 昵称:

    邮箱:

    0条评论 (评论内容有缓存机制,请悉知!)
    最新最热
    • 分类目录
    • 人生(杂谈)
    • 技术
    • linux
    • Java
    • php
    • 框架(架构)
    • 前端
    • ThinkPHP
    • 数据库
    • 微信(小程序)
    • Laravel
    • Redis
    • Docker
    • Go
    • swoole
    • Windows
    • Python
    • 苹果(mac/ios)
    • 相关文章
    • 分库分表的目的、优缺点及具体实现方式介绍(0个评论)
    • DevDB - 在 VS 代码中直接访问数据库(0个评论)
    • 在ubuntu系统中实现mysql数据存储目录迁移流程步骤(0个评论)
    • 在mysql中使用存储过程批量新增测试数据流程步骤(0个评论)
    • php+mysql数据库批量根据条件快速更新、连表更新sql实现(0个评论)
    • 近期文章
    • 在windows10中升级go版本至1.24后LiteIDE的Ctrl+左击无法跳转问题解决方案(0个评论)
    • 智能合约Solidity学习CryptoZombie第四课:僵尸作战系统(0个评论)
    • 智能合约Solidity学习CryptoZombie第三课:组建僵尸军队(高级Solidity理论)(0个评论)
    • 智能合约Solidity学习CryptoZombie第二课:让你的僵尸猎食(0个评论)
    • 智能合约Solidity学习CryptoZombie第一课:生成一只你的僵尸(0个评论)
    • 在go中实现一个常用的先进先出的缓存淘汰算法示例代码(0个评论)
    • 在go+gin中使用"github.com/skip2/go-qrcode"实现url转二维码功能(0个评论)
    • 在go语言中使用api.geonames.org接口实现根据国际邮政编码获取地址信息功能(1个评论)
    • 在go语言中使用github.com/signintech/gopdf实现生成pdf分页文件功能(95个评论)
    • gmail发邮件报错:534 5.7.9 Application-specific password required...解决方案(0个评论)
    • 近期评论
    • 122 在

      学历:一种延缓就业设计,生活需求下的权衡之选中评论 工作几年后,报名考研了,到现在还没认真学习备考,迷茫中。作为一名北漂互联网打工人..
    • 123 在

      Clash for Windows作者删库跑路了,github已404中评论 按理说只要你在国内,所有的流量进出都在监控范围内,不管你怎么隐藏也没用,想搞你分..
    • 原梓番博客 在

      在Laravel框架中使用模型Model分表最简单的方法中评论 好久好久都没看友情链接申请了,今天刚看,已经添加。..
    • 博主 在

      佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 @1111老铁这个不行了,可以看看近期评论的其他文章..
    • 1111 在

      佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 网站不能打开,博主百忙中能否发个APP下载链接,佛跳墙或极光..
    • 2017-06
    • 2017-08
    • 2017-09
    • 2017-10
    • 2017-11
    • 2018-01
    • 2018-05
    • 2018-10
    • 2018-11
    • 2020-02
    • 2020-03
    • 2020-04
    • 2020-05
    • 2020-06
    • 2020-07
    • 2020-08
    • 2020-09
    • 2021-02
    • 2021-04
    • 2021-07
    • 2021-08
    • 2021-11
    • 2021-12
    • 2022-02
    • 2022-03
    • 2022-05
    • 2022-06
    • 2022-07
    • 2022-08
    • 2022-09
    • 2022-10
    • 2022-11
    • 2022-12
    • 2023-01
    • 2023-03
    • 2023-04
    • 2023-05
    • 2023-07
    • 2023-08
    • 2023-10
    • 2023-11
    • 2023-12
    • 2024-01
    • 2024-03
    Top

    Copyright·© 2019 侯体宗版权所有· 粤ICP备20027696号 PHP交流群

    侯体宗的博客