参考指南:MySQL & MariaDB Online DDL
时间:2020-10-27 17:41
在早期的 MySQL 版本中,DDL 操作(如创建索引等)通常都需要对数据表加锁,操作过程中 DML 操作都会被阻塞,影响正常业务。MySQL 5.6 和 MariaDB 10.0 开始支持 Online DDL,可以在执行 DDL 操作的同时,不影响 DML 的正常执行,线上直接执行 DDL 操作对用户基本无感知(部分操作对性能有影响)。 不同版本的数据库对各种 DDL 语句的支持存在一定的差异,本文将会针对 MySQL 和 MariaDB 对 Online DDL 的支持情况做一个汇总,在需要执行 DDL 操作时,可以参考本文的 Online DDL 支持情况 部分。 本文将会持续修正和更新,最新内容请参考我的 GITHUB 上的 程序猿成长计划 项目,欢迎 Star,更多精彩内容请 follow me。 在 算法使用规则: MySQL 服务主要为 Server 层 和 存储引擎层 两部分组成,Server 层包含了 MySQL 大部分核心功能,所有的内置函数,跨存储引擎的功能如存储过程、触发器、视图等。存储引擎层负责数据的存储和读取,采用了插件式的架构模式。 COPY 算法 作用在 Server 层,其执行过程都是在 Server 层,因此所有存储引擎都支持使用该算法,执行过程如下图 INPLACE 算法 作用于存储引擎层,是 InnoDB 存储引擎特有的 DDL 算法,执行过程如下图所示 默认情况下,MySQL/MariaDB 在执行 DDL 期间会使用尽可能少的锁,如果必要,可以通过 LOCK 子句控制在执行 DDL 时允许对表加锁的级别。如果指定的操作所要求的限制级别不满足(EXCLUSIVE > SHARED > NONE),则语句执行失败并报错。 为了避免执行 DDL 时,由于锁表导致生产服务不可用,在执行表结构变更语句时,可以添加 Online DDL 操作主要分为三个阶段: 阶段 1:初始化 在初始化阶段,服务器会根据存储引擎的能力,操作的语句和用户指定的 阶段 2:执行 这个阶段会 准备 并 执行 DDL 语句,根据 阶段 1 评估的结果来决定是否将元数据锁升级为 排它锁 (X),如果需要升级为排它锁,则只在 DDL 的 准备阶段 短暂的添加排它锁。 阶段 3:提交表定义 在表定义的提交阶段,元数据锁会升级为排它锁来更新表的定义。独占排它锁的持续时间非常短。 元数据锁(MDL,Metadata Lock)主要用于 DDL 和 DML 操作之间的并发访问控制,保护表结构(表定义)的一致,保证读写的正确性。MDL 不需要显式的使用,在访问表时会自动加上。 由于上面三个阶段中对元数据锁的独占, Online DDL 过程必须等待已经持有元数据锁的并发事务提交或者回滚才能继续执行。 注意:当 Online DDL 操作正在等待元数据锁时,该元数据锁会处于挂起状态,后续的所有事务都会被阻塞。在 MariaDB 10.3 之后,可以通过添加 Online DDL 操作的性能取决于是否发生了表的重建。在对大表执行 DDL 操作之前,为了避免影响正常业务操作,最好是先评估一下 DDL 语句的性能再选择如何操作。 比如 修改某一列的默认值(快速,不会影响到表数据) 添加索引(需要花费一些时间,但是 修改列的数据类型(需要花费很长时间,并且重建表) 由于在执行 Online DDL 过程中需要记录并发执行的 DML 操作发生的变更,然后在执行完 DDL 操作之后再应用这些变更,因此使用 Online DDL 操作花费的时间比不使用 Online 模式执行要更长一些。 重点关注是否 重建表 和 支持并发 DML:不需要重建表,支持并发 DML 最佳。 说明: 说明: 说明: ③ 并发 DML:当插入一个自增列时,不支持并发的 DML 操作,添加自增列时,大量的数据会被重新组织,代价高昂 ③ 重建表:添加列时,MySQL 5.7及之前版本需要重建表,MySQL 8.0 当 ③ INSTANT算法:添加列时,使用 ④ 删除列时,大量的数据需要被重新组织,代价高昂,在 MariaDB 10.4 之后,删除列支持 INSTANT 算法 ⑤ 重命名列时,确保只改变列名,不改变数据类型,这样才能支持并发的 DML 操作 ⑥ 扩展 VARCHAR 长度时,INPLACE 是有条件的,必须保证用于标识字符串长度的长度字节不变(这里说的都是字节,不是 VARCHAR 的字符长度,字节占用与采用的字符集有关, 因此,INPLACE 只支持 0-255 个字节之间或者 256 个字节到更大的长度之间的变更。VARCHAR 列长度减小是不支持 INPLACE 的。 ⑦ 自增列值变更是修改的内存中的值,不是数据文件 ⑧ ⑨ 设置列为 ⑩ 修改 ⑫ 在 MariaDB 10.4 之后,列排序支持 INSTANT 算法 ⑬ 在 MariaDB 10.4.3 之后,InnoDB 支持使用 INSTANT 算法增加列的长度,但是也有一些限制,具体参考 Changing the Data Type of a Column 说明: 说明: 本文将会持续修正和更新,更多精彩内容请 follow me。 更多相关免费学习推荐:mysql教程(视频) 以上就是参考指南:MySQL & MariaDB Online DDL的详细内容,更多请关注gxlsystem.com其它相关文章!MySQL教程栏目介绍指导MySQL & MariaDB Online DDL。
概述
ALTER TABLE
语句中,支持通过 ALGORITHM
和 LOCK
语句来实现 Online DDL:ALGORITHM
- 控制 DDL 操作如何执行,使用哪个算法LOCK
- 控制在执行 DDL 时允许对表加锁的级别ALTER TABLE tab ADD COLUMN c varchar(50), ALGORITHM=INPLACE, LOCK=NONE;复制代码
ALGORITHM 支持的算法
ALGORITHM 说明 DEFAULT 默认算法,自动使用可用的最高效的算法 COPY 最原始的方式,所有的存储引擎都支持,不使用 Online DDL,操作时会创建临时表,执行全表拷贝和重建,过程中会写入 Redo Log 和大量的 Undo Log,需要添加读锁,非常低效 INPLACE 尽可能避免表拷贝和重建,更确切的名字应该是 ENGINE
算法,由存储引擎决定如何实现,有些操作是可以立即生效的(比如重命名列,改变列的默认值等),但有些操作依然需要全表或者部分表的拷贝和重建(比如添加删除列、添加主键、改变列为 NULL 等)NOCOPY 该算法是 INPLACE
算法的子集,用于避免聚簇索引(主键索引)的重建造成全表重建,也就说用该算法会禁止任何引起聚簇索引重建的操作INSTANT 用于避免 INPLACE
算法在需要修改数据文件时异常低效的问题,所有涉及到表拷贝和重建的操作都会被禁止NOCOPY
算法支持:MariaDB 10.3.2+,MySQL 不支持该算法。INSTANT
算法支持:MariaDB 10.3.2+,MySQL 8.0.12+。COPY
,则 InnoDB 使用 COPY
算法。COPY
之外的其它算法,则 InnoDB 会按照算法效率,选择最高效的算法,最差的情况下采用用户指定的算法。比如用户指定了 ALOGRITHM = NOCOPY
,则 InnoDB 会从 (NOCOPY, INSTANT) 中选择支持的最高效的算法。LOCK 策略
策略 说明 DEFAULT 使用当前操作支持的粒度最小的锁策略 NONE 不获取任何表锁,允许所有的 DML 操作 SHARED 对表添加共享锁(读锁),只允许只读的 DML 操作 EXCLUSIVE 对表添加排它锁(写锁),不允许任何 DML 操作 LOCK=NONE
子句,如果语句需要获取共享锁或者排它锁,则会直接报错,这样就可以避免意外锁表,造成线上服务不可用了。Online DDL 执行过程
ALGORITHM
和 LOCK
选项来决定允许多大程度的并发。在这个阶段会创建一个 可升级的元数据共享锁(SU)来保护表定义。NO WAIT
或者 WAIT n
来控制等待所得超时时间,超时立即失败。ALTER TABLE tbl_name [WAIT n|NOWAIT] ...CREATE ... INDEX ON tbl_name (index_col_name, ...) [WAIT n|NOWAIT] ...DROP INDEX ... [WAIT n|NOWAIT]DROP TABLE tbl_name [WAIT n|NOWAIT] ...LOCK TABLE ... [WAIT n|NOWAIT]OPTIMIZE TABLE tbl_name [WAIT n|NOWAIT]RENAME TABLE tbl_name [WAIT n|NOWAIT] ...SELECT ... FOR UPDATE [WAIT n|NOWAIT]SELECT ... LOCK IN SHARE MODE [WAIT n|NOWAIT]TRUNCATE TABLE tbl_name [WAIT n|NOWAIT]复制代码
评估 Online DDL 操作的性能
rows affected
是否是 0。如果该值非 0,则意味着需要拷贝表数据,此时对 DDL 的上线需要慎重考虑,周密计划Query OK, 0 rows affected (0.07 sec)复制代码
0 rows affected
说明没有发生表拷贝)Query OK, 0 rows affected (21.42 sec)复制代码
Query OK, 1671168 rows affected (1 min 35.54 sec)复制代码
Online DDL 支持情况
INSTANT
算法支持:MariaDB 10.3.2+,MySQL 8.0.12+。NOCOPY
只支持 MariaDB 10.3.2 以上版本,不支持 MySQL,这里就暂且忽略了。二级索引
操作 INSTANT INPLACE 重建表 并发 DML 只修改元数据 创建或者添加二级索引 ❌ ✅ ❌ ✅ ❌ 删除索引 ❌ ✅ ❌ ✅ ✅ 重命名索引 (⚠️MySQL 5.7+,MariaDB 10.5.2+) ❌ ✅ ❌ ✅ ✅ 添加 FULLTEXT
索引❌ ✅ ① ❌ ① ❌ ❌ 添加 SPATIAL
索引(⚠️MySQL 5.7+,MariaDB 10.2.2+)❌ ✅ ❌ ❌ ❌ 修改索引类型 ✅ ✅ ❌ ✅ ✅ 主键
操作 INSTANT INPLACE 重建表 并发 DML 只修改元数据 添加主键 ❌ ✅ ② ✅ ② ✅ ❌ 删除主键 ❌ ❌ ✅ ❌ ❌ 删除一个主键同时添加一个新的 ❌ ✅ ✅ ✅ ❌ NOT NULL
的 UNIQUE
索引作为主键,或者使用系统生成的 KEYINPLACE
模式比 COPY
模式要高效一些:不会产生 undo log 和 redo log,二级索引是有序的,所以可以按顺序加载,不需要使用变更缓冲区普通列
操作 INSTANT INPLACE 重建表 并发 DML 只修改元数据 列添加 ✅ ③ ✅ ❌ ③ ✅ ③ ❌ 列删除 ❌ ④ ✅ ✅ ✅ ❌ 列重命名 ❌ ✅ ❌ ✅ ⑤ ✅ 改变列的顺序 ❌ ⑫ ✅ ✅ ✅ ❌ 设置默认值 ✅ ✅ ❌ ✅ ✅ 修改数据类型 ❌ ❌ ✅ ❌ ❌ 扩展 VARCHAR
长度(⚠️MySQL 5.7+, MariaDB 10.2.2+)❌ ⑬ ✅ ❌ ⑥ ✅ ✅ 删除列的默认值 ✅ ✅ ❌ ✅ ✅ 改变自增值 ❌ ✅ ❌ ✅ ❌ ⑦ 设置列为 NULL ❌ ✅ ✅ ⑧ ✅ ❌ 设置列为 NOT NULL ❌ ✅ ⑨ ✅ ⑨ ✅ ❌ 修改 ENUM
和 SET
列的定义✅ ✅ ❌ ⑩ ✅ ✅ ALGORITHM=INPLACE
时,需要重建表,ALGORITHM=INSTANT
时不需要重建INSTANT
算法有下面这些限制INSTANT
算法的操作合并为一条 ALTER TABLE
语句ROW_FORMAT=COMPRESSED
的表中FULLTEXT
的表中ALGORITHM=COPY
utf8
字符集下,一个字符占 3 个字节, utf8mb4
则 4 个字节)[NOT] NULL
时,大量的数据被重新组织,代价高昂ENUM
和 SET
类型的列定义时,是否需要表拷贝取决于已有元素的个数和插入成员的位置生成列
操作 INSTANT INPLACE 重建表 并发 DML 只修改元数据 添加 STORED
列❌ ❌ ✅ ❌ ❌ 修改 STORED
列的排序❌ ❌ ✅ ❌ ❌ 删除 STORED
列❌ ✅ ✅ ✅ ❌ 添加 VIRTUAL
列✅ ✅ ❌ ✅ ✅ 修改 VIRTUAL
列的排序✅ ❌ ✅ ❌ ❌ 删除 VIRTUAL
列✅ ✅ ❌ ✅ ✅ 外键
操作 INSTANT INPLACE 重建表 并发 DML 只修改元数据 添加外键约束 ❌ ✅ ⑭ ❌ ✅ ✅ 删除外键约束 ❌ ✅ ❌ ✅ ✅ foreign_key_checks
选项被禁用的时候才支持 INPLACE
算法表
操作 INSTANT INPLACE 重建表 并发 DML 只修改元数据 修改 ROW_FORMAT
❌ ✅ ✅ ✅ ❌ 修改 KEY_BLOCK_SIZE
❌ ✅ ✅ ✅ ❌ 设置持久表统计信息 ❌ ✅ ❌ ✅ ✅ 指定字符集 ❌ ✅ ✅ ⑮ ❌ ❌ 转换字符集 ❌ ❌ ✅ ⑯ ❌ ❌ 优化表 ❌ ✅ ⑰ ✅ ✅ ❌ 使用 FORCE
选项重建表❌ ✅ ⑱ ✅ ✅ ❌ 执行空的重建 ❌ ✅ ⑲ ✅ ✅ ❌ 重命名表 ✅ ✅ ❌ ✅ ✅ FULLTEXT
的字段,则不支持 INPLACE表空间
操作 INSTANT INPLACE 重建表 并发 DML 只修改元数据 重命名常规表空间 ❌ ✅ ❌ ✅ ✅ 启用或者禁用常规表空间加密 ❌ ✅ ❌ ✅ ❌ 启用或者禁用 file-per-table
表空间加密❌ ❌ ✅ ❌ ❌ 限制
TEMPORARY TABLE
上创建索引时会发生表拷贝ON...CASCADE
或者 ON...SET NULL
约束,则 ALERT TABLE
不支持字句 LOCK=NONE
写在最后