初识 redo log 和 binlog

InnoDB
存储引擎是 以页为单位
来管理存储空间的, 我们的增删改查操作本质上都是在访问 页面
, 如读取一条数据, 会把这个数据 所在的页
加载到内存中, 而不仅仅是这条数据本身, 这个页的默认大小是 16KB
.

在事务中, 我们有一个特性: 持久性
, 指对于一个已提交的事务, 在事务提交后, 即使系统崩溃, 也要保证这个事务对数据库做的更改不会丢失, 那么我们如何保证这一点呢, 有一个简单粗暴的做法就是: 在事务提交之前, 将事务所修改的所有页面都刷新到磁盘
, 但这种做法有几个问题:

InnoDB

那么如何解决这个问题呢, InnoDB
采用了 redo log
机制来解决:

redo log
Innodb
存储引擎的特性, 即在更新数据时, 先将更新操作的结果放到 redo log
中, 他存储的是 物理日志
, 如 将第 0 号表空间的 100 号页面的偏移量为 1000 处的值更新为 2。
, 然后过一段时间或待系统空闲时, 一起将多个更新操作在硬盘的数据文件上执行.
不过这个文件是有大小限制的, 当这个文件满的时候, 会删除最先写入的数据.

你可能会问, 写到 redo log
不也是写入到磁盘吗, 这效率会更好吗, 是不是多此一举啊. 其实不是的, 首先每次写入 redo log
的数据是非常小的, 他只记录了这次修改的物理操作. 相较于之前要刷新 1 个或多个 16KB 的页面来说操作的数据量小多了, 而且写 redo log
是顺序 IO, 这整体会快很多.

binlog

binlog
MySQL
的功能, 所有存储引擎都可以使用. 记录的是 逻辑日志
, 如 给 ID = 2 的数据行的 C 字段加 1
. 他是追加写入的, 当写到一定大小后, 会切换到写一个文件继续写, 不会覆盖原来的文件. 一般用来做数据库的备份和恢复使用.

两阶段提交

不过既然有两个日志, 那么如何保证不会出现写完 read log
, 但还没写 binlog
的时候就宕机了呢, 为了解决这个问题, MySQL
采用了两阶段提交的方式:

  1. 先写入 redo log
    状态为 prepare
    阶段. (存储引擎层 InnoDB)
  2. binlog
    (MySQL 服务层)
  3. 提交事务, redo log
    状态改为 commit
    状态. (存储引擎层 InnoDB)

当系统出现异常宕机时:

  • binlog 有记录,redo log 状态 commit: 正常完成的事务,不需要恢复
  • binlog 有记录,redo log 状态 prepare: 在 binlog 写完提交事务之前的 crash, 恢复操作:提交事务
  • binlog 无记录,redo log 状态 prepare: 在 binlog写完之前的 crash, 恢复操作:回滚事务
  • binlog 无记录,redo log 无记录: 在 redo log 写之前 crash, 恢复操作:回滚事务

相关配置

innodb_flush_log_at_trx_commit
参数设置为 1, 表示每次事务的 redo log
都直接持久化到磁盘, 推荐设置为 1, 这样可以保证 MySQL 异常重启后 数据不会丢失
.

sync_binlog
参数设置为 1, 表示每次事务的 binlog
都持久化到磁盘, 推荐设置为 1, 这样可以保证 MySQL
异常重启后 binlog 不会丢失
.

总结

redo log
InnoDB
引擎的特性, 只对使用 InnoDB
引擎的表生效, 记录的是 物理日志
, 有大小限制
, 他的主要目的 是为了保证事务的一致性和提升更新操作的效率
.

binlog
是 MySQL 的功能, 所有存储引擎都可以使用, 记录的是 逻辑日志
, 没有大小限制
, 他的主要目的是 用于备份和恢复数据使用
.