MySQL运行经验

原标题:MySQL运维经验

1. 概要

MySQL运维实践

图片 1


5.1-MySQL日志系统

1. 概要

每台机器都使用多实例的模型。 每个机器放多个实例,每个实例放多个DB。

什么是日志

  • 日志(log)是一种顺序记录事件流水的文件
  • 记录计算机程序运行过程中发生了什么
  • 用途多样
  • 帮助分析程序问题
  • 分析服务请求的特征、流量等
  • 判断工作是否成功执行
  • ……

每台机器都使用多实例的模型。 每个机器放多个实例,每个实例放多个DB。

一些信息可以参考: 

MySQL日志的分类

  • 服务器日志
    • 记录进程启动运行过程中的特殊事件,帮助分析MySQL服务遇到的问题
    • 根据需求抓取特定的SQL语句,追踪性能可能存在的问题的业务SQL
  • 事务日志
    • 记录应用程序对数据的所有更改
    • 可用于数据恢复
    • 可用于实例间数据同步
分类 日志名称
服务器日志 服务错误日志
服务器日志 慢查询日志
服务器日志 综合查询日志
事务日志 存储引擎事务日志
事务日志 二进制日志

多实例之间没有进行资源隔离,这么做是让每个实例都能发挥最大性能。

多实例之间没有进行资源隔离,这么做是让每个实例都能发挥最大性能。

服务错误日志

  • 记录实例启动运行过程中重要消息
  • 配置参数 log_error = /data/mysql_data/node-1/mysql.log
  • 内容并非全是错误消息
  • 如果mysqld进程无法正常启动首先查看错误日志

目前大部分核心业务已切换成MyRocks引擎,在机器硬件配置不变的情况,约可节省一半机器。

目前大部分核心业务已切换成MyRocks引擎,在机器硬件配置不变的情况,约可节省一半机器。

慢查询日志

  • 记录执行时间超过一定阈值的SQL语句
  • 配置参数

slow_query_log = 1
slow_query_log_file = /data/mysql_data/node-1/mysql-slow.log
long_query_time = 5
  • 用于分析系统中可能存在性能问题的SQL

放在MyRocks上的核心业务主要有:Feed、Post、社交图谱等读写混合业务。

放在MyRocks上的核心业务主要有:Feed、Post、社交图谱等读写混合业务。

综合查询日志

  • 如果开启将会记录系统中所有SQL语句
  • 配置参数

general_log = 1
general_log_file = /data/mysql_data/node-1/mysql-slow.log
  • 偶尔用于帮助分析系统问题,对性能有影响

MyRocks项目地址:

MyRocks项目地址:

查询日志的输出与文件切换

  • 日志输出参数

log_output={file|table|none}

  • 如果日志文件过大,可以定期截断并切换新文件

flush log;

另外,MariaDB 10.2版本也即将整合MyRocks引擎。

另外,MariaDB 10.2版本也即将整合MyRocks引擎。

存储引擎事务日志

  • 部分存储引擎拥有重做日志(redo log)
  • 如InnoDB, TokuDB等WAL(Write Ahead Log)机制存储引擎
  • 日志随着事务commit优先持久化,确保异常恢复不丢数据
  • 日志顺序写性能较好

2. 高可用机制

 

InnoDB事务日志重用机制

  • InnoDB事务日志采用两组文件交替重用

采用基于GTID的一主多从结构,外加一个基于lossless
semi-sync机制的mysqlbinlog实现的binlog server(可以理解为MySQL 5.7的loss
zero replication)。

2. 高可用机制

二进制日志binlog

  • binlog (binary log)
  • 记录数据引起数据变化的SQL语句或数据逻辑变化的内容
  • MySQL服务层记录,无关存储引擎
  • binlog的主要作用:
    • 基于备份恢复数据
    • 数据库主从同步
    • 挖掘分析SQL语句

基于多数派实现自动选主。


开启binlog

  • 主要参数

log_bin = c:/tmp/mylog/mysql-bin
sql_log_bin = 1
sync_binlog = 1
  • 查看binlog

show binary logs;

基于配置中心实现切换,未使用VIP。

采用基于GTID的一主多从结构,外加一个基于lossless
semi-sync机制的mysqlbinlog实现的binlog server(可以理解为MySQL 5.7的loss
zero replication)。

binlog管理

  • 主要参数

max_binlog_size = 100MB
expire_logs_days = 7
  • binlog始终生成新文件,不会重用

  • 手工清理binlog

purge binary logs to 'mysql-bin.000009';
purge binary logs before '2016-4-2 21:00:40'

在认为semi-sync复制可保证主从数据一致性的假设前提下,发生故障切换时,利用上述的binlog
server中的日志进行补全后再选新主、切换。

基于多数派实现自动选主。

查看binlog内容

  • 日志

show binlog events in 'mysql-bin.000011';
show binlog events in 'mysql-bin.000011' from 60 limit 3;
  • mysqlbinlog工具

mysqlbinlog c:/tmp/mylog/mysql-bin.000001
--start-datetime | --stop-datetime
--start-position | --stop-position

若个别情况下由于特殊原因,出现从库全部挂掉的情况,会将全部请求切到主库,由它扛起所有的业务服务压力。

基于配置中心实现切换,未使用VIP。

binlog格式

  • 主要参数

binlog_format = {ROW|STATEMENT|MIXED}

  • 查看row模式的binlog内容

mysqlbinlog --base64-output=decode-rows -v c:/tmp/mylpg/mysql-bin.000001

某个从库挂掉时,可以动态摘除。

在认为semi-sync复制可保证主从数据一致性的假设前提下,发生故障切换时,利用上述的binlog
server中的日志进行补全后再选新主、切换。

5.2-MySQL数据备份

3. 备份机制

若个别情况下由于特殊原因,出现从库全部挂掉的情况,会将全部请求切到主库,由它扛起所有的业务服务压力。

基本指数 – 备份用途

  • 数据备灾
    • 应对硬件故障数据丢失
    • 应对人为或程序bug导致数据删除
  • 制作镜像库以供服务
    • 需要将数据迁移、统计分析等用处
    • 需要为线上数据建立一个镜像

所有的备份都是基于mysqldump实现,之所以采用mysqldump逻辑备份好处有:

某个从库挂掉时,可以动态摘除。

基本知识 – 备份内容

  • 数据
    • 数据文件或文本格式数据
  • 操作日志(binlog)
    • 数据库变更日志
  • 无需备份索引,只备份数据;
  • 备份文件压缩比高,更节省磁盘空间;
  • 改进了mysqldump,备份过程中还进行额外压缩;

 

基本知识 – 冷备份与热备份

  • 冷备份
    • 关闭数据库服务,完整拷贝数据文件
  • 热备份
    • 在不影响数据库读写服务的情况下备份数据库

上面提到,因为采用多实例、多DB结构,备份时可以多DB并行备份。当然了,也会控制并行备份的数量,避免影响在线业务性能。

3. 备份机制

基本知识 – 物理备份与逻辑备份

  • 物理备份
    • 以数据页的形式拷贝数据
  • 逻辑备份
    • 导出为裸数据或者SQL(insert)语句

备份放在集中存储(HDFS)上, 据说已达EB级别容量。


基本知识 – 本地备份与远程备份

  • 本地备份
    • 在数据库服务器本地进行备份
  • 远程备份
    • 远程连接数据库进行备份

关于备份的作用定位:

所有的备份都是基于mysqldump实现,之所以采用mysqldump逻辑备份好处有:

基本知识 – 全量备份与增量备份

  • 全量备份
    • 备份完整的数据库
  • 增量备份
    • 只备份上一次备份以来发生修改的数据
  • 供数据分析环境拉数据
  • 供灾难恢复
  • 无需备份索引,只备份数据;

  • 备份文件压缩比高,更节省磁盘空间;

  • 改进了mysqldump,备份过程中还进行额外压缩;

基本知识 – 备份周期

考虑因素:

  • 数据库大小(决定备份时间)
  • 恢复速度要求(快速or慢速)
  • 备份方式(全量or增量)

4. 如何快速部署从库

 

常用工具及用法

  • mysqldump – 逻辑备份,热备
  • xtrabackup – 物理备份, 热备
  • Lvm/zfs snapshot – 物理备份
  • mydumper – 逻辑备份,热备
  • cp – 物理备份,冷备

可使用xtrabackup在现有存活的SLAVE实例上备份,也可在主库上发起备份,再利用WDT(或者是BT)协议传输到异地,用于拉起从库。

上面提到,因为采用多实例、多DB结构,备份时可以多DB并行备份。当然了,也会控制并行备份的数量,避免影响在线业务性能。

常用工具及用法 – mysqldump

MySQL官方自带的命令行工具

主要示例:

  • 演示使用mysqldump备份表、库、实例

# 备份所有数据库
mysqldump -uroot -p123456 --socket=/var/run/mysqld/mysqld.sock --all-databases > /dbbackup/all_db.sql
# 备份指定的数据库
mysqldump -uroot -p123456 --socket=/var/run/mysqld/mysqld.sock --databases db2 > /dbbackup/db2.sql
# 备份单个表
mysqldump -uroot -p123456 --socket=/var/run/mysqld/mysqld.sock db2 t1 >/dbbackup/db2_t1.sql
# 还原表
mysql > source /dbbackup/db2_t1.sql
  • 演示使用mysqldump制作一致性备份

mysqldump --single-transaction -uroot -p123456 --all-databases > /dbbackup/add_db_2.sql
  • 演示使用mysqldump远程备份一个数据库

mysqldump -utest -ptest -h192.168.0.68 -P3306 --all-databases > /dbbackup/remote_bakall.sql
  • 演示使用mysqldump导出数据为csv格式

mysqldump -uroot -p123456 --single-transaction --fields-terminated-by=, db1 -T /tmp

关于WDT项目:

备份放在集中存储(HDFS)上, 据说已达EB级别容量。 

常用工具及用法 – xtrabackup

特点:

  • 开源,在线备份InnoDB表
  • 支持限速备份,避免对业务造成影响
  • 支持流备
  • 支持增量备份
  • 支持备份文件压缩与加密
  • 支持并行备份与恢复,速度快

5. 高度自动化

关于备份的作用定位:

xtrabackup备份原理

  • 基于InnoDB的crash-recovery功能
  • 备份期间允许用户读写,写请求产生redo日志
  • 从磁盘上拷贝数据文件
  • 从InnoDB redo log file实时拷贝走备份期间产生的所有redo日志
  • 恢复的时候 数据文件 + redo日志 = 一致性数据

面对大规模的数据库实例,手工处理完全不现实。目前在facebook主要是利用Python开发内部DB运维平台,所以Python技能方面要求比较高。

  • 供数据分析环境拉数据

  • 供灾难恢复

实用脚本innobackupex

  • 开源Perl脚本,封装调用xtrabackup及一系列相关工具与OS操作,最终完成备份过程
  • 支持备份InnoDB和其他引擎的表
  • 备份一致性保证

采用他们自已的osc工具执行Online
DDL(也是本次DTCC大会上lulu的分享主题),它最早用PHP开发,虽早已开源,但实在不好用,所以几乎只在内部使用。这个工具不同于pt-osc,相对来说更有优势,比如可以避免使用pt-osc最常遇到的主从数据延迟问题。

 

innobackupex备份基本流程

start xtrabackup_log -> copy .ibd; ibdata1 -> FLUSH TABLE WITH
READ LOCK -> copy .FRM; MYD; MYI; misc files -> Get binary log
position -> UNLOCK TABLES -> stop and copy xtrabackup_log

项目地址:

 

innobackupex使用

主要示例:

  • 全量备份

innobackupex --user=root --password=123456 --defaults-file=/etc/mysql/my.cnf /dbbackup
  • 增量备份

innobackupex --user=root --password=123456 --defaults-file=/etc/mysql/my.cnf --incremental --incremental-dir /dbbackup/2016-4-3_13:24:32 /dbbackup
  • 流方式备份

innobackupex --user=root --password=123456 --defaults-file=/etc/mysql/my.cnf --stream=xbstream /dbbackup/ > /dbbackup/stream.bak
  • 并行备份

innobackupex --user=root --password=123456 --defaults-file=/etc/mysql/my.cnf --parallel=4 /dbbackup/
  • 限流备份

innobackupex --user=root --password=123456 --defaults-file=/etc/mysql/my.cnf --throttle=10 /dbbackup/
  • 压缩备份

innobackupex --user=root --password=123456 --defaults-file=/etc/mysql/my.cnf --compress --compress-thread 4 /dbbackup/

6. 团队结构及技能树

4. 如何快速部署从库

如何制定备份策略

需要考虑的因素

  • 数据库是不是都是innodb引擎表 -> 备份方式,热备or冷备
  • 数据量大小 -> 逻辑备份or物理备份,全量or增量
  • 数据库本地磁盘空间十分充足 -> 备份到本地or远程
  • 需要多块恢复 -> 备份频率 小时or天

DBA团队更多的是负责私有DB云平台的建设。


5.3-MySQL数据恢复

Schema设计及DB拆分等由性能优化团队负责。

可使用xtrabackup在现有存活的SLAVE实例上备份,也可在主库上发起备份,再利用WDT(或者是BT)协议传输到异地,用于拉起从库。

什么时候需要恢复数据

  • 硬件故障(如磁盘损坏)
  • 人为删除(如误删除数据、被黑)
  • 业务回滚(如游戏bug需要回档)
  • 正常需求(如部署镜像库、查看历史某时刻数据)

在线表结构变更:数据库资源申请由质量服务团队负责,做到资源的合理分布、分配,如果某个业务只需要个位数级别的DB实例,可以自行在私有DB云平台中申请部署,当数量比较大时,需要先经过质量服务团队评估通过。

关于WDT项目:

数据恢复的必要条件

  • 有效备份
  • 完整的数据库操作日志(binlog)

数据库资源申请由质量服务团队负责,做到资源的合理分布、分配。如果某个业务需要小量DB实例,可以自行在私有DB云平台中申请部署;当数量比较大时,需要先经过质量服务团队评估通过才可以。返回搜狐,查看更多

 

数据恢复思路

  • 最新一次备份 + binlog恢复到故障时间点(适用于各种数据丢失场景)
  • 挖掘最后一次备份到故障点之间的binlog获取相关SQL语句,构造反转SQL语句并应用到数据库(只是用于记录丢失,且binlog必须是row格式)

发表评论

电子邮件地址不会被公开。 必填项已用*标注