一、MySQL简介
1.1 什么是MYSQL
MySQL 是由 MySQL AB 公司(目前已经被 SUN 公司收归麾下)自主研发的,目前 IT 行业最流行的开放源代码的数据库管理系统之一,它同时也是一个支持多线程高并发多用户的关系型数据库管理系统。
MySQL 数据库以其简单高效可靠的特点,在最近短短几年的时间就从一个名不见经传的数据库系统,变成一个在 IT 行业几乎是无人不知的开源数据库管理系统。从微型的嵌入式系统,到小型的 web 网站,至大型的企业级应用,到处都可见其身影的存在。
1.2 MySQL和其他数据库有以下几个简单的比较:
功能性:MySQL基本实现了ANSI SQL 92的大部分标准,仅有少部分并不经常使用的没有实现。而在SQL的标准实现上要比MySQL完善,而且功能实现比较严谨,比较学院化。此外,其他数据库可能提供更多高级功能和编程接口。
易用性和灵活性:MySQL的语法相对简洁,易于学习和使用,且具有良好的扩展性和灵活性,能够适应各种不同的应用场景。而其他数据库可能更适合大型企业级应用或对安全性和可靠性要求非常高的场合。
性能:MySQL在处理简单查询和事务方面表现出色,而且对于并发操作和大型数据集的支持也很好。其他数据库则可能在处理复杂查询或大规模数据时更具优势。
安全性和可管理性:Oracle和DB2等数据库产品在安全性和可管理性方面表现出色,提供了丰富的安全控制和监控工具,而MySQL则需要通过一些第三方工具来提供类似的功能。
1.3 MySQL 的主要适用场景
MySQL是一种广泛使用的关系型数据库管理系统,适用于各种不同的应用场景。以下是MySQL主要适用的场景:
Web应用程序:MySQL在Web应用程序中被广泛使用,因为它具有高性能、高可用性和易于扩展的优点。MySQL能够轻松处理大量的并发连接和事务,并且支持事务、存储过程和触发器等高级特性。
数据仓库:MySQL是一种非常流行的数据仓库系统,因为它具有高性能、可扩展性和可靠性等优点。MySQL可以轻松处理大量数据,并支持复杂查询和数据分析。
嵌入式系统:MySQL也适用于嵌入式系统,如智能家居、工业自动化和医疗设备等。由于其轻量级、低成本和易用性等特点,MySQL成为了嵌入式系统中的首选数据库。
企业应用程序:MySQL可以用于各种企业级应用程序,如ERP、CRM、人事管理系统等。由于其可靠性、安全性和可管理性等特点,MySQL成为了企业级应用程序中的首选数据库。
科学计算和数据分析:MySQL可以用于科学计算和数据分析,如气象、地震和生物信息学等领域。MySQL可以轻松处理大规模数据集,并支持高性能计算和数据可视化
二、MySQL架构组成
2.1 物理文件组成
2.1.1 日志文件
1. 错误日志:Error Log
在my.cnf配置文件中添加以下行,以指定错误日志的相关参数:
[mysqld]log_error=/var/log/mysql/error.log
这将将错误日志记录到/var/log/mysql/error.log文件中。
重启MySQL服务以使更改生效。
可以使用以下命令来验证错误日志是否已成功启用:
SHOW VARIABLES LIKE 'log_error';
如果输出结果为ON,则说明错误日志已成功启用。
可以使用以下命令来验证错误日志文件是否已创建:
ls -l /var/log/mysql/error.log
如果输出结果包含错误日志文件名,则说明错误日志已成功记录。错误日志记录了MySQL服务器的错误信息,包括连接错误、权限问题、语法错误等,可以帮助用户快速定位问题并进行修复。
2.二进制日志:Binary Log & Binary Log Index
要在MySQL中开启二进制日志(Binary Log)功能,可以按照以下步骤进行操作:
- 在my.cnf配置文件中添加以下行,以指定二进制日志的相关参数:
[mysqld] binlog_format=row binlog_file_per_table=1 binlog_max_binlog_size=1073741824
这将启用二进制日志功能,并将日志文件设置为每个表单独的文件中,最大日志大小为1GB。
重启MySQL服务以使更改生效。可以使用以下命令来验证二进制日志是否已成功启用:
SHOW VARIABLES LIKE 'binlog_format';
如果输出结果为ROW
,则说明二进制日志已成功启用。
可以使用以下命令来验证二进制日志文件是否已创建:
ls -lh /var/lib/mysql/binlog/
如果输出结果包含二进制日志文件名,则说明二进制日志已成功记录。
二进制日志主要用于数据复制和恢复,以及性能分析和调试等方面。在开启二进制日志功能后,MySQL将会记录每个SQL语句的执行结果和执行时间等信息,并将其写入到指定的二进制日志文件中。
需要注意的是,开启二进制日志功能会占用磁盘空间,并且会影响MySQL的性能。因此,在生产环境中应慎重考虑是否需要开启该功能。此外,为了保护数据隐私,建议将二进制日志文件存储在受保护的位置,并定期清理旧的日志文件。
3.更新日志:update log
新版本已废弃,不作介绍
4.查询日志:query log
在my.cnf配置文件中添加以下行,以指定查询日志的相关参数:
[mysqld]general_log=1general_log_file=/var/log/mysql/query.log
这将启用查询日志功能,并将日志文件设置为/var/log/mysql/query.log。
重启MySQL服务以使更改生效。
可以使用以下命令来验证查询日志是否已成功启用:
SHOW VARIABLES LIKE 'general_log';
如果输出结果为ON,则说明查询日志已成功启用。
可以使用以下命令来验证查询日志文件是否已创建:
ls -l /var/log/mysql/query.log
如果输出结果包含SQL语句及其执行时间、状态等信息,则说明查询日志已成功记录。
5.慢查询日志:slow query log
通过命令行或修改my.cnf配置文件来设置全局slow_query_log参数为1,以启用慢查询日志功能。例如,在my.cnf配置文件中添加以下行:
[mysqld]slow_query_log=1slow_query_log_file=/var/lib/mysql/slow.loglong_query_time=30
这将启用慢查询日志,并将日志文件设置为/var/lib/mysql/slow.log,同时设置超时时间为30秒。
重启MySQL服务以使更改生效。
可以使用以下命令来验证慢查询日志是否已成功启用:
SHOW VARIABLES LIKE 'slow_query_log';
如果输出结果为ON,则说明慢查询日志已成功启用。
可以使用以下命令来验证慢查询日志文件是否已创建:
tail -n 10 /var/lib/mysql/slow.log
如果输出结果包含SQL语句及其执行时间,则说明慢查询日志已成功记录。
6.Innodb 的在线 redo 日志:innodb redo log
通过命令行或修改my.cnf配置文件来设置全局slow_query_log参数为1,以启用慢查询日志功能。例如,在my.cnf配置文件中添加以下行:
[mysqld]slow_query_log=1slow_query_log_file=/var/lib/mysql/slow.loglong_query_time=30
这将启用慢查询日志,并将日志文件设置为/var/lib/mysql/slow.log,同时设置超时时间为30秒。
重启MySQL服务以使更改生效。
可以使用以下命令来验证慢查询日志是否已成功启用:
SHOW VARIABLES LIKE 'slow_query_log';
如果输出结果为ON,则说明慢查询日志已成功启用。
可以使用以下命令来验证慢查询日志文件是否已创建:
cat /var/lib/mysql/slow.log
如果输出结果包含SQL语句及其执行时间,则说明慢查询日志已成功记录。
2.1.2 数据文件
在 MySQL 中每一个数据库都会在定义好(或者默认)的数据目录下存在一个以数据库名字命名的文件夹,用来存放该数据库中各种表数据文件。不同的 MySQL 存储引擎有各自不同的数据文件,存放位置也有区别。多数存储引擎的数据文件都存放在和 MyISAM 数据文件位
置相同的目录下,但是每个数据文件的扩展名却各不一样。如 MyISAM 用“.MYD”作为扩展名,Innodb 用“.ibd”,Archive 用“.arc”,CSV 用“.csv”,等等。
1、“.frm”文件
与表相关的元数据(meta)信息都存放在“.frm”文件中,包括表结构的定义信息等。不论是什么存储引擎,每一个表都会有一个以表名命名的“.frm”文件。所有的“.frm”文件都存放在所属数据库的文件夹下面。
2、“.MYD”文件
“.MYD”文件是 MyISAM 存储引擎专用,存放 MyISAM 表的数据。每一个 MyISAM 表都会有一个“.MYD”文件与之对应,同样存放于所属数据库的文件夹下,和“.frm”文件在一起 。
3、“.MYI”文件
“.MYI”文件也是专属于 MyISAM 存储引擎的,主要存放 MyISAM 表的索引相关信息。对于 MyISAM 存储来说,可以被 cache 的内容主要就是来源于“.MYI”文件中。每一个 MyISAM表对应一个“.MYI”文件,存放于位置和“.frm”以及“.MYD”一样。
4、“.ibd”文件和 ibdata 文件
这两种文件都是存放 Innodb 数据的文件,之所以有两种文件来存放 Innodb 的数据(包括索引),是因为 Innodb 的数据存储方式能够通过配置来决定是使用共享表空间存放存储数据,还是独享表空间存放存储数据。独享表空间存储方式使用“.ibd”文件来存放数据,且每个表一个“.ibd”文件,文件存放在和 MyISAM 数据相同的位置。
如果选用共享存储表空间来存放数据,则会使用 ibdata 文件来存放,所有表共同使用一个(或者多个,可自行配置)ibdata 文件。ibdata 文件可以通过 innodb_data_home_dir 和 innodb_data_file_path两 个 参 数 共 同 配 置 组 成 , innodb_data_home_dir 配 置 数 据 存 放 的 总 目 录 , 而innodb_data_file_path 配 置 每 一 个 文 件 的 名 称 。 当 然 , 也 可 以 不 配 置innodb_data_home_dir 而直接在innodb_data_file_path 参数配置的时候使用绝对路径来完成配置。
innodb_data_file_path 中可以一次配置多个 ibdata 文件。文件可以是指定大小,也可以是自动扩展的,但是 Innodb 限制了仅仅只有最后一个 ibdata 文件能够配置成自动扩展类型。当我们需要添加新的 ibdata 文件的时候,只能添加在 innodb_data_file_path配置的最后,而且必须重启 MySQL 才能完成 ibdata 的添加工作。
不过如果我们使用独享表空间存储方式的话,就不会有这样的问题,但是如果要使用裸设备的话,每个表一个裸设备 ,可能造成裸设备数量非常大,而且不太容易控制大小,实现比较困难,而共享表空间却不会有这个问题,容易控制裸设备数量。我个人还是更倾向于使用独享表空间存储方式。当然,两种方式各有利弊,看大家各自应用环境的侧重点在那里了。
2.1.3 Replication 相关文件
1、master.info 文件:
master.info 文件存在于 Slave 端的数据目录下,里面存放了该 Slave 的 Master 端的相关信息,包括 Master 的主机地址,连接用户,连接密码,连接端口,当前日志位置,已经读取到的日志位置等信息。
2、relay log 和 relay log index
mysql-relay-bin.xxxxxn 文件用于存放 Slave 端的 I/O 线程从 Master 端所读取到的 Binary Log 信息,然后由 Slave 端的 SQL 线程从该 relay log 中读取并解析相应的日志信息,转化成 Master 所执行的 SQL 语句,然后在 Slave 端应用。mysql-relay-bin.index 文件的功能类似于 mysql-bin.index ,同样是记录日志的存放位置的绝对路径,只不过他所记录的不是 Binary Log,而是 Relay Log。
3、relay-log.info 文件:
类似于 master.info,它存放通过 Slave 的 I/O 线程写入到本地的 relay log 的相关信息。供 Slave 端的 SQL 线程以及某些管理操作随时能够获取当前复制的相关信息。
2.2 MySQL Server 系统架构
2.2.1 逻辑模块组成
总的来说,MySQL 可以看成是三层架构
第一层 连接层(Connection Layer):连接层负责处理与客户端的连接和断开,以及认证和授权等安全机制。在这个层面上,MySQL会将客户端请求转化为内部格式,并将其传递到SQL层或服务层。连接层还负责管理连接池,以提高连接效率和性能。
第二层SQL语义层(SQL Parser Layer),在 MySQL 数据库系统处理底层数据之前的所有工作都是在这一层完成的,包括权限判断,sql 解析,执行计划优化,query cache 的处理等等;
第三层就是存储引擎层(Storage Engine Layer),我们通常叫做 StorageEngine Layer,也就是底层数据存取操作实现部分,由多种存储引擎共同组成。所以,可以用如下一张最简单的架构示意图来表示 MySQL 的基本架构:
2.2.2 各模块工作配合
MySQL中各个模块之间的工作配合如下:
连接层(Connection Layer):连接层负责与客户端进行通信,接收客户端的请求,并将请求传递给SQL语义层。同时,连接层还负责对客户端进行认证,以确保只有授权用户才能访问MySQL数据库。
SQL语义层(SQL Parser Layer):SQL语义层负责对SQL语句进行解析和分析,将SQL语句转化为一系列的执行操作,并生成执行计划。在这一层中,SQL语义层还会进行语法检查,以确保SQL语句的正确性。
存储引擎层(Storage Engine Layer):存储引擎层负责具体的数据存储和读写操作。不同的存储引擎提供了不同的数据存储和管理方式,例如InnoDB存储引擎提供了事务支持和行级锁定机制,而MyISAM存储引擎则提供了表级锁定机制。
缓存层(Cache Layer):缓存层负责对查询结果进行缓存,以提高查询效率。MySQL支持多种不同的缓存机制,包括查询缓存、连接池等,可以有效地减少网络带宽的使用和数据库的负载压力。
后台线程层(Thread Layer):后台线程层负责处理客户端请求和SQL查询,并与存储引擎层进行交互。在这一层中,MySQL使用多线程机制来处理并发请求,以提高系统的并发性能和响应速度。
通过以上各个模块之间的紧密配合,MySQL可以实现高效的数据存储、管理和查询操作,并能够满足不同用户的需求。同时,MySQL的灵活性和可定制性也使得用户可以根据自己的需求选择不同的存储引擎、缓存机制和配置选项。
DBA技术栈先介绍到这里,持续更新,欢迎点赞,收藏,转发,评论交流~