分布式事务跨机执行时,OceanBase通过多种机制保证ACI
A 原子性Atomicity
原子性是指事务是一个不可分割的工作单位,事务中的操作要么都发生,要么都不发生。
依赖两阶段提交协议保证分布式事务的原子性
C 一致性Consistency
事务前后数据的完整性必须保持一致
保证主键唯一等一致性约束。全局快照-单租户GTS服务,1秒钟内能够响应获取全局时间戳的调用次数超过200万次。
I 隔离性Isolation
多个用户并发访问数据库时,数据库为每个用户开启的事务,不能被其他事务的操作所干扰。
采用MVCC进行并发控制,实现read-committed的隔离级别
所有修改的行加互斥锁,实现写-写互斥
读操作读取特定快照版本的数据,读写互不阻塞
D 持久性Durability
一个事务一旦被提交,它对数据库中数据的改变就是永久性的,接下来即使数据库发生故障也不应该对其有任何影响。
Redo-Log使用Paxos协议做多副本同步
因服务器时钟差异,分布式数据库ACID挑战更大
和传统的数据库的单点全共享架构不同,OceanBase是一个原生的分布式架构,采用了多点无共享的架构,在实现全局一致的快照隔离和多版本并发控制时,会面临分布式架构所带来的技术挑战。
OceanBase全局一致性快照技术
OceanBase数据库利用一个集中式服务来提供全局一致的版本号。事务在修改数据或者查询数据的时候,无论请求源自哪台物理 机器,都会从这个集中式的服务处获取版本号,保证所有的版本号单调向前并且和真实世界的时间顺序保持一致。
创新的两阶段提交,任何故障均可以保障事务的原子性
技术难点:依赖两阶段提交协议保证事务原子性
两阶段提交:状态多、复杂、状态机容易卡住
OceanBase两阶段提交协议特点
事务协调者和所有参与者都是高可用的。
单机多分区事务,所有参与者都prepare成功即认为事务进入提交状态,立即返回客户端commit
全自动处理异常情况
多版本并发控制(MVCC),解决读写互斥问题
事务隔离级别
事务并发问题:
脏读:读取了未提交的数据
不可重复读:指的是在同一事务内,不同的时刻读到的同一批数据可能是不一样的(期间被别的事务更新数据)
幻读:指的是在同一事务内,在操作过程中进行两次查询,第二次查询的结果包含了第一次查询中 未出现的数据或者缺少了第一次查询中出现的数据(期间被别的事务插入或者删除了数据)
OceanBase支持多种事务隔离级别
基于全局一致的数据版本号管理,以不同的版本号策略实现不同的隔离级别
Oracle模式支持以下两种隔离级别,应用系统可以根据需求权衡使用任何一种隔离级别:
Read-Committed:避免脏读,存在不可重复读和幻读(默认)
Serializable:避免脏读、不可重复读、幻读
MySQL模式支持读已提交、可重复读两种隔离级别
不支持脏读(Dirty-Read),只能获取已提交数据