RedisGraph的整体架构

The architecture of RedisGraph

本文关注RedisGraph的整体架构，分别从图存储模型、索引、并发控制、和执行计划四个方面简要阐述。下图为RedisGraph的整体架构图。

1 图存储模型

了解一个图数据库的架构，最重要的就是其图存储模型，即其中的图数据是怎么组织和存储的。

首先，在一个图数据库中，必不可少的数据是：节点的属性（node attribute）以及节点之间的关系（edge）。比如说，图数据库中有两个节点node1{name: 小明}、node1{name: 小红}，两者存在朋友关系，那么，就需要存储node1和node2的name属性，以及node1和node2之间的朋友关系。除此之外，RedisGraph还支持存储节点之间的关系的属性（edge attribute），比如，存储node1和node2朋友关系的建立时间。

在RedisGraph中，node attribute和edge attribute存储在Block数组中，而节点之间的关系使用邻接矩阵进行存储。值得注意的是，node的数量与邻接矩阵的维数是一致的。每一个节点都有一个node_id（≥ 0），节点属性存储在Block数组node_id偏移地址（nodes[node_id]）处，节点的下一跳信息存储在邻接矩阵（adjacency）的第node_id行。显而易见，这样做的目的是，快速索引节点属性和下一跳信息。

对于节点间关系的存储，RedisGraph不仅仅使用了邻接矩阵。为了方便快速查询，还是用了label矩阵（labels）和relation矩阵（relations）。为了适应类型化节点，每个标签分配一个额外的矩阵，即label矩阵。每个类型的关系都有自己的专用矩阵，即relation矩阵。

2 索引

RedisGraph中并没有索引的代码实现，其使用RediSearch搜索引擎来构造索引，并且，RedisGraph仅仅支持哈希索引。RedisGraph中的索引分为两种：exact match index和full-text index。本文只关注exact match index。

为什么要建立索引？
我们来看一个cypher查询：
```
GRAPH.QUERY DEMO_GRAPH "MATCH (n:作品)-[]-(m:角色) where m.name='郭靖' return n.name"
```
这个查询仅仅涉及name=‘郭靖’，如果没有在角色: name上建立索引，RedisGraph只能是扫描一遍Block数组，进行字符串匹配，来找出name=’郭靖’的节点。显然，这效率低下。
索引的key和value是什么？
以一个在节点属性上建立索引的cypher为例进行分析：
```
GRAPH.QUERY DEMO_GRAPH "CREATE INDEX ON :角色(name)"
```
RedisGraph在执行这个请求后，就会在角色的name属性上建立索引。
索引的key是name属性；value是node_id。通过node_id，就可以在Block数组中查询节点属性，在矩阵中查询下一跳信息。
同样，如果在关系的属性上建立索引，那么，索引的key是属性；value是edge_id。