2024年值得关注的8个未来数据库

关系型数据库管理系统在数据库技术领域占据主导地位已经多年了。当SQL在1970年代首次出现时,关系型数据库管理系统的使用和受欢迎程度迅速提升。很快,MySQL成为了大多数公司和团队首选的数据库。

然而,2023年带来了一系列具有颠覆性的数据库。尽管其中一些数据库仍然使用传统的关系模式构建,但其他数据库提供了创新的方法,值得我们在2024进行重点关注。

在本文中,我们将探索一些创新和未来感十足的数据库,并比较它们的特点。

PlanetScale


PlanetScale是基于Vitess水平扩展MySQL技术的无服务器MySQL平台。Vitess是由谷歌开发的可扩展的开源数据库,用于应对数十亿YouTube用户的需求。处理如此规模的工作并非易事。

PlanetScale有趣的地方在于它是一个分支数据库,这是一种最近才出现但看起来非常有前景的新型工作流程。那么,什么是分支数据库?

什么是分支数据库?


分支数据库允许你从主数据库创建不同的分支,用于不同的目的。你可以将这个工作流程想象成类似于Git这样的版本控制系统,可以在项目中进行更改而不会破坏整个代码库。

你可以将你的主数据库或生产数据库复制到一个单独的数据库分支中。然后,可以在该数据库分支中进行实验、进行更改,当你对它们完全满意时,将其合并回主数据库。因此,通过保持生产数据库的完整性,你可以高效而直观地对数据库进行尝试和实验。

PlanetScale的分支工作流程

PlanetScale还为你的数据库添加了分支,这样你就可以在一个独立的开发分支上测试模式更改。这个分支与生产分支或你的主数据库是分开的。这提供了一个独立的工作环境,而不需要显式地创建一个用于尝试模式更改的暂存或测试环境。

你可以在PlanetScale官方文档了解更多有关分支的含义以及PlanetScale如何使用这个概念。

特点

PlanetScale自动创建每日备份,并在开箱即用时保护生产分支上的直接模式更改,减少了意外破坏生产数据库的可能性。

非阻塞模式更改是它提供的另一个有趣的特性。当你想要更改数据库模式时,你可以创建并部署一个请求来更新你的表,而不会中断你的用户。它还可以与Prisma等第三方工具简单集成。

Prisma是一个开源的数据库工具包,为现代Web应用程序提供了一个类型安全的ORM(对象关系映射)层。当你想要更改数据库模式时,你可以使用Prisma的迁移功能生成必要的SQL脚本,以非阻塞的方式应用于你的数据库,而不会中断你的用户。这样,你可以将PlanetScale与Prisma集成,以便应用程序保持在线的同时高效地更新你的模式。

价格

虽然PlanetScale的团队计划每月需要599美元,但定价计划中包含了一个免费的层级。在免费层级中,你可以获得1个生产分支和1个开发分支,每月可以进行10亿次读取和100万次写入。如果你需要更多的读取、写入和分支,而又不想花费太多金钱,你也可以选择他们的Scalar计划,每月29美元。

缺点

因为它是一个相对较新的服务,所以它并不具备标准MySQL数据库的所有特性,比如存储过程、触发器、索引和其他类似的功能。

此外,如果你对分布式数据库的概念还不熟悉,学习曲线可能会成为一个问题。但对于这类新型的数据库,还是值得关注的。

YugaByteDB

YugaByteDB是一个开源的Postgres数据库,在云原生环境中加载了所有Postgres的原生特性。它允许同时在多个云上托管你的数据库,从而更好地控制数据库系统,消除了供应商锁定的问题。这也使你能够在不同的地区部署你的云实例,从而为你的数据库提供更高的故障容忍度。

特点

YugaByte支持SQL和NoSQL API。这使得开发人员可以根据他们的熟悉程度和使用情况选择最适合的API类型。除了确保高性能和可伸缩性,它还提供高可用性。

价格

Yugabyte提供了一个完全托管的专用集群,每核心每小时0.25美元。

缺点

作为另一个分布式数据库系统,与传统的SQL数据库相比,它可能具有更陡峭的学习曲线和一些额外的复杂性开销。

Dolt

Dolt是一个独特的数据库,它与版本控制和Git的工作原理相同。它可以跟踪数据的变化,并了解数据的变化是如何以及何时发生的。就像一个Git仓库一样,你可以推送、拉取、分叉或克隆数据库。非常有趣,是吧?

Dolt的分支行为

和PlanetScale以及Neon一样,Dolt也实现了分支行为,你可以在不破坏生产数据的情况下对数据进行实验。

由于它是基于Git工作流程构建和运行的,使用Dolt时,所有的git命令,如git log、git add等,可以在命令行中用dolt log、dolt add等命令替代。

特点

Dolt支持SQL查询,使得从传统SQL背景下来的开发人员能够轻松地检索和更新数据。

Dolt提供的另一个有趣特性是协同编辑。使用Dolt的团队可以同时在同一个Dolt数据库上进行多个开发人员的工作。Dolt会自动处理对数据库所做的所有更改的合并。

定价和缺点

Dolt是开源的,并且完全免费。然而,由于其功能有限,如存储过程或用户定义函数,它可能只适用于特定的用例。

CockroachDB

由前谷歌员工开发的CockroachDB是与SQL和Postgres兼容的最强大的分布式数据库系统之一。它使用Go语言构建,为SQL和NoSQL API提供多模型支持,支持像YugaByteDB一样的多云部署,并能处理每秒数百万次查询。

它拥有强大的社区支持,并为开发人员提供了大量的学习资源,如教程、博客文章等。

定价

虽然它有一个免费版本,可以用于开发和测试模式下的小型项目,但它可能有点昂贵,特别是与其他开源替代品相比。然而,它的专用计划的价格比PlanetScale低得多,每月295美元。

缺点

作为一个分布式数据库系统,它需要设置和管理系统的复杂性开销,同时还需要一个陡峭的学习曲线。由于性能问题,它也不是对于延迟低、吞吐量高的应用程序的理想选择。

CloudFlare D1

现在让我们介绍一个在边缘运行SQLite数据库的无服务器数据库平台。Cloudflare Durable Objects (D1)用于构建和部署有状态应用程序。

CloudFlare D1使用与传统SQL数据模型不同的数据模型,它看起来和工作起来非常像面向文档的数据库,如MongoDB。

如何在CloudFlare D1中存储数据?

让我们来看一个例子。我们知道,在传统的SQL数据库中,数据存储在由行和列组成的表中。

假如一个名为“employees”的表,它有以下列作为“id”、“name”、“age”和“department”。

下面是表的示例:

id name age department1Alice 28Sales2Bob 35Marketing3Charlie 42Finance

相比之下,CloudFlare D1将数据存储为类似于文档数据库的对象形式。

因此,将上面的例子转换为CloudFlare D1中的对象,我们有一个名为“Employee”的对象,它具有以下属性:“id”、“name”、“age”和“department”:

Employee {id: 1,name: 'Alice',age: 28,department: 'Sales'}

因此,上述数据以一个带有唯一标识符的Employee对象的形式存储。

特点

Cloudflare的一个很棒的地方是它已经有了适用于workers的键值存储,但其中的一个折衷是原生事务不起作用。因此,你也可以使用JavaScript编写存储过程,并直接在数据库中运行这些过程,它们基本上是代码片段。然后你可以使用它们来创建事务或其他可重用的查询。

此外,CloudFlare D1作为无服务器数据库的特点使得部署和管理变得很容易。

定价

Cloudflare D1目前处于alpha阶段,完全免费进行测试、使用和实验。这是你玩弄它并了解它是否成为你未来首选数据库的最佳时机。

缺点

CloudFlare D1目前尚未准备好用于生产。它的使用案例非常有限,不涉及复杂的数据结构或传统的SQL查询。持久化对象方法的另一个问题是迁移困难,最终导致供应商锁定。总的来说,尽管这个数据库听起来很有前景,但你现在还不能在你的生产应用程序中使用它。

说到无服务器架构,Xata提供了一个基于Postgres和Elasticsearch的有趣的关系型数据库。它将你的数据视为一个电子表格,使开发人员能够轻松构建需要灵活模式的应用程序。你也可以将它想象成AirTable或Notion的开发人员友好的替代品。

Xata

特点

它内置了全文搜索功能,并且可以帮助你使用提供的架构编辑器实时可视化表之间的关系。

它还支持像Dolt一样的分支,并主要用于实时处理大量数据。它还支持一些高级查询功能,如聚合、过滤、连接等。

定价

Xata的定价基于每秒的速率限制或可以进行的数据库请求次数。它有一个免费计划,每秒提供75个请求,最多支持75万条记录。

如果你是一家初创公司或计划很快推出MVP,他们的免费计划应该足够使用。他们的专业计划起价为每个单位每月8美元。

缺点

Xata的一些主要缺点包括未来迁移到其他平台的困难以及总体复杂性,通常需要丰富的专业知识才能使用。

Surreal DB

Surreal DB是用Rust编写的,它为关系型、文档型和图形数据库提供了一个易于使用的单一API。

特点

在数据建模方面,它非常灵活,非常适合推荐引擎、社交网络等应用。在这方面,它类似于流行的图形数据库Neo4J。

它还非常简单,可以与任何SQL类型的查询语言一起使用,并提供高效执行实时查询的能力。

例如,下面是一个在SurrealQL中的插入查询,看起来几乎与SQL的插入查询相同:

INSERT INTO company {name: 'Siddhant',age: 24,hobbies: ['technical writing', 'basketball']};

此外,你可以使用SurrealQL直接连接你的Surreal DB到你的客户端应用程序。

缺点

由于它相对较新,文档和社区支持有限,特别是与帖子中讨论的其他数据库相比。它还使用自己的查询语言SurrealQL来编写查询。这可能会引入新的学习曲线,并且缺乏优质资源来掌握这个查询语言可能会在许多用例中成为开发人员的障碍。

定价

目前,SurrealDB没有任何云服务提供,但你可以加入他们的云等待名单,这是他们未来计划的一部分。你可以自己在本地或私有服务器上进行自托管。

虽然SurrealDB不是完全开源的,但它根据商业源代码许可证进行许可,这使得它在所有开发和生产使用中都是免费的。

Fauna DB

FaunaDB是最通用和易于使用的数据库之一。它由前Twitter工程师创建,是一个NoSQL数据库,遵循类似于MongoDB的文档数据库范例。

特点

尽管是一个NoSQL数据库,它支持原生连接操作,这是文档数据库中最缺失的功能。它非常适用于处理复杂的关系型数据,如社交图谱,并且有自己的自定义查询语言FQL。它还默认支持Graphql API。

它使用分布式架构以提供高可用性和低延迟。它可以成为无服务器应用程序或微服务架构的理想选择。

定价

它有一个免费计划,提供10万次读取、5万次写入和5GB的存储空间。非常适合个人项目,但可能不适用于MVP或更大的生产项目。

你可以升级到FaunaDB的任何计划,价格从每月25美元的个人计划,到每月150美元的团队计划,再到每月500美元的大型组织计划。

缺点

和SurrealDB类似,FaunaDB也使用了自己的查询语言FQL,这可能会给开发人员带来学习曲线。

例如,下面是一个在FQL中常用的查询:

Paginate(Documents(Collection("users"))) 

上述查询基本上是从一个名为“users”的集合中检索所有文档,并默认进行分页。

在SQL中的等效查询是:

SELECT * from users

正如你所见,这两个查询非常不同,它们在语法上没有相似之处。

此外,与我们在帖子中讨论的其他数据库相比,FaunaDB的价格相对较高。

结论

我们已经讨论了一些最先进和未来感的数据库。这些数据库大多数采用了分布式架构,这可能需要额外的工作和资源来进行设置、掌握和充分利用。然而,它们的创新方法和新颖的工作流表明它们有着宝贵的应用。

如果你考虑完全摆脱SQL,选择一个基于定价、易用性、社区支持和整体实用性等因素的数据库。如果你偏爱文档数据库,FaunaDB是一个不错的选择。如果你对分支数据库感兴趣,可以看看PlanetScale或Dolt。如果你需要一个灵活的模式,Xata是一个很好的选择。我们讨论的每个数据库都有其独特的特点。