本文分享自华为云社区《【GaussTech 速递】技术解读之 GaussDB 多租技术》,作者:GaussDB 数据库。
数据库多租技术介绍
随着云计算时代的到来,多租户的概念也逐渐广为人知。“多租户” 使得租户之间可以共享物理资源,能够帮助用户节约硬件成本和运维成本,提高资源利用效率。同时,在实现的过程中,考虑到共享带来的安全、隔离等问题以及后续业务面临的扩展需求,“多租户” 在隔离性和扩展性方面也进行了相应的设计实现。
那么,在数据库领域是如何实现 “多租户” 呢?
业界有虚拟机多租、容器多租、数据库内核多租等多种技术可以实现多租户。
虚拟机多租和容器多租,顾名思义就是在一台物理服务器上部署多个虚拟机或者容器,然后在虚拟机或者容器内进行数据库服务的部署。这类技术方案在安全性和隔离性方面具有天然的优势。
数据库内核多租,是由数据库内核提供的多租户特性。相比于虚拟机多租和容器多租,内核多租没有虚拟化管理层、OS(Operating System,简称操作系统)层、数据库公共层的额外开销,而且底噪小,在资源整合、资源的弹性伸缩等方面具备天然优势。数据库内核多租通过将数据库内核语义与成熟的资源隔离技术栈相整合,实现更高的 Scale-Down(缩容)能力,极大地提升了数据库在计算资源方面的利用率。
GaussDB 支持被部署在虚拟机或者容器内,给客户提供整体虚拟机 / 容器多租的解决方案,同时也提供了数据库内核多租特性,满足客户不同业务场景的需求。
- 在客户资金充裕,且对资源的隔离性、可靠性等要求更高的场景下,可以选择虚拟器 / 容器多租方案;
- 在客户投入有限,需要更大力度利用现有资源的场景下,可以选择 GaussDB 数据库内核提供的多租方案。
本文将对 GaussDB 数据库内核集中式场景下提供的多租技术进行重点介绍。
GaussDB 多租架构
GaussDB 多租是指在一个数据库实例中划分出多个逻辑处理单元,我们称这个逻辑单元为 PDB(pluggable database),每个 PDB 具备物理数据库的绝大多数能力,同时相互隔离。
在数据库初始化时,会生成一个 template pdb 作 PDB 创建的模板。
集群内可以创建多个资源计划,每个资源计划下挂载多个 plan directive,每个 plan directive 对应一个 PDB,PDB 通过 plan directive 配置自己的资源规格,包括 CPU、内存、IO 等。
图 1 GaussDB 多租架构
一个 PDB 归属于一个独立的业务或公司。独立的业务或公司可以连接到自己的 PDB 运行数据库业务。
GaussDB 多租技术特点
1. 隔离性
多租户架构的目的是为了让多用户或者多业务使用同一套数据库集群,PDB 数据的隔离性是实现该架构的基础。
假设同一个公司的两个业务共享同一个数据库实例,业务 A 的相关数据可以被业务 B 查看,这是完全不可接受的行为。
GaussDB 数据库的 PDB 之间数据完全隔离,实现租户数据完全独立、互不干扰,保障租户数据的安全隐私:
(1)每个 PDB 除了有自己的表、索引等对象数据,也有自己的用户、角色、表空间以及定时任务等对象。
(2)除了数据库对象,PDB 的其它属性也完全隔离。比如:每个 PDB 有独立的兼容模式、线程组、GUC 配置参数等。
图 2 PDB 之间数据完全隔离
PDB 之间数据互相隔离,但用户业务开发并不需要感知是使用了一个 PDB 还是一个物理实例,对用户业务开发来说,使用 PDB 和使用物理实例的操作没有区别。
2.PDB 粒度的资源管理
PDB 资源的分配与变更由 GaussDB 内核接管,并不依赖任何外部组件。每个 PDB 可以设置自己的资源规格,包括 CPU、内存以及 IO。
GaussDB 内核通过资源计划管理所有 PDB 的资源,每个资源计划包含了多个资源计划指令,每个资源计划指令设置了一个 PDB 的资源规格。
上层可以调用资源计划高级包接口,完成资源的分配与变更。系统中可以有多个资源计划,可以通过资源计划的切换,做到一键切换所有 PDB 资源规格的能力。
图 3 PDB 资源的变更和切换
每个 PDB 的资源使用由 GaussDB 内核中的资源管理模块管理。相较于将资源分配交由外部组件(虚拟机,容器等)管理,GaussDB 通过实现数据库内核的自主资源分配,在保证租户资源按照配额公平使用的前提下,也可获得以下优势:
(1)提高资源利用率:租户间的后台工作整合,通过合理的调度算法,最大限度地利用系统空闲资源。
(2)内核感知资源分配,根据资源分配情况,动态调整 CPU 占比,内存大小以及线程池、连接池等资源,最终获得更优的整体表现。
(3)在物理机资源充足的情况下,PDB 的资源变更通过 SQL 语句即可完成,实现资源秒级变更,业务无感知。
相比而言,目前云上虚拟机的规格变更耗费时间较长,需要先变更备机,然后主备倒换,然后进行其他变更操作,端到端时间约为:(虚拟机关机 + IaaS 资源调度 + 新虚拟机开机 + 数据库拉起)X 数据库节点个数。
(4)内核中所有 PDB 公用一套系统资源,有效的减少了内核底噪的资源占用。
3. 实例发放
GaussDB 内核多租技术的实例发放效率领先于其他的多租技术。
以虚拟机多租为例,虚拟机实例的发放需要先申请一定规格的虚拟机,然后再部署 GaussDB 集群,需要消耗 10-30 分钟或者更多的时间。
而 GaussDB 内核多租技术,内核中管理了 PDB 的创建 / 打开 / 关闭 / 删除。在物理机上部署 GaussDB 的基础上,使用几个 SQL 语句即可完成这些操作,秒级时间内即可实现实例的发放。
4.GaussDB 多租规格配置
GaussDB 多租支持的 PDB 规格配置见下表:
可以看到,GaussDB 支持 1U(1 个 CPU)级别的 PDB 规格,而当前虚拟机多租和容器多租一般只能提供 8U 级别的商用规格。这是因为:
- 数据库中通常存在很多后台任务以及运维任务,需要维护整个集群的正常运行。
以 GaussDB 为例,存在 auto vacuum、慢 / 全量 SQL 收集等后台任务。
- 数据库管控层的实例指标监控也需要连接到数据库收集信息。
例如 TPS,QPS 等。
这些任务都需要消耗 CPU,故虚拟机 / 容器实例做到更小规格(例如 2U)基本不太可能。而内核多租是在 GaussDB 进程中划分了多个逻辑实例,所有逻辑实例共享同一份后台任务,管控的指标监控连接一次就可以收集到所有 PDB 的数据,大大减少了数据库底噪,因此内核多租可以很好的支持 1U 逻辑实例的发放。
另外,GaussDB 后续会继续优化 PDB 规格。比如,后续计划支持 1U4G 的 PDB 规格,以满足更多客户场景的需求。
5. 支持 PDB 关闭
对于不需要一直运行的数据库业务,GaussDB 支持关闭该业务的 PDB 并释放资源。关闭 PDB 非常简单,内核中只需要执行语句:ALTER PLUGGABLE DATABASE [pdbname] CLOSE 语句即可。
PDB 关闭即意味着业务无法连接到这个逻辑实例,用户可以释放 PDB 的 CPU、内存、IO 资源,对不使用的资源不计费,实现节约成本。
6.WDR 报告中 PDB 相关增强
GaussDB 在 WDR (Workload Diagnosis Report 负载诊断报告) 工具中适配了多租特性,可在 WDR 报告中查看 PDB 信息,以及 PDB 级别的 SQL Statistics 等性能数据视图。
(1)WDR 报告中的 PDB 信息章节
(2)WDR 报告 SQL 统计信息章节
如下图所示,细化的统计信息中添加了 “DB Name 列”,PDB 归属信息会显示在该列。
(3)SQL Detail 和 Object Stats 等章节中也添加了 PDB 信息,在此不一一列举。
添加了 PDB 信息的 WDR 报告,可方便 DBA 了解指定时间段内 PDB 级别的系统资源使用情况以及数据库运行情况,进行相应的运维处理。
总结
GaussDB 内核提供的多租技术特性,在安全隔离的前提下,具备更高的资源利用效率,更快的实例发放效率和资源变更效率。同时将租户相关的信息集成到 WDR 报告中,可以提升了客户运维的便利性。因此,客户可根据自身企业的组织结构,匹配相应的多租户配置,更高效地利用现有资源,为企业节约成本。
文章评论