北京时间2023年1月20日,ASPLOS 2023公布论文入选结果。我实验室与阿里云公司、卡塔尔计算研究所的合作研究论文“Persistent Memory Disaggregation for Cloud-Native Relational Databases”成功入选!在此,我们向参与此项研究工作的教师、同学和合作者表示由衷的祝贺。
论文简介:近年来,持久性存储器(PM)硬件的出现已经改变了传统的存储层次结构,给数据库系统带来了多方面的好处,例如大容量、低延迟、字节寻址性和持久性等特点。但是,PM还没有被广泛应用于云原生数据库的分离式架构中,这使得PM的潜力未能得到充分的利用。为此,我们提出PilotDB,这是一个旨在充分利用分离式的PM资源的云原生关系型数据库。
作为一款新型的云原生数据库,PilotDB采用了全新的分离式数据库架构,允许计算节点专注计算,将数据托管在远程PM节点。这是因为PilotDB的PM节点同时提供了大型缓冲池和高速的数据持久化功能。为此,我们首先提出了一套新的计算节点驱动的日志组织,它摆脱了传统页组织的WAL日志,在精细粒度上以物理日志形式记录数据的变化,允许计算节点只通过RDMA刷写日志就可以传递数据更新,减少了网络/PM带宽的消耗;其次我们设计无需CPU协调的PM数据面机制,增加系统的并发能力,减轻PM节点上的CPU负担,如使用日志抓取的乐观的远程PM读取积极地绕过了远程PM节点的CPU。这些创新技术的结合,为PilotDB带来了出色的性能表现。
我们使用Sysbench/TPC-C和来自阿里云的生产负载对PilotDB进行评估。实验结果表明,其性能在测试负载中,吞吐达到单机MySQL的98.0%(充足的本地资源),与其他分离式数据库相比,PilotDB取得了至少1.53倍的性能提升。除此之外,PilotDB在多租户、crash恢复速度,性价比等方面都具有明显的优势,如在单位成本($)约束下,PilotDB至少可以在吞吐方面取得55.9%的性能提升。
该项工作是由我实验室博士在读生阮超逸、硕士在读生毕超,李诚特任研究员,许胤龙教授,阿里云数据库资深技术专家章颖强以及卡塔尔计算研究所马晓松研究员联合完成的。