北京时间2022年12月10日,第21届FAST’23(USENIX Conference on File and Storage Technologies)公布论文入选结果。本次FAST从投稿的123篇论文中收录28篇,接受率为22.8%。我实验室与SmartX联合研发并完成的论文“Revitalizing the Forgotten On-Chip DMA to Expedite Data Movement in NVM-based Storage Systems”成功入选!
数据密集型应用使用非易失存储介质NVMM,将数据放置在基于混合内存架构的存储系统中,以实现数据访问的加速。然而,系统在实际运行中,不可避免地在DRAM和NVMM之间通过CPU拷贝数据,带来了计算资源的浪费和性能损失。FastMove创新性地利用长期存在但被忽视的片上DMA来加速数据移动。该工作主要有三个贡献:首先,通过详细的性能测试,我们厘清了片上DMA与NVMM结合的潜力和挑战,探索出新的面向延迟的优化方向,并据此设计了一个高性能的DMA模块,大大降低了数据拷贝获得收益的大小阈值。其次,我们提出了一个新的数据移动引擎,FastMove,它通过智能调度和负载分割来协调DMA和CPU的混合使用,从而使DMA的局限性得到补偿,并使整体收益最大化。最后,通过基于内核的通用设计、简单的API和DAX文件系统的集成,FastMove允许应用程序透明地利用DMA及其新功能,而无需改变代码。我们在NOVA、ext4-DAX和XFS-DAX上运行三个数据密集型应用MySQL、GraphWalker和Filebench,并使用标准基准,如TPC-C,以及流行的图算法,如PageRank等负载,对FastMove进行了严格的测试。在单NUMA和多NUMA结点的设置中,与传统的仅由CPU进行的数据拷贝相比,FastMove为TPC-C与MySQL带来了1.13-2.16倍的峰值吞吐量加速,将平均延迟降低了17.7-60.8%,并节省了37.1-68.9%用于数据移动的CPU使用率。FastMove还将图计算任务的执行时间缩短了39.7-53.4%,并为Filebench带来了1.12-1.27倍的吞吐量提速。
该系统是由我实验室博士在读生苏景波、李嘉豪,硕士在读生陈泺帆,李诚特任研究员,许胤龙教授与SmartX公司CTO张凯联合开发的。SmartX(北京志凌海纳科技有限公司)是领先的超融合IT基础架构与解决方案提供商。FastMove已在SmartX公司的基于Intel Optane的超融合基础架构产品中得到验证,为实现低延迟、高带宽的数据拷贝提供了解决方案。
FastMove是继SpanDB(FAST’21)之后,我实验室在新硬件软硬件结合上的又一次成功尝试。由于深厚的存储系统积淀,我实验室已连续三年在存储系统顶会FAST发表论文。此项工作得到了国家自然科学基金重点项目、国家自然科学基金“泛在操作系统”专项项目、安徽省高校协同创新项目联合资助,得到了国家高性能计算中心(合肥)、安徽省高性能计算重点实验室的支持。