实验室一项成果(BPart)被系统领域会议ICPP接收

我们实验室的自主完成的两个维度均衡的图划分算法BPart被计算机系统领域会议ICPP(CCF B类)收录。
论文:

论文题目:Towards Fast Large-scale Graph Analysis via Two-dimensional Balanced Partitioning

论文摘要:

分布式图计算系统需要将一个大图划分为多个子图,并将这些子图加载到集群中不同机器中进行计算。子图划分的好坏会极大的影响分布式图计算系统的计算效率。比如划分的均衡性(包括节点和边两个维度均衡)会极大影响分布式图计算的负载均衡;划分跨子图边数量会极大影响分布式图计算的通信开销。然而当前分布式图计算系统中采用的图划分算法通常只能实现节点均衡或者边均衡,或者能够实现两个维度均衡的算法,其跨子图边数量非常多。因此,在进行子图划分时,需要保证节点和边都划分均衡的同时尽可能地减小跨子图边地数量。

在本文中,我们提出保证节点和边两个维度均衡的划分算法BPart。他的核心思想是,首先将大图划分为多个小的子图,其数量远大于集群中机器的数量,并且在划分时通过设计复合的均衡性指标,使得每个子图中节点和边数量满足反比的关系;然后将这些小的子图按照节点或者边数量排序,并头尾组合为一个大的子图。通过多次的组合,BPart可以实现两个节点和边两个维度的划分均衡。我们将BPart集成到两个当前最优的分布式图处理系统KnightKing和Gemini中,并研究他们在执行图算法时的计算效率。通过实验对比,采用BPart作为划分策略可以减小不同图算法5%-70%的运行时间。

实验室一项成果(Optimal-LRC)被系统领域会议ICPP接收

我们实验室的自主完成的针对最优局部可恢复码(Optimal-LRC)的最优放置策略被计算机系统领域会议ICPP(CCF B类)收录。向各位参与研究工作的老师、同学表示祝贺。

论文题目:Repair-Optimal Data Placement for Locally Repairable Codes with Optimal Minimum Hamming Distance

论文摘要:

现代集群存储系统越来越多地采用纠删码来实现低冗余高可靠的数据存储。局部可恢复码(LRC)是一种在实际系统中被广泛应用的具有高恢复性能的纠删码。在各种LRC的构造中,Optimal-LRC是一种最近被提出的LRC构造,它能达到最优的最小汉明距离,同时恢复代价很低。Optimal-LRC将存储块划分成若干个局部组,并在每个组内增加一个局部校验块,使得任意单个块的恢复都能在一个组内完成。然而,Optimal-LRC在实际存储系统中的恢复性能如何仍是未知的。

在本文中,我们考虑Optimal-LRC在实际集群存储系统中的恢复问题。由于单个存储块的失效概率远高于多个存储块的失效概率,我们考虑单个块的恢复。我们发现传统的扁平数据放置和随机数据放置会在恢复过程中跨集群传输大量的数据,严重降低了数据恢复性能。因此,我们基于Optimal-LRC的容错能力,通过将每一个组的块放置于最少量的集群中,设计了一个最优的数据放置方案。该放置方案可以在保障容单集群故障的条件下,最小化单个块在恢复时所需的跨集群网络带宽。本文进一步在 Memcached上实现了一个基于Optimal-LRC的集群存储系统原型,并验证了本文放置方案的有效性。实验表明,相较于扁平放置和随机放置,最优放置方案可以将降级读时间分别降低83.3%和68.9%,并将恢复吞吐量分别提升7.7倍和5.6倍。

实验室2篇Workshop论文被APSys’21与Cloud Intelligence’21接收

Workshop会议接收的论文一般较短,且缺少完整的实验与实现,旨在通过前期探索向业界寻求进一步宝贵的意见与反馈。APSys’21是其开展的第12次,由Heming Cui等大牛组织,成员来自不限于操作系统、虚拟化、存储系统、分布式系统、云计算系统等领域的专家。43篇有效提交中,有20篇被接收。Cloud Intelligence’21,由Jian Zhang等大牛组织,成员不乏来自于各大工业界与名校的云计算专家。

被APSys’21接收的论文题为Lessons Learned from Migrating Complex Stateful Applications onto Serverless Platforms,讲述的是将应用迁移到Serverless平台上的经验与展望,所选取的应用为4个基于微服务架构的开源的、复杂的、有状态的应用,涉及8种编程语言、5种应用框架和40个逻辑计算服务。将这些复杂的应用重构并迁移到Serverless平台上需要较大的开销,这影响了Serverless模式被更多应用采纳的脚步。在这篇论文中,作者根据手动迁移的经验,提炼出了一些编程模式,并总结出了一些帮助人们迁移的经验,以在保证实际性能的前提下尽可能减小代码修改的工作量。这篇论文也展示了迁移部分应用架构的自动化工具的可能。APSys’21将在8月24-25日举行。

被Cloud Intelligence’21接收的论文题为PerfEstimator: A Generic and Extensible PerformanceEstimator for Data Parallel DNN Training。内容旨在通过性能测量与网络模拟实现在单机上轻量化的对分布式数据并行的深度神经网络的性能预测。通过基于当前最常用的管道并行的建模,抽象了算子依赖图到计算-传输流水线的映射。规避了传统分析预测的不稳定性。作者通过PerfEstimator对常用网络(如VGG,resnet)进行了误差小于0.2-10.9%的准确预测。Cloud Intelligence’21已于5月29日举行。

华为-中国科大举办计算网络联合创新研讨会

2019年10月22日,ADSL实验室联合信息学院信息网络实验室、网络信息中心与华为2012实验室-中央研究院-网络技术实验室在科大西区电三楼共同举办了“华为-中国科学技术大学计算网络联合创新研讨会”。研讨会上,与会人员报告了双方在数据中心网络、存储技术与分布式系统等方面的研究成果,针对计算、存储与网络技术等领域的产、学、研开展长期合作展开了充分的讨论。双方拟合作成立联合创新实验室,致力于在不确定性和多路径中进行探索,实现基础性研究突破和结构性突破,贡献世界级的产出。

研讨会现场

此次研讨会由许胤龙教授主持,计算机学院副院长陈恩红教授、网络信息中心主任李京教授、信息学院洪佩琳教授、计算机学院副院长孙广中副教授、华为网络技术实验室主任张小俊、华为中央研究院技术合作部部长张建虹、网络技术实验室首席技术专家李宗鹏,网络技术实验室副主任韩磊、计算机学院和信息学院的部分师生、网络技术实验室的多名专家参加了这次联合创新研讨会。

此次研讨会由许胤龙教授主持,计算机学院副院长陈恩红教授、网络信息中心主任李京教授、信息学院洪佩琳教授、计算机学院副院长孙广中副教授、华为网络技术实验室主任张小俊、华为中央研究院技术合作部部长张建虹、华为网络技术实验室首席技术专家李宗鹏,华为网络技术实验室副主任韩磊、计算机学院和信息学院的部分师生、华为网络技术实验室的多名专家参加了这次联合创新研讨会。

与会专家合影

许胤龙教授主持研讨会

计算机学院副院长陈恩红教授向华为公司的各位专家表示热烈的欢迎,对华为公司取得的举世瞩目的成就表示崇高的敬意。对双方成立联合创新研究中心、开展长期的合作研究表示祝贺,相信在双方的共同努力下,一定会做出优异的科研成果。

陈恩红副院长致辞

华为网络技术实验室张小俊主任对中国科大承办了这次研讨会表示衷心的感谢,对中国科大的学术声誉与科大师生踏实肯干的科研精神给予了高度评价。张主任还向与会人员介绍了华为2012实验室-中央研究院-网络技术实验室,祝贺这次研讨会的成功举办,并表达了对联合创新中心的期待。

张小俊主任致辞

张建虹部长简要介绍了华为中央研究院,并概要介绍了华为与高校的科研合作、人才联合培养与技术联合攻关、华为合肥研究分部等方面的情况。他表示华为在数据中心网络与存储系统方面有长期的科研与技术积累,有国际竞争力的产品,技术力量雄厚。中国科大在网络、存储与分布式系统方面做出了国际前沿的科研成果,双方优势互补,一定能够做出有重要影响力的成果。

张建虹部长致辞

在研讨会上华为技术专家周洪、孟柯博士、吴涛和孙文昊博士,中国科大许胤龙教授、孙广中副院长、李诚特任研究员、李永坤副教授,两位博士生张红杰、魏文佳就各自的工作做了汇报,与会专家与师生进行了充分的讨论,使得双方能够充分了解,为下一步的深度合作打下了良好的基础。

报告人

报告结束后,双方对未来可能的合作方向、合作方式等方面展开了充分的讨论。在讨论会上,李京教授简介了中国科大网络信息中心与超算中心的设备运行、科研支撑以及科研成果等。

研讨会现场

ADSL部分师生参加SIGCOMM 2019国际会议

2019年8月20-22日,全球网络通信领域顶级会议ACM SIGCOMM 2019在北京举办,正值互联网诞生五十周年,ADSL实验室李诚老师,吕敏老师与实验室部分本硕博同学一起赴京参加会议。

实验室学生合影

SIGCOMM是网络通信领域的顶级会议,此次参会同学们除了了解最前沿的研究报告外,也获得了与国内外研究者进行学术交流的好机会,李诚老师也为大家布置了交流任务。

与研究者交流的任务

合影

合影

合影

合影

合影

在回到实验室后,实验室白有辉同学代表参会同学们为大家分享了本次参会的经历,并介绍了几篇会上了解到的或是十分扎实,令人信服,或是十分精妙,让人耳目一新的前沿研究。

白有辉同学在组会上分享

总结与体会

同学们对实验室和老师们给予的这次参与国际顶级会议的机会十分珍惜与感谢,也受到鼓励继续努力科研,争取做出更好的成果,将ADSL展示到更好的舞台!

实验室师生参加2018中国图灵大会和ChinaSys会议

中国图灵大会(ACM TURC 2018)与2018年5月18-20日在中国上海举行,此次ACM图灵学术盛会以“引领人工智能 创造无限可能”为主题,举行了包括几位ACM图灵奖得主在内的特邀报告、主题论坛、专题论坛、演示和展览等多种形式的交流活动。与此同时, ChinaSys系统会议也于此同期举行,我们实验室有李永坤老师和李诚老师,还有郭帆、陈友旭、白有辉、田成锦和汪睿同学,师生共计7人赴沪参会。
Continue reading

三项成果被计算机系统重要国际会议USENIX ATC和HotStorage收录

在实验室老师、同学及其他合作者的共同努力下,本实验室三项成果分别被计算机系统领域重要国际会议USENIX ATC 2018(CCF A类)和计算机存储领域重要workshop HotStorage收录。其中USENIX ATC长论文两篇,HotStorage论文一篇。向所有合作者、参研老师和同学表示祝贺!也向他们表示衷心感谢!

Continue reading

实验室师生参加计算机系统顶会ACM SOSP

第一部分 参会概要

2017年10月28日至31日,第26届ACM操作系统原理座谈会(Symposium on Operating Systems Principles, SOSP )在中国上海召开,这是计算机系统领域的顶级会议。本次会议,我们实验室有李永坤老师和李诚老师,还有陈友旭、白有辉、陈吉强、汪睿和苏景波同学,师生共计7人赴沪参会。

Continue reading