实验室一项成果(BPart)被系统领域会议ICPP接收

我们实验室的自主完成的两个维度均衡的图划分算法BPart被计算机系统领域会议ICPP(CCF B类)收录。
论文:

论文题目:Towards Fast Large-scale Graph Analysis via Two-dimensional Balanced Partitioning

论文摘要:

分布式图计算系统需要将一个大图划分为多个子图,并将这些子图加载到集群中不同机器中进行计算。子图划分的好坏会极大的影响分布式图计算系统的计算效率。比如划分的均衡性(包括节点和边两个维度均衡)会极大影响分布式图计算的负载均衡;划分跨子图边数量会极大影响分布式图计算的通信开销。然而当前分布式图计算系统中采用的图划分算法通常只能实现节点均衡或者边均衡,或者能够实现两个维度均衡的算法,其跨子图边数量非常多。因此,在进行子图划分时,需要保证节点和边都划分均衡的同时尽可能地减小跨子图边地数量。

在本文中,我们提出保证节点和边两个维度均衡的划分算法BPart。他的核心思想是,首先将大图划分为多个小的子图,其数量远大于集群中机器的数量,并且在划分时通过设计复合的均衡性指标,使得每个子图中节点和边数量满足反比的关系;然后将这些小的子图按照节点或者边数量排序,并头尾组合为一个大的子图。通过多次的组合,BPart可以实现两个节点和边两个维度的划分均衡。我们将BPart集成到两个当前最优的分布式图处理系统KnightKing和Gemini中,并研究他们在执行图算法时的计算效率。通过实验对比,采用BPart作为划分策略可以减小不同图算法5%-70%的运行时间。

实验室一项成果(Optimal-LRC)被系统领域会议ICPP接收

我们实验室的自主完成的针对最优局部可恢复码(Optimal-LRC)的最优放置策略被计算机系统领域会议ICPP(CCF B类)收录。向各位参与研究工作的老师、同学表示祝贺。

论文题目:Repair-Optimal Data Placement for Locally Repairable Codes with Optimal Minimum Hamming Distance

论文摘要:

现代集群存储系统越来越多地采用纠删码来实现低冗余高可靠的数据存储。局部可恢复码(LRC)是一种在实际系统中被广泛应用的具有高恢复性能的纠删码。在各种LRC的构造中,Optimal-LRC是一种最近被提出的LRC构造,它能达到最优的最小汉明距离,同时恢复代价很低。Optimal-LRC将存储块划分成若干个局部组,并在每个组内增加一个局部校验块,使得任意单个块的恢复都能在一个组内完成。然而,Optimal-LRC在实际存储系统中的恢复性能如何仍是未知的。

在本文中,我们考虑Optimal-LRC在实际集群存储系统中的恢复问题。由于单个存储块的失效概率远高于多个存储块的失效概率,我们考虑单个块的恢复。我们发现传统的扁平数据放置和随机数据放置会在恢复过程中跨集群传输大量的数据,严重降低了数据恢复性能。因此,我们基于Optimal-LRC的容错能力,通过将每一个组的块放置于最少量的集群中,设计了一个最优的数据放置方案。该放置方案可以在保障容单集群故障的条件下,最小化单个块在恢复时所需的跨集群网络带宽。本文进一步在 Memcached上实现了一个基于Optimal-LRC的集群存储系统原型,并验证了本文放置方案的有效性。实验表明,相较于扁平放置和随机放置,最优放置方案可以将降级读时间分别降低83.3%和68.9%,并将恢复吞吐量分别提升7.7倍和5.6倍。

实验室李诚老师在第二届全国高校教师教学创新大赛安徽省赛中荣获佳绩

近日,第二届全国高校教师教学创新大赛安徽省省赛成绩揭晓,计算机学院李诚与徐伟老师组队参赛,喜获二等奖。

高校教师教学创新大赛是经教育部批准纳入《教育部直属单位三评一竞赛保留项目清单》中唯一一项高校教师教学竞赛活动。在教育部高教司指导下,大赛围绕“新工科、新农科、新医科、新文科”建设,聚焦高校“立德树人”的根本任务,总结推广一流专业、一流课程以及基层教学组织建设的创新成果。本届安徽省省赛由安徽省教育厅主办,安徽农业大学承办,共有45所高校292位教师(团队)参赛,经过层层选拔李诚老师团队荣获二等奖。

 

计算机学院高度重视教师教学创新比赛工作。按照学校的统一部署,积极选派资深教师对参赛团队进行一对一指导,覆盖课程设计、创新凝练、成果展示、报告撰写等关键环节。

李诚老师团队本次参赛课程是《编译原理和技术》,属于我院计算机本科专业核心课程。近年来,编译课程组的老师们积极推进教学改革与创新实践,取得了较为丰硕的教学研究成果,使该课程的理论和实践教学体系居国内领先地位。2020-2021年度,李诚与徐伟老师获得安徽省青教赛工科组一等奖、“智能基座”华为云与计算先锋教师等各类奖励17项,指导修读本课程的本科生、研究生助教参加各类学科竞赛取得了25项奖励,其中13项全国性奖励,5项冠军或一等奖,申请4项国内发明专利和1项软件著作权。

李诚老师团队将以本次教学创新大赛为契机,充分发挥大赛的示范引领作用,激发团队教师热爱教学、倾心教学、研究教学的热情,促进科研与教育的融合发展,推进教学创新与改革的步伐,全面提升编译课程教学质量。

 

 

许胤龙教授荣获2021年度高校计算机专业优秀教师奖

近日,经高校推荐、听课评审、会议评审、公示等程序,确定了2021年度高校计算机专业优秀教师奖励计划获奖人选名单,我院许胤龙教授成功入选。

许胤龙教授在中国科大任教逾30年,担任多门课程的教学工作,编著了中国科学技术大学校庆50周年精品教材《组合数学引论》(第二版,许胤龙、孙淑玲编著,中国科学技术大学出版社出版),该教材获得了中国大学出版社第二届优秀教材二等奖。编著了安徽省“十三五”规划教材《图论导引》(许胤龙、吕敏、李永坤编著,中国科学技术大学出版社出版)。他的《图论》、《组合数学》等课程,内容有趣,讲解清晰,要求严格,深受计算机学院与少年班学院学生喜爱。曾荣获2017、2008年度中国科学院朱李月华优秀教师奖、2014年度宝钢优秀教师奖、2006年度中国科学院优秀研究生指导教师奖等诸多教学奖励。

关于“高校计算机专业优秀教师奖励计划”

“高校计算机专业优秀教师奖励计划”是在教育部、国家自然科学基金委指导下,由图灵奖获得者、中国政府友谊奖获得者、中国科学院外籍院士约翰·霍普克罗夫特(John Hopcroft)教授与中国计算机学会原理事长、中国工程院院士高文教授共同发起,由部分具有重要社会影响力的高科技企业共同向中国教师发展基金会捐赠设立的民间公益性奖励计划,旨在奖励在计算机专业本科教学中,教学效果优异的老师。

许胤龙教授简介

许胤龙,中国科学技术大学计算机学院教授、国家教育部软件工程专业教学指导委员会委员、国家高性能计算中心(合肥)常务副主任、中国计算机学会信息存储技术专业委员会委员与高性能计算专业委员会委员。曾任中国科大计算机学院副院长。1983年于北京大学数学系获学士学位,1989、2004年于中国科大计算机系获硕士、博士学位。主持多项国家自然科学基金面上、国家863项目,参与多项国家973、国家自然基金重点、国家863重点、科技部重点研发计划等项目。曾获得国家级教学成果二等奖、安徽省教学成果特等奖与一等奖、宝钢全国优秀教师奖、中国科学院优秀指导教师奖等。指导的学生曾获得全国优秀博士论文提名奖、中国科学院优秀博士论文、阿里星等。

许胤龙教授主要研究方向有存储系统、数据处理、高性能计算等。目前,他领导的先进数据系统实验室(http://adsl.ustc.edu.cn)致力于以数据为中心的系统软件设计与优化,旨在构建融合高效数据存储、访问、计算为一体的先进数据系统,专注于大规模存储与文件系统、云计算与虚拟化、新型数据库系统、大数据处理系统、资源管理与调度等方向的研究。在USENIX FAST、ACM SOSP、USENIX ATC、VLDB、IEEE ICDE、ACM SIGMETRICS、IEEE INFOCOM、Spring WWW、ACM ToS、IEEE JSAC、IEEE TPDS、IEEE ToC、IEEE TCAD等国际顶级学术会议与学术杂志上发表了一系列高水平学术论文。

我实验室深度参与组织第21届中国计算机系统(ChinaSys)研讨会

2021年12月4日-5日,第21届中国计算机系统(ChinaSys)研讨会在厦门成功举办。本次会议由ACM SIGOPS ChinaSys主办,厦门大学和中科(厦门)数据智能研究院承办,商汤科技、上海人工智能实验室和华为技术有限公司赞助举办。此次研讨会的召开,得到了ACM SIGOPS ChinaSys主席、上海交通大学陈海波教授的悉心指导,本次研讨会由厦门大学/清华大学舒继武教授和中国科学院计算技术研究所包云岗研究员共同担任大会主席,由中国科学技术大学李诚研究员和厦门大学张一鸣教授共同担任程序委员会主席。

经过精心筹备,此次研讨会共有6个Keynote,11个Session,34个Talk。由于受突发疫情的影响,研讨会以线上方式(包括腾讯会议和B站)开展。据统计,此次研讨会高峰时刻,腾讯会议有超过200人同时在线,而B站同时围观人数超过8000人。同时,来自厦门大学和厦门市各科研院所的50多名教师、研究人员和学生在线下(厦门大学校内)参加了会议。此次研讨会的讲者遍布世界各地,包括威斯康星麦迪逊分校、电子科大、清华大学、北京大学、中国科学技术大学、国防科大、上海交通大学、华东师范、南开大学、天津大学、厦门大学、乔治梅森大学、卡塔尔计算所、中科院计算所、中科院深圳先研院、香港大学、中国人民大学、华南师范、微软亚洲研究院等来自学术界的系统研究者,和商汤、华为、一流科技等来自工业界的系统开发者和使用者。本次研讨会针对云计算、数据存储、神经网络、Serverless、系统安全、并行计算、可靠性、面向系统的AI等计算机系统领域展开深入交流。

除李诚老师担任程序委员会共同主席外,实验室李永坤老师担任本次会议的程序委员会委员,博士生白有辉在线报告了新近发表在SOSP会议上的HiPress工作,朱嘉安、苏景波、张钏楠及周泉等四位同学参与了大会的志愿者服务工作。

ChinaSys新闻链接:https://chinasys.org/doku.php?id=2021-12-07

安徽省科技成果转化促进会大数据与人工智能专业委员会成立,许胤龙老师任首任主任委员并做“大数据系统的数据墙问题”的主题报告

2021年11月20日,安徽省科技成果转化促进会大数据与人工智能专业委员会成立大会暨安徽高校信创及人工智能科技成果转化产学研高峰论坛在合肥举行。

中国科学院院士、并行算法及高性能计算专家、国家高性能计算中心(合肥)主任陈国良,中国科学院院士、中国科学技术大学合肥微尺度物质科学国家实验室纳米材料与化学研究部主任、安徽省科技成果转化促进会理事长俞书宏,全国政协原常委、安徽省政协原副主席方兆本,全国政协原常委、安徽省政协原副主席王鹤龄,安徽省科学技术协会党组书记王洵,安徽省政协原常委、安徽省安监局原副局长朱志林,安徽省政协原副秘书长汪沪敏,安徽省委组织部原副部长汪文庆,合肥工业大学党委常委、副校长季益洪,安徽理工大学副校长董雨,安徽科技学院副校长李升和出席大会。大会指导单位合肥市数据资源局代表王文韬副局长,承办单位安徽中科信创科技有限公司代表成刚董事长、杨磊总经理,全省各高校、科研院所及企业的领导和专家学者等200余人参加了大会。

大会上,俞书宏理事长介绍了专委会成立背景及工作目标,陈国良院士、俞书宏院士、方兆本副主席、王鹤龄副主席、朱志林常委、王洵书记为专委会揭牌,安徽省科技成果转化促进会党委书记曹威麟宣读专委会首届领导班子名单:陈国良院士任名誉主任委员,国家高性能计算中心(合肥)常务副主任许胤龙任主任委员,安徽师范大学计算机与信息学院罗永龙院长、安徽理工大学人工智能学院王成军院长、安徽大学计算机科学与技术学院吕钊副院长、云从科技集团联合创始人姚志强先生、龙芯中科股份彭飞博士等五人任副主任委员,中国科学技术大学计算机科学与技术学院李永坤副教授任秘书长。许胤龙教授发表当选感言,陈国良院士、王洵书记等嘉宾分别致辞。

(大数据与人工智能专业委员会揭牌)
安徽省科技成果转化促进会大数据与人工智能专业委员会成立旨在扎根行业,实践落实科教兴皖、人才强省和促进科学技术与经济结合,遵循国务院《新一代人工智能发展规划》的重大决策部署及《国家中长期科学与技术发展规划纲要》等相关任务,针对数据科学、数据挖掘、机器学习、深度学习、物联网感知及云计算等前沿重点领域的主要热点和应用技术开展科研及产学研协同工作。

俞书宏理事长在介绍专委会成立背景及工作目标中指出,此次大数据与人工智能专业委员会的筹备和成立,寄托着安徽省科技成果转化促进会专家顾问及各行业科研有识之士的厚望,期待其能为安徽未来经济发展、数据应用、数据挖掘、人工智能核心技术突破、智能化转型应用等方面起到良好的推动作用。

(俞书宏院士致辞)
当选大数据与人工智能专业委员会主任委员的许胤龙教授表示,专委会将在省科技厅、省科协、科促会的指导和监督下,依靠专委会全体委员集体的力量,聚集人才,整合资源,发挥各方优势,在大数据人工智能领域的科技成果转移转化方面扎实工作,为我省科技成果转化创新发展贡献力量。

(许胤龙教授讲话)
专委会名誉主委陈国良院士在致辞中说,在当前我国经济从高速增长向高质量发展的重要阶段中,以大数据、人工智能为代表的新一代信息技术,将成为我国”十四五”期间推动经济高质量发展、建设创新型国家,实现新型工业化、信息化、城镇化和农业现代化的重要技术保障和核心驱动力之一。省科促会大数据与人工智能专业委员会应运而生、恰逢其时,必将大有作为。

(陈国良院士致辞)
作为安徽省科技成果转化促进会的业务主管单位领导,王洵书记在致辞中强调,当前,我省正处在高质量发展的关键阶段,比以往任何时期都更加需要科技创新的支撑。科促会作为省科协所属学会中唯一从事科技成果转移转化的省级学会,要深入学习贯彻党的十九届六中全会精神和习近平总书记关于科技创新的重要论述精神,认真落实省第十一次党代会决策部署,组织动员广大科技工作者,勇当高水平科技自立自强排头兵,积极投身安徽科技创新攻坚力量和成果转化运用体系建设。科促会及专委会要发挥人才组织优势和平台作用,一手牵着科学家,一手牵着企业家,将更多的创新成果转化为现实生产力;要聚焦安徽三地一区建设,围绕科技成果转化体制机制问题开展调查研究,积极建言献策,为党委政府科学决策服务;要加强科技成果评估评价,汇聚更多的创新成果,服务更多的企业;要加强促进会自身建设,特别是要培育一批专职的科技经理人队伍,不断增强服务科技成果转化运用的硬实力,为建设经济强、格局新、环境优、活力足、百姓富的现代化美好安徽作出积极贡献。

(王洵书记致辞)
当天下午,2021安徽高校信创及人工智能科技成果转化产学研高峰论坛同时举行,高峰论坛由安徽省科技成果转化促进会秘书长吴济贫主持。来自著名高校、企业研发机构的专家以“信创与人工智能发展”为主题,围绕相关领域技术创新研究、人工智能应用场景成果转化、人才培养与成长等议题展开主题演讲。

中国科学技术大学陈恩红教授演讲主题《大数据分析现状与趋势》,中国科学技术大学许胤龙教授演讲主题《大数据系统中的“数据墙”问题》,龙芯中科彭飞博士演讲主题《高校信创人才培养与产学研创新展望》,云从科技联合创始人吴媛女士演讲主题《人工智能在高校应用分享》,腾讯教育陈晓梅女士演讲主题《关于高校人工智能创新人才培养及产学研合作实践之旅》,紫光恒越副总裁鲁大欣演讲主题《高校信创数字化转型探讨》
演讲嘉宾从不同角度围绕“大数据、人工智能、高校信创”阐述观点,着重分析如何依托数字化,提升产业发展的创新能力。最后,参会专家均表示,下一步将保持密切联系,持续加强交流,为加快推进高校信创、大数据和人工智能产业建设贡献力量,共创数字时代美好未来。

实验室一项成果(SelectiveEC)被计算机存储系统领域顶级期刊(TPDS)接收

我们实验室在纠删码存储系统中设计修复流量调度算法的工作被计算机存储系统领域顶级期刊IEEE Transactions on Parallel and Distributed Systems(TPDS, CCF A类)接收。向各位参与研究工作的老师、同学表示祝贺。

论文题目:SelectiveEC: Towards Balanced Recovery Load on Erasure-coded Storage Systems.

纠删码 (EC) 以低存储成本提供高数据可靠性。当发生故障时,批量修复丢失的数据块。由于故障修复任务分批进行,一批内的修复数据分布不均衡,另外随机选择修复任务的源节点和替待节点,使得修复任务在一批内负载不均衡,这严重减慢了故障修复速度。为了解决这个问题,我们提出了SelectiveEC,这是一种新的修复任务调度模块,可为基于 EC 的大规模存储系统提供可证明的网络修复流量的负载平衡。它依赖于二部图来构造修复任务与幸存节点之间的图模型,然后使用完美或最大匹配等理论,并仔细确定地读取幸存块或存储修复块的节点,动态地选择任务以形成批处理。 SelectiveEC支持单节点故障和多节点故障修复,可以部署在同构和异构网络环境中。我们在HDFS中实现SelectiveEC,并在18节点的本地集群和50个虚拟机实例的AWS EC2中评估其修复性能。与同类网络环境中的最先进方法相比,SelectiveEC 将修复吞吐率提高了30.68%。由于均衡调度避免了重构时的掉队任务,它进一步实现了在异构网络环境中传统方法的1.32倍修复吞吐率。

实验室一项成果(DEPART)被存储领域顶级会议 FAST22 接收

经过持续两年的努力,我们ADSL实验室和香港中文大学Patrick P. C. Lee教授合作的DEPART被计算机存储系统领域顶级国际会议 FAST 2022 (CCF A类) 收录。向各位参与研究工作的老师、同学、合作者表示祝贺。

这项研究工作主要利用解耦的思想对分布式键值系统的多副本加剧I/O放大问题进行优化。在基于LSM-tree的分布式键值系统中,为了保证数据的高可靠并容错,多副本机制被广泛应用。然而,已有键值系统都采用统一的LSM-tree索引,对节点上的多副本数据进行统一存储,这会极大地加剧系统的读写放大。因此,我们首次提出在存储层对多副本数据进行解耦的思想,并设计差异化和有序度可调的存储结构进行管理,从而有效降低分布式键值系统的读写放大,并向用户提供可调的读写性能。

近年来,在ADSL实验室负责人许胤龙教授的带领下,我们实验室在计算机系统特别是在健值存储系统方向有了长期稳定的积累,已经连续两年在存储系统领域顶级国际会议 FAST发表键值存储方向的研究成果(在FAST21发表SpanDB),说明ADSL实验室的科研实力向着更高水平迈进。

此项工作得到了国家自然科学基金重点项目、科技部重点研发课题、双一流学科建设的资助,得到了国家高性能计算中心(合肥)、安徽省高性能计算重点实验室的平台支持!

论文题目:DEPART: Replica Decoupling for Distributed Key-Value Storage

论文摘要:Modern distributed key-value (KV) stores adopt replication for fault tolerance by distributing replicas of KV pairs across nodes. However, existing distributed KV stores often manage all replicas in the same index structure, thereby leading to significant I/O costs beyond the replication redundancy. We propose a notion called replica decoupling, which decouples the storage management of the primary and redundant copies of replicas, so as to not only mitigate the I/O costs in indexing, but also provide tunable performance. In particular, we design a novel two-layer log that enables tunable ordering for the redundant copies to achieve balanced read/write performance. We implement a distributed KV store prototype, DEPART, atop Cassandra. Experiments show that DEPART outperforms Cassandra in all performance aspects under various consistency levels and parameter settings.

实验室一项成果被INFOCOM 2022收录

论文题目:Optimal Data Placement for Stripe Merging in Locally Repairable Codes.

论文摘要:纠删码技术因具备优秀的存储性能而被广泛部署于当今集群存储系统中。纠删码将数据存储为数量众多的条带;每个条带包含数据块和校验块,并被放置于多个机架的多个物理节点上。在众多种纠删码策略中,局部可修复码(LRC)是一类被广泛采用的、具有高效修复性能的纠删码。为了有效响应业务负载的动态性能和可靠性需求,存储系统需要对纠删码数据进行容错转换,即改变纠删码的编码参数,以实现不同的访问性能和数据可靠性。因此,如何提高LRC码的容错转换性能,是一类非常重要的问题。
在本文中,我们采用条带合并的方式来实现LRC码的容错转换,即通过合并多个小的LRC条带,形成一个大的LRC条带。通过条带合并,系统可以实现更高的存储效率及更高的可靠性。然而,我们指出,多个小LRC条带的随机放置策略,会在容错转换时引起巨大的跨机架网络负载。因此,我们基于LRC码的节点与机架级别容错能力,通过仔细决定哪些小条带的数据需聚集于同一机架、哪些数据需分散于多个机架,进而为多个小LRC条带设计了一个最优放置方案。该放置方案在容错转换时可以实现最小化的跨机架网络传输开销,同时也维持了转换前后的修复效率。本文进一步设计实现了一个基于LRC码的集群存储系统原型,并验证了本文放置方案的有效性。实验表明,相较于随机放置策略,最优放置方案能将容错转换时间减小43.2%。

实验室李诚老师荣获安徽省第五届青年教师教学竞赛工科组一等奖

9月23日至26日,由安徽省总工会、安徽省教育厅主办的安徽省第五届普通高校青年教师教学竞赛在巢湖学院举行,实验室李诚老师获得工科组一等奖。

本次竞赛以“上好一门课”为理念,由教学设计、课堂教学两部分组成,设立文科、理科、工科、医科、思想政治课专项五个组别,每个组别各设置一等奖5名(医科组3名)、二等奖10名(医科组6名)、三等奖若干名。来自全省45所高校的181名青年教师代表参与了本次竞赛决赛。我校选拔来自人文与社会科学学院、化学与材料科学学院、马克思主义学院、附属第一医院和计算机科学与技术学院的6名教师组成代表队,由教务处处长曾长淦担任领队。比赛中,我院李诚老师精神饱满,教态自然大方,讲课深入浅出,语言生动有趣,思路清晰,重点突出,展现了我校青年教师良好的精神风貌。最终,获得工科组一等奖。李诚老师取得的优异成绩充分展示了计算机学院青年教师的教学能力和水平,展现了青年教师的教学风采,激发了广大青年教师积极投入课堂教学和教学改革的热情。