博士生优秀论文论坛
论坛主席:
毛波(厦门大学) 陈榕(上海交通大学)
论坛主席简介:
毛波,博士,厦门大学信息学院软件工程系副教授。中国计算机学会CCF信息存储专业委员会委员,主要研究方向为云存储、重复数据删除、闪存存储和新型非易失内存技术等。先后承担了国家自然科学基金项目和多项华为委托开发项目等,在CCF推荐会议和期刊上发表论文50多篇,包括FAST、ICS、ICDCS、MSST、IPDPS、SRDS、ICCD、DATE和IEEE/ACM会刊等,并担任多个国际会议和期刊的审稿人。
陈榕,上海交通大学教授。主要研究方向为大数据系统框架、并行与分布式计算、操作系统等。在OSDI、SOSP、NSDI、EuroSys、UsenixATC、ACM TOCS等计算机系统领域重要会议与期刊上发表论文30余篇,并获得了EuroSys等三项国际会议最佳论文奖。受邀多次担任OSDI、ASPLOS、EuroSys、UsenixATC、VEE等重要学术会议程序委员会委员。曾荣获2018年教育部技术发明一等奖、2019年上海市技术发明一等奖,以及2020年华为奥林帕斯先锋奖,并获2020年度“国家重大人才工程”青年学者岗位支持。
论坛议程:
时间 |
主题 |
讲者 |
地点 |
||||||
12月12日 下午 |
13:30-13:35 |
论坛介绍 |
四楼-雨荷厅 |
||||||
13:35-14:00 |
用户态与内核态协同的持久性内存文件系统 |
陈游旻 清华大学 |
|||||||
14:00-14:25 |
Characterizing and Optimizing Remote Persistent Memory with RDMA and NVM |
魏星达 上海交通大学 |
|||||||
14:25-14:50 |
高并发低延迟的内存系统组织模式 |
陈章玉 华中科技大学 |
|||||||
14:50-15:15 |
实现均衡I/O性能的差异化键值存储管理 |
刘朕 中国科学技术大学 |
|||||||
15:15-15:40 |
The Dilemma between Deduplication and Locality: Can Both be Achieved? |
邹翔宇 哈尔滨工业大学(深圳) |
|||||||
15:40-16:00 |
茶歇 |
||||||||
16:00-16:25 |
ParaX:一种多核CPU上的深度学习加速方法 |
尹路珈 国防科技大学 |
|||||||
16:25-16:50 |
Boosting Full-Node Repair in Erasure-Coded Storage |
林诗尧 厦门大学 |
|||||||
16:50-17:15 |
AI Native Storage |
张霁 2020年度华为天才少年 |
|||||||
17:20-18:00 |
Panel 交流 |
报告及嘉宾简介:
报告1:
嘉宾简介:陈游旻,清华大学计算机系博士五年级学生,研究方向包括基于新型硬件(持久性内存、RDMA、可编程硬件等)的存储系统设计,数据中心尾延迟优化,硬件安全等。在CCF A类会议FAST、ASPLOS、VLDB、DAC,B类会议EuroSys,CCF A类期刊ACM TOS、IEEE TC等发表论文十余篇,一作论文8篇;获CCF科学技术奖技术发明一等奖(个人排名第2)、华为奥林帕斯奖(个人排名第3)、2020年国家奖学金等;2019-2020年在美国威斯康星大学麦迪逊分校访学一年。
报告题目:用户态与内核态协同的持久性内存文件系统
报告摘要:持久性内存访问延迟极低,这使得内核态文件系统的软件开销日益凸显。近年来,多项工作(例如Aerie、Strata、ZoFS等)提出将文件系统直接部署在用户态,从而避免陷入内核导致的软件开销。然而,上述两类方案却忽视了文件系统的多核扩展性这一重要性能指标。为此,本文提出了一种用户态与内核态协同的持久性内存文件系统架构Kuco;通过引入协同索引、两级锁、版本读等技术,Kuco将索引查询、并发控制等耗时操作从内核态卸载到了用户态。实验显示,基于Kuco架构的文件系统同时具有高性能、高可扩展性和高安全性等特点。
报告2:
嘉宾简介:魏星达,目前是上海交通大学并行与分布式研究所的在读博士。他分别在2015年以及2017年从上海交通大学获得本科以及硕士学位。他的研究方向主要在分布式存储系统;特别的,关注如何利用新型硬件技术如RDMA,HTM和NVM以及如何采用更好的算法来提升现有分布式系统软件的性能。他曾获得2017年Intel奖学金以及2018年微软亚洲学者。论文曾发表在知名学术会议,如SOSP,OSDI,ATC以及NSDI上。
报告题目:Characterizing and Optimizing Remote Persistent Memory with RDMA and NVM
报告摘要:随着可持久化内存NVM的出现和新型网络硬件RDMA的普及,人们开始广泛利用他们去构建新一代的分布式系统。然而,先前这类系统要么基于模拟的NVM去设计,要么完全没有考虑真实NVM的性质;这导致了开发人员很难判断这些系统是否适能完全利用好真实NVM硬件的高性能。 本报告从一个系统化研究的角度总结了如何最优的基于RDMA和真实NVM进行系统设计。报告按系统配置,访问模式和针对RDMA的优化这三方面,全面的展示了如何进行系统设计以利用好真实NVM硬件的全部性能。基于本报告的内容,现有开发人员能更好的针对RDMA和真实NVM开发下一代分布式系统、或对现有系统进行优化以更好的适配真实NVM硬件。作为参考,报告考察了两个先前基于RDMA和NVM设计的系统,一个分布式事务处理系统(DrTM+H)和一个分布式文件系统(Octopus)。我们发现他们在真实NVM中均无法获得最好的性能。利用本报告总结的方案对他们进行优化能给他们带来1.2-2.4倍的性能提升。
报告3:
嘉宾简介:陈章玉,华中科技大学博士研究生,师从华宇教授。主要研究领域为持久内存系统和云存储系统等,相关研究工作发表在计算机学会A类国际会议USENIX ATC 2019/2020和DAC 2020等,受邀请在ChinaSys 2019/2020、NVMSA 2020作学术报告,曾获USENIX ATC 2019 Student Grant、DAC 2020 Young Student Fellow、2020年国家奖学金,担任OSDI 2020 Artifact Evaluation Committee Member和IEEE NAS 2019 Web Chair。
报告题目:高并发低延迟的内存系统组织模式
报告摘要:随着内存设备的普及和广泛应用,具有高并发低延迟优势的哈希数据组织模式正成为内存系统提升性能的关键所在。并发哈希结构能够提供单点常数级别的查询时间复杂度,然而写操作需要解决高延迟的哈希冲突问题。另一方面,哈希表的扩容也容易降低索引的查询性能,用于并发控制的锁进一步限制了系统的并发性能。为解决上述问题,提出了针对DRAM的并发布谷鸟哈希(CoCuckoo)和针对持久内存的崩溃一致、无锁并发的哈希索引(Clevel Hashing),探讨了哈希索引在高并发以及低延迟方面的设计方法。同时,针对多媒体应用等特定数据,提出了利用数据容错特性进行近似压缩(SimCom)的方法,在内存控制器中能够降低持久内存写延迟,提升系统的存储效率。
报告4:
嘉宾简介:刘朕,中国科学技术大学,高性能计算中心(合肥),计算机系统结构专业,硕士二年级。导师:许胤龙教授、李永坤副教授。主要研究方向为高性能键值存储系统,新型存储介质(NVM)。在CCF-A类会议ATC发表论文一篇,参与国家自然科学基金面上项目并担任骨干。
报告题目:实现均衡I/O性能的差异化键值存储管理
报告摘要:键值(KV)存储主要采用LSM树作为管理KV对的核心数据结构,但存在较高的写放大和读放大问题。现有优化通常在不同性能目标(比如读写)之间进行权衡,无法同时实现高效的写入,读取和范围查询。为了实现更好的均衡性能,我们提出了DiffKV,其核心思想是基于KV分离,将Key和Value的有序性进行解耦并差异化管理。 DiffKV使用传统的LSM树以完全有序的方式管理Key,同时设计了新的树形结构vTree管理Value,通过维持Value数据的部分有序实现写入性能与范围查询的均衡,并采用与LSM-tree 松耦合的协同方式来管理vTree,降低维持有序性的开销。此外,通过结合KV大小的分布特性,采用细粒度的KV分离,实现混合工作负载下的性能均衡。原型系统的实验表明,DiffKV在各个性能维度上,基本都能达到与现有最优技术相近的性能表现。
报告5:
嘉宾简介:邹翔宇,分别于山东大学和中国科学技术大学获得数学与应用数学和软件工程的本科和硕士学位,现为哈尔滨工业大学(深圳)计算机科学与技术学院在读博士。主要研究方向为去重系统,有损压缩等,在FAST,ICDE,TPDS,ICPP,Cluster,MSST等CCF-A/B类期刊和会议上发表多篇论文。
报告题目:The Dilemma between Deduplication and Locality: Can Both be Achieved?
报告摘要:数据去重技术已经被广泛地应用在了备份存储等领域中,它通过让数据负载之间共享重复的部分,从而减少整体的存储开销。然而,这样的共享会破坏数据负载的局部性,这一方面导致了数据恢复速度慢,无法发挥出存储介质的理想性能;另一方面在删除数据负载之后必须进行复杂且缓慢的垃圾回收。在本项研究中,我们对于保持数据负载局部性的问题进行了新的抽象,提出了以数据生命周期为依据的数据排布,并以此为中心设计了新的去重系统。实验表明新的系统在数据恢复速度上几乎可以达到存储介质的极限;另外,新的系统还支持立即的删除任意的数据负载,且不再需要复杂且缓慢的垃圾回收过程。
报告6:
嘉宾简介:尹路珈,国防科技大学博士研究生,主要研究方向为云计算与深度学习。作者从硕士阶段就开始对云计算相关课题进行研究,特别是对云端深度学习系统有着较深入的理解。作者于2017年参与研究ARM架构上的CPU的深度学习加速问题,后来将这些经验扩展到x86架构上,研究成果发表在VLDB。作者的研究范围还涉及云端的异构计算、存储系统、信息安全等方面。
报告题目:ParaX:一种多核CPU上的深度学习加速方法
报告摘要:在深度学习领域,尽管目前GPU和其他加速器比CPU更有效率,但许多商业云上仍然大量使用CPU,因为在非高峰期会有大量的CPU闲置。跟着这一趋势,CPU开发者不仅发布了更高性能的CPU,也开发了更高效的数学支持库,但是,现在的主流框架并不能很好地在多核CPU上扩展性能。我们分析了CPU端深度学习任务的访存模式,并发现了其低扩展性的原因:目前的单实例计算会强制所有核心在深度神经网络的每一层进行同步,在执行访存密集型操作时,核心的并发导致了严重的访存竞争和CPU饥饿。这篇论文提出了一种名为ParaX的新方法,通过平摊访存带宽来缓解核心并发带来的访存瓶颈问题,可以有效加速多核CPU上的深度学习任务。我们的核心思想是在每个核心上释放一个实例,而不是之前整个CPU一个实例的方法,这样可以解除所有核心在计算网络层时的强制同步。ParaX设计了一种超轻量级的实例调度方法,使得计算密集型操作与访存密集型操作可以被叠加起来执行,以消除访存竞争。ParaX还提出了一种新的适用于NUMA架构的梯度服务器方法来支持高效的基于共享内存的核心间参数同步方法。实验证明,ParaX可以在CPU上取得很好的深度学习加速效果。
报告7:
嘉宾简介:林诗尧,厦门大学计算机系硕士二年级。研究方向为分布式存储系统的可靠性,目前从事纠删码存储系统中的数据修复优化问题的研究。一篇论文被CCF-A类会议ATC录用。
报告题目:Boosting Full-Node Repair in Erasure-Coded Storage待建设...
报告摘要:纠删码是当今存储系统中常见的一种低存储、高可靠的容错手段,但其修复性能受到大量修复流量的严重阻碍。近年来的一些工作通过设计新型纠删码或单条带修复算法来提升修复性能,但是经过分析发现,这些方法直接应用在全节点修复上会受到若干限制。针对这个问题,我们设计了一种通用的调度框架RepairBoost以协助现有的线性纠删码和单条带修复算法提高全节点修复性能。RepairBoost基于三个设计原语:修复抽象,使用特定的有向无环图来描述单个块的修复过程;修复流量平衡,平衡系统中各节点上传和下载的修复流量负载;传输调度,调度数据块的传输顺序,以尽量饱和地占用各个时刻系统中节点的上传和下载带宽。
报告8:
嘉宾简介:张霁,2020年博士毕业于华中科技大学武汉光电国家研究中心,目前就职于华为技术有限公司智能存储Lab,担任存储智能自优化技术专家,荷兰阿姆斯特丹大学INDE Lab博士后,特聘研究员,主要研究方向为存储系统智能化。于2019-2020年在美国纽约大学柯朗数学科学研究所访问。博士期间以第一作者在ATC、SIGMOD、VLDB、DAC、ICPP、IEEE TPDS、VLDBJ等国际会议和期刊上发表论文多篇,拥有国内、国际专利7项,荣获2020年ACM ChinaSys和SIGOPS优博奖。
报告题目:AI Native Storage
报告摘要:智能存储是使用包括人工智能 (AI) 技术在内的智能算法或技术进行数据驱动的存储系统或服务,可以通过持续学习来适应复杂混合存储世界,从而更好地为用户提高数据存储、管理。本报告主要分享学术界和工业界在智能存储领域的发展历程和对AI Native Storage的认识和期待。