DetailNews | ADSLAB

中国科大夺得2020华为开发者大赛MindSpore网络模型挑战赛两项金奖

Wed, 16 Dec 2020 16:21:58 +0800

9月26日，由华为公司主办的“华为开发者大赛MindSpore网络模型挑战赛”在上海世博中心举行隆重的颁奖仪式。MindSpore是华为开源的一款支持端边云全场景的深度学习训练推理框架，该赛事是由华为公司举办的首届面向MindSpore开源社区的开发者赛事。本次比赛吸引了来自北京大学、上海交通大学、浙江大学等高校的102支队伍共计443人参加，最终决出10个奖项，其中金奖三项。

在许胤龙教授和李诚特任研究员的指导下，计算机学院先进数据系统实验室组织了两支队伍参赛，分别是由周泉、许冠斌、马煜昕、杨承儒、于笑颜组成的ADSL007队，与由阮超逸、龚平、马凯、王海权组成的adsl-spore队。在近两个月的赛程中，同学们密切配合，攻坚克难，充分利用MindSpore混合精度、算子融合、数据下沉、自动并行等先进技术，在达到理想精度的同时，大幅度提升所实现神经网络模型的训练与推理性能。最终，ADSL007与adsl-spore队优异的表现获得华为技术评审专家的高度肯定，在各自的赛道上排名第一，获得了最高奖项——金奖。获奖作品已在官方网站上进行展播。

据了解，先进数据系统实验室长期致力于解决基础核心系统软件中最具挑战的难题，近年来，在智能计算系统方向进行了卓有成效的探索，在对算法、框架和硬件的协同优化方面做出了一系列优秀科研成果。这些积累为参赛队员们在此次大赛中取得优异成绩奠定了坚实基础。未来，该实验室将继续与国内企业开展深入合作，利用平台优势和日渐丰富的开源社区资源，做出有影响力的原创性成果。

实验室一项成果（SpanDB）被存储领域顶级会议 FAST 接收

Wed, 16 Dec 2020 16:21:58 +0800

经过持续两年的努力，我们实验室和卡塔尔QCRI马晓松老师合作的SpanDB被计算机存储系统领域顶级国际会议 FAST 2020 (CCF A类) 收录。向各位参与研究工作的老师、同学、合作者表示祝贺。

这项研究工作利用包括Intel Optane SSD在内的混合介质加速基于LSM-tree的主流健值存储系统。与以往工作不同，我们选择了比非持久性内存NVRAM更便宜且应用更广泛的NVMe SSD，目标是把此类SSD的全部潜力都释放出来，做到物尽其用。最终，加速效果在尾延迟、平均延迟、吞吐率等方面相较业界最新的成果有较为明显的提升。

近年来，在实验室负责人许胤龙教授的带领下，我们实验室在计算机系统特别是在健值数据库方向有了长期稳定的积累，这项工作的发表标志着我们已经突破了“成熟度壁垒”，科研实力向着更高水平迈进。

此项工作得到了国家自然科学基金重点项目、科技部重点研发课题、双一流学科建设、111协同创新、合肥市创新计划的资助，得到了国家高性能计算中心（合肥）、安徽省高性能计算重点实验室、超算中心的平台支持！

论文题目：SpanDB: A Fast, Cost-Effective LSM-tree Based KV Store on Hybrid Storage

论文摘要：键值（KV）存储广泛地应用在许多关键的应用程序和服务中。它们可以进行快速的内存处理，但是仍然经常受到 I/O 性能的限制。高速商用 NVMe SSD 的出现推动了基于超低延迟和高带宽SSD的新型KV系统的设计。但是，要切换到全新的数据结构并将整个数据库扩展到高端SSD，需要大量的资金投入。作为一种折衷方案，基于LSM树的 SpanDB，利用包括 fast NVMe SSD的混合介质加速基于LSM-tree的主流健值存储系统。与以往工作不同，SpanDB选择了比NVRAM便宜且应用更广泛的NVMe SSD，且目标是把此类SSD的全部潜能都释放出来。 SpanDB允许用户将大量数据托管在更便宜和更大的SSD（甚至HDD）上，同时将预写日志（WAL）和LSM树的顶层重新定位到更小，更快的高端 NVMe SSD 。为了更好地利用此NVMe SSD，SpanDB通过SPDK提供了高速并行WAL写入，并启用了异步请求处理以减轻线程间同步开销，并有效地使用基于轮询的I/O。最终，加速效果在尾延迟、平均延迟、吞吐率等方面相较业界最新的成果有较为明显的提升。

实验室主编新教材《图论导引》出版

Wed, 16 Dec 2020 16:21:58 +0800

实验室许胤龙、吕敏、李永坤三位老师主编的新教材《图论导引》在科学出版社现已在电子商务平台和当当上线。这本书分为基础知识与应用两部分，是几位老师结合三十多年计算机专业本科《图论》课程教学的实践经验编撰而成，不仅参考了国内外多本教材，而且在总结了图计算方面最新的研究成果。为提高学生的学习兴趣，本书从应用实例导入图论知识点，再介绍相关基础知识与基本理论，使学生更易理解。

实验室四项成果分别被计算机系统顶级会议ATC、通信网络顶级会议INFOCOM、系统结构领域顶级期刊TPDS和存储领域重要workshop HotStorage收录

Thu, 30 Apr 2020 23:21:37 +0800

在做好疫情防控工作的同时，ADSL不忘科研工作，在实验室老师、同学及其他合作者的共同努力下，近期本实验室又有四项成果分别被计算机系统顶级会议 ATC、通信网络顶级会议 INFOCOM、系统结构领域顶级期刊TPDS和存储领域重要workshop HotStorage收录，向所有合作者、参研老师和同学表示祝贺！也向他们表示衷心感谢！

这四项成果分别涉及系统研究领域中的的图系统与纠删码两个重要热点，以下是论文介绍：

论文一：

Rui Wang, Yongkun Li, Hong Xie, Yinlong Xu, John C. S. Lui, GraphWalker: An I/O-Efficient and Resource-Friendly Graph Analytic System for Fast and Scalable Random Walks, ATC20

摘要：

传统的图系统主要采用基于迭代的模型来迭代地加载图数据库进入内存进行分析处理，以此减少随机I/O。但是这种基于迭代的模型在支持基于随机游走的应用时体现出受限的效率和可扩展性。本文提出一个专门为随机游走设计的I/O高效的图系统GraphWalker，采用一种新奇的基于walk状态感知的I/O模型和一种异步的walk更新方式，来加速随机游走的执行。GraphWalker可以仅使用一台普通的机器来高效地处理含数千亿条边的磁盘驻留图，也可以高效并发地运行数百亿条成千上万步的随机游走。我们实现的原型系统上的实验表明，GraphWalker对比于专有的随机游走系统DrunkardMob和最新的单机图处理系统Graphene和GraFSoft，都能实现超过一个数量级的性能提升。另外，对比于最新的运行于一个分布式集群的专有的随机游走系统KnightKing，GraphWalker仅使用一台机器就能实现相当的性能，因此GraphWalker是一个更具有成本效益的选择。

论文二：PDL: A Data Layout towards Fast Failure Recovery for Erasure-coded Distributed Storage Systems. Liangliang Xu, Min Lv, Zhipeng Li, Cheng Li and Yinlong Xu. University of Science and Technology of China. To appear in the Proceedings of IEEE International Conference on Computer Communications (INFOCOM 2020), Virtual Conference.

概要：纠删码在分布式存储系统(DSSes)中越来越受欢迎，因为它以低的存储开销提供了高可靠性。然而，传统的随机数据放置方式在故障恢复过程中会造成大量的跨机架流量和严重的负载不平衡，严重影响恢复性能。此外，在DSS中共存的各种纠删码策略加剧了上述问题。在本文中，我们提出了一种基于成对平衡设计（PBD）的数据布局PDL来优化DSSes中的故障恢复性能。基于PBD组合设计的性质，PDL给出了统一的数据布局。在此基础上，提出了一种基于rPDL的故障恢复方案。rPDL通过均匀选择替代节点和检索确定的可用块来恢复丢失的块，有效地减少了跨机架流量，并提供了几乎平衡的跨机架流量分布。我们在Hadoop 3.1.1中实现了PDL和rPDL。实验结果表明，与现有的HDFS数据布局相比，rPDL平均减少了62.83%的降级读延迟，提供了6.27倍的数据恢复吞吐量，为前端应用提供了更好的支持。

论文三：Deterministic Data Distribution for Efficient Recovery in Erasure-Coded Distributed Storage Systems. Liangliang Xu, Min Lyu, Zhipeng Li, Yongkun Li and Yinlong Xu. University of Science and Technology of China. IEEE Transactions on Parallel and Distributed Systems (TPDS 2020) accepted.

概要：由于单个不可靠的商品组件，故障在大型分布式存储系统中很常见。纠删码广泛应用于实际的存储系统中，以提供低存储开销的容错能力。然而，随机数据分布(RDD)通常用于纠删码存储系统，它会导致严重的跨机架流量、负载不平衡和随机访问，从而对故障恢复产生不利影响。在本文中，利用正交矩阵，定义了确定性数据分布(D3)，使数据/校验块均匀分布于节点之间，并提出了一种基于D3的高效故障恢复方法，使单节点故障下的跨机架修复流量最小化。由于D3的均匀性，所提出的恢复方法不仅可以平衡机架内节点之间的修复流量，还可以平衡机架之间的修复流量。我们在有28台节点的Hadoop分布式文件系统(HDFS)中实现了基于D3的Reed-Solomon 码和Locally Repairable Codes码。与RDD相比，我们的实验表明，D3显著提高了RS码的故障恢复速度，达到了2.49倍；并降低了LRCs的故障恢复速度，达到了1.38倍。此外，D3在正常和恢复状态下都比RDD更好地支持前端应用程序。

论文四：SelectiveEC: Selective Reconstruction in Erasure-coded Storage Systems. Liangliang Xu, Min Lyu, Qiliang Li, Lingjiang Xie and Yinlong Xu. University of Science and Technology of China. To appear in the Proceedings of 12th USENIX Workshop on Hot Topics in Storage and File Systems (HotStorage 2020), BOSTON, MA, USA.

概要：纠删码是一种以低存储成本提供高可靠性的通用存储策略。但是，在一批的重构任务中，倾斜的负载严重减慢了存储系统的故障恢复过程。为此，我们提出了一个平衡的调度模块SelectiveEC，它通过动态地选择一批的重构任务，并为每个重构任务选择源节点和替代节点，从而打乱重构任务的顺序。因此，在纠删码存储系统中，它实现了针对单节点故障的网络恢复流量、计算资源和磁盘I/Os的负载均衡。在我们的模拟实验中，与传统的随机重构相比，SelectiveEC将恢复过程的并行度提高到106%，平均提高97%。因此，SelectiveEC不仅加快了恢复过程，而且减少了故障恢复对前端应用程序的干扰。

除了上述四项被接受的成果外，近期也有其他成果虽然投稿被拒，但值得欣慰的是，每一篇稿件都收获了同行业国际专家不同程度的认可，以及极富建设性的修改意见。希望ADSL的同学们继续努力不断进步，完善自己的工作以获得更多、更好的成果。

ADSL实验室16级博士生陈友旭顺利通过博士学位答辩

Fri, 29 Nov 2019 23:30:38 +0800

11月4日下午2点30分，在中国科学技术大学东校区高性能中心402会议室，举行ADSL实验室16级博士生陈友旭同学的博士论文毕业答辩。陈友旭同学在攻读博士学位阶段，研究工作主要聚焦在分布式文件系统元数据管理问题，并分别从元数据预取机制、元数据服务器集群负载均衡策略和元数据管理方案三个方面，探究现有分布式文件系统元数据管理问题中存在的问题，并加以优化来提升系统元数据存取性能。论文的主要工作和创新点如下：

设计了一种基于数据关联性的元数据预取机制SMeta，采用语法分析机制提取数据关联性，并将其存储在元数据扩展属性结构中，复用了现有元数据同步机制同时降低关联性更新开销。
提出了一种元数据服务器集群负载均衡策略Fim，在元数据服务器节点内采用消息队列机制传输消息以提升MDS通信速度，结合集群物理架构，引入节点内优先迁移方式来提升元数据迁移速度。在目标迁移目录选择方案中，结合系统负载特征动态选择迁移目录以提升元数据迁移效率。并且采用迁移消息与客户端请求并发处理机制和热迁移方式，避免了迁移操作对客户端元数据请求的阻塞。
提出了一种混合元数据管理方案SmartM2，针对多节点和节点内多MDS的元数据服务器集群架构，在节点间使用子树划分方案管理元数据保留了文件系统目录结构，在节点内多MDS间使用哈希映射方案提升负载均衡性能，实现元数据管理中目录局部性与负载均衡性能的高效权衡。

答辩委员会各位老师高度认可陈友旭同学所选研究课题的理论意义、应用价值和研究成果，并针对其研究工作中的方法设计和系统实现等方面的问题，提出了很多宝贵的建议，为陈友旭同学后序的研究工作提供了广泛的思路。经答辩委员会无记名投票，一致通过陈友旭同学的博士学位论文答辩，并建议授予博士学位。答辩结束后，答辩委员会与陈友旭同学进行合影。

陈友旭同学表示：“很感谢各位评审老师和答辩老师用其专业的知识给予论文宝贵的修改意见，感谢ADSL实验室许老师、李诚老师、李永坤老师和吕敏老师对我工作上的指导和建议！ ADSL是一个有爱的大家庭，在最好的年华教会了我成长，感谢实验室对我的培养！祝愿ADSL未来成果多多，越来越好！”

实验室三项成果分别被云计算领域顶级会议SoCC、数据库领域顶级会议 ICDE收录

Mon, 14 Oct 2019 23:33:04 +0800

近期，在实验室老师、同学们和其他合作者们的共同努力下，ADSL 实验室又有三项成果分别被云计算领域顶级会议ACM SoCC(CCF B类)、数据库领域顶级会议ICDE(CCF A类)录用。

首先，向各位参与研究工作的老师、同学、合作者表示祝贺，并感谢你们一直以来的辛勤工作和付出！

三项成果分别涉及容器优化、GPU调度、键值存储系统，摘要如下：

论文一：HP-Mapper: A High Performance Storage Driver for Docker. Fan Guo, Yongkun Li, Min Lv, Yinlong Xu, John C.S. Lui, University of Science and Technology of China. To appear in the Proceedings of the ACM Symposium on Cloud Computing 2019 (SoCC 2019), Santa Cruz, CA, USA.

概要：Docker containers are widely deployed to provide lightweight virtualization, and they have many desirable features such as ease of deployment and near bare-metal performance. However, both the performance and cache efficiency of containers are still limited by their storage drivers due to the coarse-grained copy-on-write operations, and the large amount of redundancy in both I/O requests and page cache. To improve the I/O performance and cache efficiency of containers, we develop HPMapper, a high performance storage driver for Docker containers. HP-Mapper provides a two-level mapping strategy to support fine-grained copy-on-write with low overhead, and an efficient interception method to reduce redundant I/Os. Furthermore, it uses a novel cache management mechanism to reduce duplicate cached data. Experiment results with our prototype system show that HPMapper significantly reduces copy-on-write latency due to its finer-grained copy-on-write scheme. Moreover, HPMapper can also reduce 65.4% cache usage on average due to elimination of duplicated data. As a result, HPMapper improves the throughput of real-world workloads by up to 39.4%, and improves the startup speed of containers by 2.0X.

论文二：DCUDA: Dynamic GPU Scheduling with Live Migration Support. Fan Guo, Yongkun Li, John C.S. Lui, Yinlong Xu, University of Science and Technology of China. To appear in the Proceedings of the ACM Symposium on Cloud Computing 2019 (SoCC 2019), Santa Cruz, CA, USA.

概要：In clouds and data centers, GPU servers which consist of multiple GPUs are widely deployed. Current state-of-the-art GPU scheduling algorithm are “static” in assigning applications to different GPUs. These algorithms usually ignore the dynamics of the GPU utilization and are often inaccurate in estimating resource demand before assigning/running applications, so there is a large opportunity to further load balance and to improve GPU utilization. Based on CUDA (Compute Unified Device Architecture), we develop a runtime system called DCUDA which supports “dynamic” scheduling of running applications between multiple GPUs. In particular, DCUDA provides a realtime and lightweight method to accurately monitor the resource demand of applications and GPU utilization. Furthermore, it provides a universal migration facility to migrate “running applications” between GPUs with negligible overhead. More importantly, DCUDA transparently supports all CUDA applications without changing their source codes. Experiments with our prototype system show that DCUDA can reduce 78.3% of overloaded time of GPUs on average. As a result, for different workloads consisting of a wide range applications we studied, DCUDA can reduce the average execution time of applications by up to 42.1%. Furthermore, DCUDA also reduces 13.3% energy in the light load scenario.

论文三：UniKV: Toward High-Performance and Scalable KV Storage in Mixed Workloads via Unified Indexing. Zhang Qiang, Yongkun Li, Patrick P. C. Lee, Yinlong Xu, Qiu Cui, Liu Tang, University of Science and Technology of China. To appear in the Proceedings of the 36th IEEE International Conference on Data Engineering (ICDE 2020), Dallas, TX, USA.

概要：Persistent key-value (KV) stores are mainly designed based on the Log-Structured Merge-tree (LSM-tree), which suffer from large read and write amplifications, especially when KV stores grow in size. Existing design optimizations for LSM-tree-based KV stores often make certain trade-offs and fail to simultaneously improve both the read and write performance on large KV stores without sacrificing scan performance. We design UniKV, which unifies the key design ideas of hash indexing and the LSM-tree in a single system. Specifically, UniKV leverages data locality to differentiate the indexing management of KV pairs. It also develops multiple techniques to tackle the issues caused by unifying the indexing techniques, so as to simultaneously improve the performance in reads, writes, and scans. Experiments show that UniKV significantly outperforms several state-of-the-art KV stores (e.g., LevelDB, RocksDB, HyperLevelDB, and PebblesDB) in overall throughput under readwrite mixed workloads.

最后，再次感谢实验室各位老师、同学以及合作者的辛勤工作和不懈努力，希望ADSL实验室的各位成员能够继续努力，在计算机系统的研究上取得新突破！

毕业骊歌起，青春筑梦时—-ADSL欢送2019届毕业生

Mon, 09 Sep 2019 23:35:23 +0800

2019年6月15日，实验室又有一批同学即将毕业离开校园，走向远方，为送别与我们一起经历风雨，为实验室做出贡献的毕业生们，ADSL为19届毕业生举办联欢晚会。

联欢晚会由许老师以及各位老师的致辞拉开序幕，许老师以及吕老师代表实验室为各位毕业生送上ADSL实验室的纪念礼物，同学们表达了对老师们的诚挚感谢以及对实验室发展的美好祝愿。

晚会开始后，同学们为大家献上了精心准备的魔方秀、吉他弹唱、歌曲串烧、戏曲联唱等20多个节目，整个晚会的气氛都被点燃，同学们载歌载舞，在欢声笑语中表达着自己的感动，留念，以及热切的期盼与祝福。

晚会的最后在永恒的东方、送别、天佑中华以及难忘今宵的歌声中落下帷幕，送别晚会虽然结束了，但是毕业生们新的人生旅途才刚刚开始，无论他们身处何方，ADSL都诚挚地祝福他们前程似锦，离开校园后能通过自己的所学，贡献出自己的光与热，书写一份属于自己的精彩！

实验室三项成果分别被计算机系统、数据库、分布式计算重要会议 USENIX ATC、ICDE、IPDPS收录

Thu, 23 May 2019 23:39:02 +0800

近期，在实验室老师、同学们和其他合作者们的共同努力下，ADSL 又有三项成果分别发表在计算机系统领域重要国际会议USENIX ATC(CCF A类)、数据库领域重要国际会议ICDE(CCF A类)，并行与分布式计算领域重要国际会议IPDPS(CCF B类)上。

首先，向各位参与研究工作的老师、同学、合作者表示祝贺，并感谢你们一直以来的辛勤付出！

三项成果分别涉及键值存储系统、图算法、数据的故障恢复，摘要如下：

论文一：ElasticBF: Elastic Bloom Filter with Hotness Awareness for Boosting Read Performance in Large Key-Value Stores. Yongkun Li, Chengjin Tian, Fan Guo, Cheng Li, and Yinlong Xu, University of Science and Technology of China. To appear in the Proceedings of USENIX ATC 2019. RENTON, WA, USA.

概要：键值存储系统主要采用基于分层结构的LSM-tree作为底层存储引擎，系统在执行读操作时，需要发出多个I/O请求对不同层的数据进行检查，过多I/O请求会导致读性能变差。键值存储系统通常使用布隆过滤器技术来减少额外的I/O请求以提高读性能，但是布隆过滤器存在误报，简单地采用更大的布隆过滤器会带来巨大的内存开销，因此在内存受限的系统中使用布隆过滤器仍然会带来额外的I/O。在这个工作中，我们观察到访问不均衡性在SSTable间以及在SSTable内部是十分常见的，为了利用这个特征，我们提出了一种细粒度异构的布隆过滤器管理方案：ElasticBF，该方案能够根据数据热度动态地将布隆过滤器从磁盘加载到内存。ElasticBF与已有的优化键值存储系统架构的工作是正交的关系，能够被集成到这些工作从而进一步优化它们的读性能。我们在LevelDB，RocksDB和PebblesDB上实现了ElasticBF，实验结果表明ElasticBF能够分别提升2.34倍，2.35倍和2.58倍的读性能，并且保持几乎一样的写性能和范围查询性能。

论文二： Walking with perceptions: efficient random walk sampling via common neighbor awareness. Yongkun Li, Zhiyong Wu, Shuai Lin, Hong Xie, Min Lv, Yinlong Xu, John C. S. Lui. To appear in the Proceedings of ICDE 2019. Macau, China.

概要：由于随机游走的简单性以及有严格的理论体系，其被大量运用到超大图的采样当中。然而，基于随机游走的收敛速度很慢，这严重影响了它的计算效率。为了解决这一问题，我们提出了一种基于公共邻居感知的随机游走框架，CNARW，它通过一种带权随机游走来加速收敛速度。具体来说，CNARW考虑了当前访问节点与下一候选节点之间的公共邻居来设计下一步随机游走的权重。基于CNARW，还可以做图上的”无偏估计”。最后我们在真实数据集上进行实验验证，实验结果表明，CNARW与其他算法相比可以实现更快的收敛速度，在相同的访问开销上可以实现更精准的采样精确度。

论文三：D^3: Deterministic Data Distribution for Efficient Data Reconstruction in Erasure-Coded Distributed Storage Systems. Zhipeng Li, Min Lv, Yinlong Xu, Yongkun Li, Liangliang Xu. To appear in the Proceedings of IPDPS 2019. Rio de Janeiro, Brazil. 概要：大型分布式存储系统中部署了大量独立而且可能并不可靠的组件，因此设备故障十分普遍。纠删码广泛应用于实际存储系统中，以提供低存储开销的容错能力。然而，在基于纠删码的分布式存储系统中，常用的随机数据放置策略会导致大量的跨机架传输、负载不均衡与随机访问，从而降低了故障修复的速度。本文提出了一种面向高效故障修复的确定性数据布局方案D^3（Deterministic Data Distribution），以及基于D^3数据布局的故障修复算法。D^3利用正交阵列（Orthogonal Array）来定义块在机架和节点之间的放置。D^3不仅在节点之间均匀地分布了数据块与校验块，而且实现了在故障修复时，修复流量分别在机架和节点之间均匀分布。此外，对于一个可容单机架故障的数据布局，在D^3数据布局下，修复一个节点故障所需跨机架访问的块的数量达到了最小。在实际分布式存储系统中的实验结果表明，D^3可以显著加快故障修复过程。

同时，实验室研一同学林帅赴澳门参加了ICDE会议并在会上关于实验室论文: “Walking with perceptions: efficient random walk sampling via common neighbor awareness.“做了汇报与展示，并且在Poster展区解答对论文感兴趣的学者的提问。他表示，此次会议对他来说具有非常重要的意义，不仅聆听到世界学术大牛的精彩演讲，在与他们的交流之中也获得了很多宝贵的意见。

再次感谢实验室各位老师、同学以及合作者的不懈努力，希望ADSL的各位成员能够继续不断前行，在计算机系统的高峰上不断攀登！

三项成果被计算机系统重要国际会议USENIX ATC和HotStorage收录

Sun, 22 Apr 2018 23:42:24 +0800

在实验室老师、同学及其他合作者的共同努力下，本实验室三项成果分别被计算机系统领域重要国际会议USENIX ATC 2018（CCF A类）和计算机存储领域重要workshop HotStorage收录。其中USENIX ATC长论文两篇，HotStorage论文一篇。向所有合作者、参研老师和同学表示祝贺！也向他们表示衷心感谢！

这三项重要成果涉及系统领域的两个研究热点：键值数据库（KV store）和分布式一致性。这些研究成果的核心目的都是要突破存储、计算、传输的瓶颈，使得系统架构更加优化，性能得到更大提升，以应对日益增长的互联网服务和智能计算对于高效能存储的客观需求。摘要如下：

论文一：Fine-grained consistency for geo-replicated systems. Cheng Li (University of Science and Technology of China), Nuno Preguica (Nova University of Lisbon), Rodrigo Rodrigues (University of Lisbon). To appear in the Proceedings of USENIX ATC 2018. BOSTON, MA, USA.

概要：互联网需要为来自世界各地的用户提供便捷的服务。为此，大部分的互联网服务提供商都采用用户数据跨地域备份技术（geo-replication）来拉近服务与用户的距离，使得用户请求可以在距离最近的服务器上得到响应。但该技术背后存在着系统性能（用户请求时延和吞吐率）与跨地域数据一致性之间的尖锐矛盾。为了解决该矛盾，现有的技术将二者之间的取舍从系统层面拓展到操作层面，从而降低了维持一致性所需的跨数据中心并发控制的代价。然而，这些方法取舍粒度不够细且无法感知系统操作发生的频率，因而影响了互联网的便捷化服务水平。基于此，我们提出了一种新的可调控的一致性模型—— Partial Order-Restrictions consistency (or short, PoR consistency) —— 将系统一致性与性能之间的取舍与操作之间可见性约束（visibility restriction）联系起来，通过添加或者减少操作之间的可见性约束来增强或减弱整个系统的一致性，从而摆脱了一个系统只能选择单一一致性模型的局限。此外，为了提供基于PoR一致性模型的备份协议，我们实现了一个轻量级的并发控制服务Olisipo，该服务可根据操作出现的频率选择性能适配的控制协议，以减少运行时开销。我们将原型系统部署在亚马逊云计算平台的三个不同地域的备份节点上，并在该系统部署上运行RUBiS 评测工具。实验结果表明：相较前序工作（OSDI 2012、ATC 2014、PaPoC 2015和IEEE Data Bulletin. 2016），我们的一致性模型和原型系统可在添加少量约束的情况下，降低47.1%的用户请求延迟和提高21.5%的系统吞吐率。

论文二：HashKV: Enabling Efficient Updates in KV Storage via Hashing. Helen H. W. Chan, Yongkun Li, Patrick P. C. Lee, Yinlong Xu. To appear in the Proceedings of USENIX ATC 2018. BOSTON, MA, USA.

概要：Key-value (KV)系统已被广泛应用于多种应用场景，它主要采用LSM树的结构以实现高访问性能，但是KV系统仍面临严重的I/O放大问题。目前，业界提出了key和value分离的思想，通过仅将key存储于LSM树，而将value使用单独的存储管理来解决I/O放大问题。但是，现有的设计方案垃圾回收开销大，从而严重影响了KV系统的性能，尤其是针对写密集的负载。为了解决KV系统的I/O放大问题，我们沿用KV分离的思想，提出了HashKV系统，即使在写密集负载下仍能达到很好的写性能。HashKV主要采用基于Hash的数据分组思想，从而提升数据写入和垃圾回收的性能。与现有的KV分离方案相比，HashKV可以达到4.6倍的吞吐率，同时减少53.4%的数据写入量。

论文三：ElasticBF: Fine-grained and Elastic Bloom Filter Towards Efficient Read for LSM-tree-based KV Stores. Yueming Zhang, Yongkun Li, Fan Guo, Cheng Li, Yinlong Xu. To appear in the Proceedings of HotStorage 2018. BOSTON, MA, USA.

概要：为满足数据密集型应用的高性能存储需求，依托于LSM-tree架构的键值数据库成为使用广泛的主流存储系统。该架构将键值对（key value pairs）存储在固定大小的SSTable文件内。为提高读性能，键值系统为每个SSTable配置一个布隆过滤器（Bloom filter），但是布隆过滤器的误报会引发额外的I/O 请求。且现有设计对系统内所有布隆过滤器采用统一设定，也不能对布隆过滤器误报率进行动态调整，其统一降低误报率的办法将会给系统环境带来巨大内存开销。基于此，本文提出弹性布隆过滤器机制（Elasitc Bloom Filter，ElasticBF）。ElasticBF 为每个SSTable构建多个占用空间小的布隆过滤器，这些布隆过滤器机制存储于外存。对于访问频率高的SSTable，为其在内存中多加载一些布隆过滤器，而对访问频率低的SSTable，则少加载一些。而且，为了使过滤器的动态调整开销较小，我们扩展了多级队列这一数据结构，使用多级队列对布隆过滤器进行管理。因此，ElasticBF能够动态调节每个SSTable布隆过滤器的误报率和内存使用量，在内存开销相同的前提下，大大减少了 (实验中最高可达67%)读操作中因布隆过滤器误报引发的I/O请求，从而提高读性能。我们在LevelDB 的基础上实现了ElasticBF，并在服务器上进行了性能测试。实验结果显示，ElasticBF读吞吐量最高是 LevelDB的2.24 倍，且写性能几乎没有损失。

除了上述三项被接受的成果外，其他四篇投稿虽然被拒，但值得欣慰的是，每一篇稿件都收获了同行业国际专家不同程度的认可，以及极富建设性的修改意见。希望大家再接再厉，认真改进，完善成果，争取更大更好的成绩。

近期实验室一批成果被CCF A类会议和期刊录用

Thu, 30 Nov 2017 23:44:30 +0800

经过各位老师、同学以及合作者的通力协作和艰苦奋斗，我们实验室的科研实力得到了很大的提升，最近又有四篇论文被CCF A类会议和期刊收录，列表如下。祝贺各位老师同学，希望大家再接再厉，争取更大的进步和成绩！

Xin Wang, Yinlong Xu, Richard T.B. Ma, “Paid Peering, Settlement-Free Peering, or Both?”, accepted by INFOCOM’2018.
Rongwei Yang, Cuiying Feng, Luning Wang, Kui Wu, Yinlong Xu, “On the Optimal Monitor Placement for Inferring Additive Metrics of Interested Paths”, accepted by INFOCOM’2018.
Yongkun Li, Neng Wang, Chengjin Tian, Si Wu, Yueming Zhang, Yinlong Xu, “A Hierarchical RAID Architecture Towards Fast Recovery and High Reliability”, Accepted by IEEE Transactions on Parallel and Distributed Systems (TPDS).
Xin Wang, Richard T.B. Ma, Yinlong Xu, “The Role of Data Cap in Optimal Two-Part Network Pricing”, accepted by IEEE/ACM Transactions on Networking.

实验室论文荣获第23届全国信息存储技术学术会议优秀论文奖

Sat, 23 Sep 2017 23:46:59 +0800

2017年9月20日-22日，第23届全国信息存储技术学术会议在西北工业大学举行，实验室投稿的两篇论文均被录用，分别是研一新生张强撰写的论文《基于工作负载感知的固态硬盘阵列系统的架构设计与研究》和李佳伟撰写的论文《Spark的内存重删优化》。

其中，张强撰写的论文《基于工作负载感知的固态硬盘阵列系统的架构设计与研究》，通过在RAID-0阵列中设计一种基于冷热数据分离存储的固态硬盘阵列系统架构HA-RAID，并结合滑动窗口技术进行优化，很好地实现了阵列系统级的负载和磨损均衡，并有效提升固态硬盘阵列系统的I/O性能。论文得到大会评审专家的高度认可，并受到与会学者的广泛关注，最终荣获会议优秀论文奖。

据悉，此次全国信息存储技术学术会议共收到来自全国各个高校和科研院所的58篇学术论文，经过专家多轮严格评审，35篇论文被会议录用，最终5篇论文获得优秀论文奖。

中国科大荣获首届全国大学生计算机系统能力大赛编译系统设计赛特等奖

Mon, 01 Jan 0001 00:00:00 +0000

2020年中国大学生计算机系统能力大赛首届编译系统设计赛全国总决赛暨颁奖典礼于8月19-21日在线上和西北工业大学成功举行。该赛事是由教育部高等学校计算机类专业教学指导委员会和系统能力培养研究专家组共同发起，以学科竞赛推动专业建设和计算机领域创新人才培养体系改革、培育我国高端芯片及核心系统的技术突破与产业化后备人才为目标,面向高校大学生举办的全国性大赛。来自清华大学、中国科学技术大学、北京航空航天大学等47所高校的72支队伍报名参赛。我校派出的由计算机学院本科生陈清源、黄奕桐、曾明亮，网络空间安全学院本科生章耀辉组成的“燃烧我的编译器”队以及由少年班学院本科生黄业琦、计算机学院本科生丁伯尧、刘硕、彭昀组成的“YAL”队参加了线上总决赛，由计算机学院李诚老师和网络空间安全学院李卫海老师共同指导，计算机学院张昱老师作为特邀专家参加了本次总决赛。在历时2个月的初赛后，全部72支参赛队伍中仅有21支队进入总决赛。各决赛队在经过8月19-20日持续36小时紧张激烈的编译器优化工作和在线性能评测，以及21日的线上答辩后，由组委会10位专家评审与合议并发布获奖名次。我校“燃烧我的编译器”队以总分第一的优异成绩获得唯一的特等奖，捧起了“华为毕昇杯”；“YAL”队获得了二等奖。李诚、李卫海老师获得“优秀指导教师”奖。受到疫情影响，参赛学生较长时间无法返校进行实验工作，但指导教师通过搭建远程测试平台等方式成功克服实验器材困难，帮助同学们完成了核心代码调试和性能测评。在6-8月间，指导老师与同学们开展了多轮校内线上研讨会，认真备赛。 “燃烧我的编译器”队的同学们设计思路清晰，分工明确，配合默契，在比赛中展示了强大的创新和工程实践能力。他们巧妙地设计了程序的三层中间表式，并提出基于多线程的轻量级自动并行等优化方法，在有限的比赛时间里实现了30余个优化遍。最终，他们设计的编译器为测试用例生成了高性能可执行代码，大部分用例的运行速度明显快于开启-O3高级优化后的主流编译器GCC，荣获特等奖。“YAL”队的同学们虽在初赛中因队员有其他比赛等事情而使进度严重滞后，在临近初赛结束时又遇到极为复杂的技术难题，但在同学们和老师的通力配合之下，依靠顽强拼搏的精神，在高度紧张的比赛气氛中承受住压力，扭转了不利局面，顺利挺进决赛，荣获二等奖。

我校计算机类课程体系建设秉承基础宽厚实，专业高精尖的理念，重视学生“系统能力”的培养，相关改革成效凸显，成为全国8所“系统能力培养示范高校”之一。近年来，计算机学院编译课程组在课堂和实验教学两方面均进行了卓有成效的改革，部分理念走在国内高校前列。该课程组的老师强调实践在课程教学中的重要性，注重实践内容的系统性和综合性以及过程管理，采取多元化测评方法来考核学生的表现。他们积极增删课程内容，及时把最新理论和技术通过精心构造的实践案例及课程教案等反映到教学中。他们较早地将新兴技术(如LLVM、RISC-V、深度学习等)引入到实验框架建设中，培养学生掌握新开发工具以及比较、评价、选择不同方法的能力，激发学生学习的热情和促进对其创新能力的培养。这一系列的改革在同学们中引起了较好的反响，也为这次比赛取得佳绩奠定了重要的基础。

教务处、计算机学院、网络空间安全学院、信息学院和少年班学院的大力支持为本次比赛队员选拔、培训和线上参赛创造了多项有力条件。我校参赛队员通过细致认真的备赛，良好的团队协作和冷静沉着的表现在本次比赛中取得了优异成绩，展现了我校学生扎实的专业水平、良好的系统思维与创新能力、全面的综合素质。

（转自中国科学技术大学新闻网）

实验室一项成果被云计算领域顶级会议SoCC收录

Mon, 01 Jan 0001 00:00:00 +0000

近期，在实验室老师们、同学和微软亚洲研究院合作者们的共同努力下，ADSL实验室又一项成果被云计算领域顶级会议 SoCC 录用。向各位参与研究工作的老师、同学、合作者表示祝贺，并感谢你们一直以来的辛勤工作和付出！

本项成果涉及AI 系统领域中优化加速图神经网络在大规模图数据集上的采样训练，摘要如下:

论文: PaGraph: Scaling GNN Training on Large Graphs via Computation-aware Caching and Partitioning. Zhiqi Lin (USTC), Cheng Li (USTC), Youshan Miao (MSRA), Yunxin Liu (MSRA), Yinlong Xu (USTC). ACM Symposium on Cloud Computing 2020 (SoCC ’20)

概要: 图神经网络已经广泛用于探索和处理图结构数据。对于大规模图数据集，现有的图神经网络框架利用 GPU 等加速器并结合图采样和批处理方式来有效地训练图神经网络。然而，现有的技术面临着数据加载时间长、可拓展性差等问题。本文提出 PaGraph, 在单机多 GPU 机器上采用图缓存策略和图分割策略来有效提升图神经网络训练性能。图缓存策略用于在 GPU 上缓存频繁访问的图数据信息，从而大幅度减少数据加载的时间，有效提升训练性能。在多 GPU 训练场景下，采用为图神经网络定制的图分割策略，并配合图缓存机制，极大程度地提升训练可拓展性。

DetailNews | ADSLAB

中国科大夺得2020华为开发者大赛MindSpore网络模型挑战赛两项金奖

实验室一项成果（SpanDB）被存储领域顶级会议 FAST 接收

实验室主编新教材《图论导引》出版

实验室四项成果分别被计算机系统顶级会议ATC、通信网络顶级会议INFOCOM、系统结构领域顶级期刊TPDS和存储领域重要workshop HotStorage收录

ADSL实验室16级博士生陈友旭顺利通过博士学位答辩

实验室三项成果分别被云计算领域顶级会议SoCC、数据库领域顶级会议 ICDE收录

毕业骊歌起，青春筑梦时—-ADSL欢送2019届毕业生

实验室三项成果分别被计算机系统、数据库、分布式计算重要会议 USENIX ATC、ICDE、IPDPS收录

三项成果被计算机系统重要国际会议USENIX ATC和HotStorage收录

近期实验室一批成果被CCF A类会议和期刊录用

实验室论文荣获第23届全国信息存储技术学术会议优秀论文奖

中国科大荣获首届全国大学生计算机系统能力大赛编译系统设计赛 特等奖

实验室一项成果被云计算领域顶级会议SoCC收录

中国科大荣获首届全国大学生计算机系统能力大赛编译系统设计赛特等奖