清华大学提出新型并发掌握算法,大幅晋升事情内存系统功用,获顶会最佳论文提名

10月12日~16日,第52届国际微架构集会(International Symposium on Microarchitecture,简称MICRO)美国俄亥俄州哥伦布市召开。清华大学魏少军传授、刘雷波传授团队会上做了题为《运用于事情内存的乐观并发掌握算法的FPGA加速》(FPGA-Accelerated Optimistic Concurrency Control for Transactional Memory)的报告,先容了团队计划的新型并发掌握算法以及运用可重构架构加速算法施行的方法,评估事情内存系统功用的STAMP测试集上,该算法比较Intel处理器内置的TSX(Transactional Synchronization Extension, 事情同步扩展)指令集取得了8倍以上的功用晋升。

该论文是亚洲高校及科研机构MICRO 52年历史上第二次取得最佳论文提名,论文的第一作家是李兆石博士,通信作家是刘雷波传授。

图1 清华大学李兆石博士MICRO 2019上作报告

事物内存是办理众义务并行时线程间同步题目的主流方案之一,规避了运用锁时呈现的优先级反转、死锁、护航等题目,极大的进步了义务并行度。可是,现有事情内存并发掌握算法完成可串行化同等性时保管苟菪缺陷——因为判别算法的简化和不准确,惹起许众不须要的拜访消弭,导致功用受限。

该项研讨驻足于并行编程运用的事情内存方法,应用数学的序联系表面剖析了常睹的事情内存同等性模子,然后为理办理上述苟菪缺陷计划了新型并发掌握算法,并应用可重构架构的空间盘算特征加速该算法。如图2所示,事情之间的读写依赖联系可重构架构上的Manager模块以矩阵的方式空间上平摊开来,如许算法可以更高效地检索并更新事情间读写依赖联系。之后CPU-FPGA异构可重构系统上完成了基于该算法的高功用的事情内存系统的原型系统,评估事情内存系统功用的STAMP测试集上比较Intel处理器内置的TSX(Transactional Synchronization Extension, 事情同步扩展)指令集取得了8.05倍的功用晋升。该研讨剖析同等性模子的方法不光限于事情内存系统,还可推行到分布式系统、众处理器缓存同等性等题目的研讨中。

图2 该研讨提出的新型并发掌握算法可重构架构上的完成

过去10余年,清华大学魏少军传授、刘雷波传授团队聚焦可重构芯片技能研讨,国家自然科学基金要点项目、要点研发方案项目、863方案要点项目及其它国家方案项目标支撑下,可重构芯片范畴取得了众项庞大技能打破。JSSC/TIFS/TPDS等范畴顶级期刊上发外论文200众篇,ISCA/HOT CHIPS/DAC/VLSI等范畴顶级集会发外论文20余篇;授权发明专利60余项;出书学术专著5部;到场订定国家标准1项,到场国际标准化构造提案1项;相关技能曾取得国家技能发明二等奖、蕉蔟部技能发明一等奖、中国电子学会技能发明一等奖、中国发明专利金奖、天下互联网大会15项天下互联网领先科技效果等主要科技奖励。

关于MICRO

国际微架构大会,the International Symposium on Microarchitecture (MICRO),是盘算机系统构造范畴的主要集会,与ISCA、HPCA、ASPLOS并列盘算机系统构造四大顶级集会,论文录取率一般21%尊驾。神经收集加速器、专用加速器构造、DRAM、恒久性内存、GPU加速器、近内存加速器等,都MICRO上被首次提出。

财产论文清华大学
1
相关数据
魏少军人物

曾任电信科学技能研讨院副总工程师,大唐电信科技股份有限公司总裁。现任清华大学传授,博士生导师;蕉蔟部“211工程”电子系统集成与专用集成电道技能研讨中心主任;中国电子学会高级会员,IEEE有代价会员。

神经收集技能

(人工)神经收集是一种根源于 20 世纪 50 年代的监视式板滞进修模子,那时分研讨者念象了「感知器(perceptron)」的念法。这一范畴的研讨者一般被称为「勾结主义者(Connectionist)」,因为这种模子模拟了人脑的功用。神经收集模子一般是通过反向传达算法运用梯度下降教练的。目前神经收集有两大主要类型,它们都是前馈神经收集:卷积神经收集(CNN)和轮回神经收集(RNN),此中 RNN 又包罗好坏期记忆(LSTM)、门控轮回单位(GRU)等等。深度进修是一种主要运用于神经收集帮帮其取得更好结果的技能。尽管神经收集主要用于监视进修,但也有少许为无监视进修计划的变体,比如主动编码器和生成对立收集(GAN)。

引荐作品
暂无评论
暂无评论~