日日操夜夜,超碰精品无码,啪啪啪啪视频免费,AV一区免费在线观看

工作動態(tài)

我中心在高效3D卷積算法上取得進展

2024-08-27 17:51 | 放大 縮小 |

高性能計算和人工智能的新興發(fā)展顯著擴展了三維卷積神經網(wǎng)絡(3D CNN)的應用。然而在實際的需求應用中,復雜的3D卷積計算是影響性能的主要因素。

近日,中心高性能計算部科研人員基于新一代SW26010Pro處理器提出了一種高效的3D卷積算法。新一代神威(Sumway)超級計算機在HPC+AI領域表現(xiàn)出卓越的計算能力,該工作依托Sunway平臺對三維卷積算子進行了詳細的分析與優(yōu)化,針對SW26010Pro架構的設計了三級分塊算法(圖1),并進行了訪存優(yōu)化,同時提出了一種新穎的散點通信策略(圖2),充分利用片上網(wǎng)絡帶寬。實驗結果表明,與基于xMath2.0庫的Sgemm實現(xiàn)方法相比,我們的三維卷積算法實現(xiàn)了平均2.54x的加速比,并且實現(xiàn)了高達2.12 Tflop/s的單精度浮點性能,達到理論峰值性能的92%。

?3D卷積三級分塊算法

?RMA散點通信策略

該研究成果已被International Conference on Parallel ProcessingICPPCCF B會議錄用并發(fā)表,論文第一作者為我中心高性能部博士研究生李佳霖,通訊作者為我中心高性能計算部張鑒研究員。該成果得到中國科學院先導專項(XDB0500101)的支持。

相關成果:

Li J, Feng Z, Gao Y, et al. High-Performance 3D convolution on the Latest Generation Sunway Processor[C]//Proceedings of the 53rd International Conference on Parallel Processing. 2024: 241-251.

責任編輯:郎楊琴

附件下載