刘光明:Tesla架构天河一号A推动超算应用 (2)
发布时间:2013.01.23 04:39 来源:赛迪网 作者:云中子
天河一号A采用领先的CPU+GPU计算架构
“国防科技大学2005年到2007年就在研究,用通用CPU与GPU加速器结合,当时自己做了一个流处理器,结合起来之后发现有很大一类高性能计算机的应用,像流体力学、气动力学、FFT、CFD的东西,包括还有很多算法都适合这种结构,解决很多复杂的数学问题,这种结构是适用的。”国家超级计算天津中心刘光明主任表示。
此后,在2009年天河一号做第一期的时候,当时因为要做一个实用性能比较高的系统,所以就选用了AMD的GPU来替代当时国防科技大学自己研究的流处理器,这样就诞生了当时的天河一号,这个机器当时排名是世界第五,亚洲第一。
后来国防科大发现了Tesla 2050,因为AMD的GPU没有ECC校验,而Tesla有ECC校验,所以在2010年的时候,做了升级,GPU换成了NVIDIA的,同时高速互联系统换成国防科大自己的银河高速互联,同时强化了操作系统,升级了之后又做了一些优化,便诞生了举世瞩目的天河一号A。
天河一号A的GPU计算节点
国产处理器飞腾入驻天河一号A
谈到硬件方面,刘主任表示:整体上这个系统分成两部分,一部分是Intel的CPU加上NVIDIA的GPU构成了一个现在新的系统,这个系统在整个所有天河系统的7/8,另外1/8的部分是用国防科大自己的CPU,即:飞腾1000。这套系统应该说是实验优化的环境,有很多科技计算的程序,一些应用都在这上面做测试,做实验,有一些应用也是一种实际的应用,不断的调试、测试和完善。
GPU异构已经成为当今HPC的潮流
谈到GPU近几年的飞速发展,NVIDIA公司PSG全球副总裁Shanker Trivedi显得非常兴奋。Shanker认为,天河一号A向全世界证明了异构超级计算是一个非常好的科学计算,也是超算中心发展的方向。接下来全世界超算中心纷纷采用了GPU加速并行计算这样的体系结构,像美国的高性能超算中心、德国的超算中心,都是在其国家或者地区最大的系统,这些系统都纷纷的采用了GPU加速并行计算,而传统的超级计算CPU只贡献了整个高性能计算的10%左右,甚至还要更小,但是GPU贡献了大部分,甚至是80%、90%,很多很多都是计算性能是从GPU贡献出来的。