与非平衡格林函数结合,密度泛函理论已被成功应用于纳米电子器件输运行为的研究。然而,我们发现,器件的输运计算比普通的密度泛函计算速度要慢很多。尽管可以采取多核并行计算,但输运计算比普通密度泛函计算慢很多的问题依然如故,而且随着体系的增大,问题尤为突出,有时甚至慢到令人无法接受。这直接制约了很多物理体系和物理问题的研究。为了突破这个瓶颈,采用一种新的并行方式与并行机制来加快输运计算过程变得至关重要。GPU计算是最近发展起来的一种全新的并行模式,具有强大的并行计算能力。本项目探讨将基于CUDA技术的GPU并行编程应用于纳米器件的输运计算,将影响输运计算速度最大但非常适合在GPU上实现加速的密度矩阵计算部分、实空间求解Poisson方程部分和透射函数以及电流的计算部分移到GPU上进行,而其它部分依然在CPU上计算,以加快器件模拟的运算速度,大大缩短计算模拟的时间。
本项目的目标是将GPU加速技术应用到第一性原理的电子输运计算,从而解决自洽迭代过程中的速度瓶颈问题。通过四年的研究,本项目很好的完成了预定的任务,在以下两个方面取得了重要成果:一、程序发展:(1)编写了自能计算、非平衡格林函数计算GPU程序,编写CULA和CUBLAS的fortran调用程序接口;(2)发展了分块矩阵计算算法,实现超大矩阵的矩阵相乘与矩阵求逆的GPU计算;(3)实现多GPU的k点并行和能量并行;(4)实现了矩阵相乘和求逆的多GPU并行计算。我们的测试表明,对于中等规模的体系,单个Tesla k20m卡可以实现20倍的加速;对于k点和能量E的并行,由于节点间的通讯少,因此加速比随GPU的数目近似成线性关系;在天河系列计算机上采用24块k40m GPU卡,与单一CPU核相比,获得了接近700倍的加速效果。二、程序的应用:(1)针对石墨烯纳米带以及BN纳米带的电子结构和输运性质的调控,我们开展了大量的工作;(2)设计了C60-B80分子桥器件,发现C60 dimer和B80 dimer都是不良导体,然而C60-B80则具有很好的导电性,此外预测了Cu电极表面重构对C60分子输运性质的影响;(3)利用有机分子设计了具有特定功能的电子器件;(4)开展了单分子磁体输运性质的研究,预测了电场诱导的自旋转变现象,设计了基于单分子磁体的存储器件。发表论文22篇,其中SCI收录21篇,影响因子大于3.0的12篇。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于MCPF算法的列车组合定位应用研究
2009 -2017年太湖湖泛发生特征及其影响因素
制冷与空调用纳米流体研究进展
泛"胡焕庸线"过渡带的地学认知与国土空间开发利用保护策略建构
综述:基于轨道角动量光子态的高维量子密钥分发
地震成像几何算法及GPU/CPU协同并行计算
四维变分同化CPU/GPU协同并行计算研究
GPU/CPU协同并行计算海量地震资料叠前逆时偏移理论与应用
基于GPU/CPU协同计算的城市建筑群震害模拟