24小时热门版块排行榜    

查看: 1931  |  回复: 1
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

877079425

新虫 (初入文坛)

[交流] 【原创】分子模拟,各款GPU加速效果基准测试,GTX系列成最大赢家已有1人参与

什么是gpu
gpu全称graphic processing unit,即图形处理器,其设计之初是为了代替cpu从硬件上解决复杂的3d图形计算需求。gpu的前生为各种专用的图形加速器,功能较为单一,直到1999年nvidia推出geforce 256,第一次在图形芯片上实现了t&l(transform and lighting,多边形转换和光源处理),才有了真正意义上的图形处理器——gpu。下图为cpu与gpu的结构示意图(图片出自nvidia官方文档,绿色为计算单元,黄色为控制单元,橙色为存储单元),图中可以看到cpu内部电路大部分用于组成控制电路和cache,其计算单元alu则占比较小。而gpu正好相反,其控制电路和cache占比很小,而计算单元alu占比则非常大,并且其单个alu面积较小而数量众多。cpu和gpu结构的巨大差异使得它们的应用场景也大为不同,擅长领域也不同。如cpu擅长逻辑控制和通用类型数据运算,而gpu则擅长大规模并发计算。
【原创】分子模拟,各款GPU加速效果基准测试,GTX系列成最大赢家
1.jpg

什么是gpu加速计算
gpu设计之初是为了解决各种图形计算需求,然而得益于其结构特点——核心众多而高效,其能进行大规模的并行计算而适应许多计算密集型的任务。而cpu正好相反,其内部晶体管主要用于构建控制单元和cache,其更能适应顺序任务。
gpu加速正是结合两者的性能特点,将需要大规模并行运算的任务交给gpu处理而控制和调度任务则交给cpu处理,合理利用两者达到加快科学、分析、工程、消费和企业应用程序的运行速度的目的。gpu加速原理说起来简单,但是实现起来却并不容易,因为这涉及到将cpu代码转变为gpu代码这一复杂过程。为了充分利用gpu的计算能力,nvidia于2006年推出了cuda(compute device architecture,统一设备架构 )编程模型,此通用并行计算架构能使gpu解决复杂的计算问题,nvidia现如今的产品都支持此功能。

gpu加速在分子模拟中的应用
许多著名的分子模拟软件如amber、gromacs、lammps、namd等都实现了gpu加速支援。这里我们以amber18为例,在default设置下探讨gpu所带来的加速效果,以下数据均取自amber官方测试数据。在控制变量的条件下,amber官方对4个周期性体系在不同的硬件平台上进行了分子动力学模拟基准测试。这4个体系分别为二氢叶酸还原酶(dhfr)其原子数为23588、人体凝血系统中的ix因子其原子数为90906、纤维素体系其原子数为408609、烟草花叶病毒卫星病毒其原子数为1067095。此次测试处理器平台为intel e5-2640 v4 2.4ghz ,共涉及到8款消费级、专业级显卡,测试结果如下图。
【原创】分子模拟,各款GPU加速效果基准测试,GTX系列成最大赢家-1
2.jpg

【原创】分子模拟,各款GPU加速效果基准测试,GTX系列成最大赢家-2
3.jpg

可以看到,在nve和nvt系综下,各款gpu都凭借其核心众多的优势,使计算性能远超cpu。对于dhfr这样的原子数在20000级别的体系,顶级计算卡tesla v100 的计算速度更是达到了每天900纳秒的水平,几乎是8核cpu算力的54倍。可见纯cpu计算效率的确远低于gpu加速计算。虽然最新的突破,即超过1200核心的cpu集群能够达到和gpu加速般的计算速度,但是1200核心的计算机集群所付出的成本代价却让人难以接受。

更多测试案例,如显式溶剂pme基准测试和隐式溶剂gb基准测试参见http://ambermd.org/gpuperformance.php

gpu的选购
测试结果表明gpu对于分子动力学模拟有极大的加速作用,并且gpu越高级其加速效果越好。然而,gpu规格越好意味着其价格也越高昂,付出的成本也越大。但是,在此次测试中我们注意到一个现象,即尽管gtx系列的显卡规格最低,其也依然具有很高的加速比。而众所周知,gtx系列显卡价格远低于顶级titan系列和专业级tesla系列。为了能更清楚地比较各款显卡的成本代价,我们以gtx-1080为基准给出各显卡的价格——性能图。
【原创】分子模拟,各款GPU加速效果基准测试,GTX系列成最大赢家-3
4.jpg

可以看到,型号为gtx-1080 ti的显卡最具性价比。考虑到amber支持单节点多gpu,所以多路gtx-1080 ti不失为一种经济实惠的选择。所以,当经费较为紧张而又需要算力强大的平台时,强烈推荐选购消费级gtx系列显卡而不选用昂贵的专业级加速显卡。

原因
在amber中,消费级显卡gtx系列如此具有竞争力的一个重要原因是分子动力学模拟对计算精度的要求远没有量化计算那么高。amber18采用了scott le grand等人提出单精度/固定精度模型(spfp),此模型能够在不牺牲计算结果准确性的前提下降低了程序对硬件的精度要求,使得双精度能力较弱的gtx系列显卡瞬间飙升到可以与专业卡媲美的高度。

[ Last edited by 沙漠猎人 on 2019-10-18 at 09:10 ]
回复此楼

» 收录本帖的淘贴专辑推荐

amber

» 猜你喜欢

» 本主题相关商家推荐: (我也要在这里推广)

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 877079425 的主题更新
最具人气热帖推荐 [查看全部] 作者 回/看 最后发表
[教师之家] 研究生在毕业答辩时挂了,遗憾 +10 spacr2022 2024-05-27 13/650 2024-06-01 17:45 by keyaner23
[考博] 24年博士招生 +8 abinit432 2024-05-27 10/500 2024-06-01 17:38 by czp97
[硕博家园] 每到中夜,情难自抑 +32 sioc-sunj 2024-05-28 56/2800 2024-06-01 16:55 by 佩佩姐618
[考博] 24or25材料专业申博 +4 农夫三拳有点痛 2024-05-30 11/550 2024-06-01 14:45 by Napoleonsky
[基金申请] B口人才项目 +9 WOWO159357 2024-05-29 19/950 2024-06-01 14:24 by linxuhuizj
[硕博家园] 实验室太吵闹,无法安静学习,怎么办? +6 utahh 2024-05-31 11/550 2024-06-01 13:27 by utahh
[教师之家] 双非本科毕业论文,气人 +6 河西夜郎 2024-05-27 7/350 2024-06-01 08:50 by Quakerbird
[硕博家园] 哈工大硕博招生!博士每月入学! +4 nailooo 2024-05-30 5/250 2024-06-01 06:47 by anevay
[高分子] MMA预聚体光固化发雾问题求助 +3 惠亚金总 2024-05-29 10/500 2024-05-31 14:59 by 惠亚金总
[有机交流] 苯酚和炔溴反应成醚 6+3 TONGMEIMEI 2024-05-26 12/600 2024-05-31 14:41 by TONGMEIMEI
[硕博家园] 求问endnote上Wiley引用格式在哪下载 +3 Elon. 2024-05-30 3/150 2024-05-31 10:13 by crazy peng
[基金申请] 入职高校3年发表10+SCI,尽人事听天命 +29 kaoyan250 2024-05-27 40/2000 2024-05-31 08:44 by Xiaolin81
[材料综合] 真空封石英管 北京 +4 dessha 2024-05-29 5/250 2024-05-30 16:40 by mpdfwxgui
[电化学] 有锂金属软包电池代工公司代做软包嘛 +5 yyywj995 2024-05-26 6/300 2024-05-30 08:33 by 那年的旧城
[硕博家园] 又想换工作 +15 brightmj 2024-05-27 20/1000 2024-05-29 23:25 by zyqchem
[论文投稿] 有没有老师需要发表论文 +4 金老师论文助理- 2024-05-29 4/200 2024-05-29 16:51 by liuyupu132
[论文投稿] 真急着毕业,CPB主编终审17天了,邮件催稿了两次,就是一点动静没有 5+3 kkkk夏 2024-05-28 6/300 2024-05-29 11:18 by hitsdu
[基金申请] 如果您是国自然评审专家 +3 丁香园账户 2024-05-28 3/150 2024-05-29 06:44 by gaohui8888
[硕博家园] 我是很理想化一人 +6 hahamyid 2024-05-26 6/300 2024-05-27 18:13 by 大飞鱼鱼鱼
[硕博家园] 课题做到一半担心做不出来怎么办 +4 mkpooooo 2024-05-27 7/350 2024-05-27 11:56 by kanmiaolucky
信息提示
请填处理意见