24小时热门版块排行榜    

查看: 1916  |  回复: 1

877079425

新虫 (初入文坛)

[交流] 【原创】分子模拟,各款GPU加速效果基准测试,GTX系列成最大赢家已有1人参与

什么是gpu
gpu全称graphic processing unit,即图形处理器,其设计之初是为了代替cpu从硬件上解决复杂的3d图形计算需求。gpu的前生为各种专用的图形加速器,功能较为单一,直到1999年nvidia推出geforce 256,第一次在图形芯片上实现了t&l(transform and lighting,多边形转换和光源处理),才有了真正意义上的图形处理器——gpu。下图为cpu与gpu的结构示意图(图片出自nvidia官方文档,绿色为计算单元,黄色为控制单元,橙色为存储单元),图中可以看到cpu内部电路大部分用于组成控制电路和cache,其计算单元alu则占比较小。而gpu正好相反,其控制电路和cache占比很小,而计算单元alu占比则非常大,并且其单个alu面积较小而数量众多。cpu和gpu结构的巨大差异使得它们的应用场景也大为不同,擅长领域也不同。如cpu擅长逻辑控制和通用类型数据运算,而gpu则擅长大规模并发计算。
【原创】分子模拟,各款GPU加速效果基准测试,GTX系列成最大赢家
1.jpg

什么是gpu加速计算
gpu设计之初是为了解决各种图形计算需求,然而得益于其结构特点——核心众多而高效,其能进行大规模的并行计算而适应许多计算密集型的任务。而cpu正好相反,其内部晶体管主要用于构建控制单元和cache,其更能适应顺序任务。
gpu加速正是结合两者的性能特点,将需要大规模并行运算的任务交给gpu处理而控制和调度任务则交给cpu处理,合理利用两者达到加快科学、分析、工程、消费和企业应用程序的运行速度的目的。gpu加速原理说起来简单,但是实现起来却并不容易,因为这涉及到将cpu代码转变为gpu代码这一复杂过程。为了充分利用gpu的计算能力,nvidia于2006年推出了cuda(compute device architecture,统一设备架构 )编程模型,此通用并行计算架构能使gpu解决复杂的计算问题,nvidia现如今的产品都支持此功能。

gpu加速在分子模拟中的应用
许多著名的分子模拟软件如amber、gromacs、lammps、namd等都实现了gpu加速支援。这里我们以amber18为例,在default设置下探讨gpu所带来的加速效果,以下数据均取自amber官方测试数据。在控制变量的条件下,amber官方对4个周期性体系在不同的硬件平台上进行了分子动力学模拟基准测试。这4个体系分别为二氢叶酸还原酶(dhfr)其原子数为23588、人体凝血系统中的ix因子其原子数为90906、纤维素体系其原子数为408609、烟草花叶病毒卫星病毒其原子数为1067095。此次测试处理器平台为intel e5-2640 v4 2.4ghz ,共涉及到8款消费级、专业级显卡,测试结果如下图。
【原创】分子模拟,各款GPU加速效果基准测试,GTX系列成最大赢家-1
2.jpg

【原创】分子模拟,各款GPU加速效果基准测试,GTX系列成最大赢家-2
3.jpg

可以看到,在nve和nvt系综下,各款gpu都凭借其核心众多的优势,使计算性能远超cpu。对于dhfr这样的原子数在20000级别的体系,顶级计算卡tesla v100 的计算速度更是达到了每天900纳秒的水平,几乎是8核cpu算力的54倍。可见纯cpu计算效率的确远低于gpu加速计算。虽然最新的突破,即超过1200核心的cpu集群能够达到和gpu加速般的计算速度,但是1200核心的计算机集群所付出的成本代价却让人难以接受。

更多测试案例,如显式溶剂pme基准测试和隐式溶剂gb基准测试参见http://ambermd.org/gpuperformance.php

gpu的选购
测试结果表明gpu对于分子动力学模拟有极大的加速作用,并且gpu越高级其加速效果越好。然而,gpu规格越好意味着其价格也越高昂,付出的成本也越大。但是,在此次测试中我们注意到一个现象,即尽管gtx系列的显卡规格最低,其也依然具有很高的加速比。而众所周知,gtx系列显卡价格远低于顶级titan系列和专业级tesla系列。为了能更清楚地比较各款显卡的成本代价,我们以gtx-1080为基准给出各显卡的价格——性能图。
【原创】分子模拟,各款GPU加速效果基准测试,GTX系列成最大赢家-3
4.jpg

可以看到,型号为gtx-1080 ti的显卡最具性价比。考虑到amber支持单节点多gpu,所以多路gtx-1080 ti不失为一种经济实惠的选择。所以,当经费较为紧张而又需要算力强大的平台时,强烈推荐选购消费级gtx系列显卡而不选用昂贵的专业级加速显卡。

原因
在amber中,消费级显卡gtx系列如此具有竞争力的一个重要原因是分子动力学模拟对计算精度的要求远没有量化计算那么高。amber18采用了scott le grand等人提出单精度/固定精度模型(spfp),此模型能够在不牺牲计算结果准确性的前提下降低了程序对硬件的精度要求,使得双精度能力较弱的gtx系列显卡瞬间飙升到可以与专业卡媲美的高度。

[ Last edited by 沙漠猎人 on 2019-10-18 at 09:10 ]
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

hckycg

木虫 (正式写手)

2楼2019-10-18 00:07:43
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 877079425 的主题更新
最具人气热帖推荐 [查看全部] 作者 回/看 最后发表
[教师之家] 另一半是老师会加分哦 +11 acogw9004 2024-05-14 11/550 2024-05-17 11:18 by fysh2023
[找工作] 绍兴文理学院怎么样?有没有坑啊 +4 zhaojiang427 2024-05-16 8/400 2024-05-17 10:59 by 化学不容易
[教师之家] 南京林业大学老师首聘期考核不过,服药自杀 +30 babu2015 2024-05-12 35/1750 2024-05-17 10:55 by hunt_a_job
[硕博家园] 民办高校入职后稳定吗? +6 905452934 2024-05-16 11/550 2024-05-17 10:15 by 905452934
[基金申请] 这个教授的科研做得真好 +5 zju2000 2024-05-14 6/300 2024-05-17 09:33 by Xiaolin81
[找工作] 浙江的高校现在门槛都这么高吗 +6 dadqweq_qw 2024-05-16 6/300 2024-05-16 23:55 by sizhouyi
[论文投稿] 手稿提交了两遍 10+3 氧化还原剂 2024-05-14 4/200 2024-05-16 22:43 by nono2009
[基金申请] 怎么成为NSFC评审专家? +11 phamacy 2024-05-12 12/600 2024-05-16 15:02 by wsjing
[考博] 急求博导收留 +9 8139173 2024-05-15 10/500 2024-05-16 13:06 by 北京炸酱面
[教师之家] 宋凯 +10 yexuqing 2024-05-14 10/500 2024-05-16 09:21 by shl2112501
[硕博家园] 求助,请问我是否该转专业 +8 ygcbl 2024-05-12 10/500 2024-05-16 09:18 by 清晨和风一起
[硕博家园] 北京航空航天大学计算机学院罗洪斌课题组招收2024年学术型博士研究生 +3 yanfeienter 2024-05-12 7/350 2024-05-15 22:52 by yanfeienter
[职场人生] 硕士毕业四年工作不顺心 +4 noora2018 2024-05-14 4/200 2024-05-15 15:19 by 1158057902
[硕博家园] 博导推荐,申博,博士招生 +5 大林挺好 2024-05-13 6/300 2024-05-15 14:51 by zxl_1105
[论文投稿] 投稿竟然倒在了Scientific Reports上。 +12 lizhengke06 2024-05-10 14/700 2024-05-15 09:34 by zqwcr
[有机交流] 无水硫酸钠除水 50+4 桃桃PXS 2024-05-13 4/200 2024-05-14 17:46 by 小肉干
[基金申请] 再谈一作和二作 +19 jklily 2024-05-10 33/1650 2024-05-13 17:12 by mierbushiwo
[电化学] 常用的国产电化学工作站有哪些? +6 123明湘 2024-05-11 6/300 2024-05-13 11:08 by 克拉妮nin
[基金申请] 科研之友老是给我发消息 +6 问君611 2024-05-11 8/400 2024-05-12 17:24 by 淀粉搬运工
[论文投稿] 请问这审稿意见准确地说是啥意思 +4 枯禅 2024-05-11 5/250 2024-05-12 14:54 by ca0yan9
信息提示
请填处理意见