大数据与其他信息密集型应用程序正不断将企业推向高性能计算,这依赖于并行处理能力。 随着科研与工程应用程序越来越普及,高性能计算(HPC)系统同样能够满足大数据处理、基于云计算的架构、不断增长的数据量与新的综合系统设计需求。 这些计算系统对现有的企业数据中心员工来说可能十分陌生。各种高性能计算设施都要根据企业不同的需求选用,但所有高性能计算应用程序都必须经过特殊优化,这与传统数据中心要求不大一样。
查阅如下五种方式,可以让HPC应用程序平台以最高的性能执行。 一、选择适合的内存 高性能系统依赖于并行处理系统,所以信息需要快速的传入与传出内存。HPC系统往往是I/O密集型的,因此选择正……
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
随着科研与工程应用程序越来越普及,高性能计算(HPC)系统同样能够满足大数据处理、基于云计算的架构、不断增长的数据量与新的综合系统设计需求。
这些计算系统对现有的企业数据中心员工来说可能十分陌生。各种高性能计算设施都要根据企业不同的需求选用,但所有高性能计算应用程序都必须经过特殊优化,这与传统数据中心要求不大一样。
查阅如下五种方式,可以让HPC应用程序平台以最高的性能执行。
一、选择适合的内存
高性能系统依赖于并行处理系统,所以信息需要快速的传入与传出内存。HPC系统往往是I/O密集型的,因此选择正确的内存配置,可以显著提升应用程序性能。公司不能受限于简单的基于“每核心多少GB”的内存配置规则来指定内存数量;选择正确的内存类型也非常重要。
HPC系统依赖于双列直插式内存(DIMM)模块,因为其是针对并行系统设计的。
有三种DIMM内存可用:UDIMM内存、RDIMM内存和LRDIMM内存。在处理较大型工作负载时,无缓冲DIMM(UDIMM)速度快、廉价但不稳定。寄存器式DIMM(RDIMM)内存稳定、扩展性好、昂贵,而且对内存控制器的电气压力小。它们同样在许多传统服务器上使用。降载DIMM(LRDIMM)内存是寄存器式内存的替代品,它们能提供高内存速度,降低服务器内存总线的负载,而且功耗更低。LRDIMM内存成本比RDIMM内存高非常多,但在高性能计算架构中十分常见。
二、升级设施
高性能计算应用程序正在迅速增长,所以系统体系未来的扩展能力需要重视。
HPC系统设计与传统数据中心基础设施设计的一大区别就是选择现成工具或定制系统。现成的系统只能在很小的范围内进行扩展,限制了未来增长。定制可以保持一个开放式的设计,让企业在将来获得更好的扩展功能。然而,额外的功能对于定制系统来说是一笔不小的代价,比购买现成系统要高得多。
三、充分利用HPC
HPC应用程序设计与传统设计不同。开发者需要将信息流拆分为并行组。
谁正在往高性能系统迁移?
2014年5月,Technology Business Research公司评估,拥有500名以上员工的美国企业,在未来12个月总计在超大规模服务器上花费约17亿美元。
在性能上的差异是显著的。例如,将一个多线程的并发式应用程序运行在Intel 2.6Ghz处理器上,八个核心可以提供接近每秒1664亿次浮点操作——非常接近系统的最大性能。如果相同的HPC应用程序通过串行而不是并行方式,那么只能提供26亿次浮点操作,这样的性能表现可能只有16%。差距会随着处理器数量的增加而拉大。数据中心需要同时优化软件和硬件,才可以最大化HPC性能。
四、保持系统一致
在HPC系统初次上线时,所有的配置都很完美,但随着时间流逝,配置会变得不一致。
不同管理员在维护集群时,可能会做出不同的配置。有时候一些变更可能没有留下文档,所以管理员无法明了哪些应用程序在运行。如果发现组件将要损坏,可能会安装新的,这些情况都可能导致应用程序出现不一致的情况。
当集群中出现不一致,HPC管理员可能会看到一些零星的异常货变化,影响应用程序性能。考虑到潜在的性能,IT部门需要实施策略来确认HPC系统中都运行着什么应用程序, 并想办法让配置同步。这些检查每季度应该进行,或者每年不少于两次。
五、关注能耗
欧洲高级计算合作伙伴的一份报告指出,在过去15年中,能源成本随着高性能计算密度增加而急剧上升。现在普通的服务器开销为每机柜30kw,这个数字还在不断上升。由于高密度,高效率数据中架构基础设施与冷却系统变得至关重要。
美国能源部的可再生能源实验室也是HPC采用者,并且在积极采取措施解决能耗问题。在其数据中心,高电压(480伏交流)电直接供给到机架,而不是采用传统的208伏降压,这样可以节约电子电力设备因电力转换的损耗。利用节能型泵取代了嘈杂、低效率的风扇。
相关推荐
-
Nvidia收购Mellanox以应对日益激烈的人工智能、数据竞争
Nvidia公司正计划以69亿美元收购以色列互连制造商Mellanox公司,以应对竞争日益激烈的数据密集型计算 […]
-
数据中心GPU市场将增长,用于AI工作流程
企业级数据中心GPU可通过硬件升级帮助企业利用并行处理功能,这有助于企业加速工作流程和图形密集型应用程序,同时 […]
-
看IBM数据科学团队如何助力企业用户AI项目
在下面的Q&A中,IBM公司的Seth Dobrin探讨了如何提高企业用户对机器学习和AI项目的兴趣, […]
-
DR基础知识:灾难恢复计划和灾难恢复策略
IT灾难恢复(DR)计划的主要目标是制定详细的恢复计划,以在意外中断时执行。 这种计划应该列明详细步骤,说明在 […]