企业级数据中心GPU可通过硬件升级帮助企业利用并行处理功能,这有助于企业加速工作流程和图形密集型应用程序,同时,管理员仍在寻找新方法来利用GPU。
工程师们最初设计GPU芯片用于从CPU卸载图形处理。GPU支持图形应用程序,并在游戏行业中找到利基用例。当该技术完善后,企业开始使用GPU来支持虚拟化基础架构和高级用户。
2009年,企业开始定期使用GPU用于高性能计算(HPC)应用程序和AI。很多企业使用基于GPU的服务器进行AI培训,而HPC部署则在大学、研究实验室和具有特定计算需求的公司中更为常见。更传统的HPC用例在科学领域,但其实该技术也可用于金融和医疗保健等行业。
为了满足HPC、虚拟化和AI等应用程序的需求,企业必须有合适的框架来支持大量基于GPU的服务器。这种对GPU的有效部署很具挑战性,也有技术复杂性。Linley集团总裁兼首席分析师Linley Gwennap表示,大多数部署都发生在大型企业–而不是中小型企业。
SQream公司首席执行官Ami Gal表示:“Nvidia和AMD [Advanced Micro Devices]都有高质量的企业级卡,专为数据中心处理而设计。这些卡不仅适合在主动冷却服务器运行,而且还具有纠错码存储器,可在错误数据破坏数据集前修复坏数据。对于运行任何类型数据处理和分析流程,这个功能都是关键要求。”
GPU在数据中心
企业应安装数据中心GPU架构,这种架构非常强大,足以支持多位用户,并可为网络中的每个人提供足够的带宽。
Supermicro公司GPU服务器组产品管理总监Sarosh Irani解释道:“这就像,如果我有一套三居室的公寓,我不希望15人共享这间公寓。如果太多人必须使用GPU资源,那么他们就会使硬件紧张并且无法发挥高带宽处理组件的作用。”
如果想要提供良好的性能,管理员需要估计每个GPU的用户数量,以及每个用户的要求;某个工作流可能需要比另一个工作流更多的内存或存储。
优化的GPU使用和管理使管理员可以卸载更密集的图形处理工作负载,以及释放CPU,从而在低带宽应用程序中实现更一致的性能。
对于GPU,企业面临的主要挑战之一是整合现有基础架构上的新设备。Irani将其与道路上的汽油汽车与电动汽车的数量进行了比较;尽管现在已经有充电站网络,但它们的数量远远比不上加油站。虽然电动汽车可以充电和运行,但如果只有较小的充电站网络,这会严重影响部署率。
Irani称:“我们无法让基础设施灵活自如。”当前的数据中心主要支持CPU电源结构,因此添加GPU会改变电源、加热和冷却要求。在传统数据中心,对电源传输进行改造也是企业需要考虑的因素,但与升级难度相比,成本和时间更为重要。
软件方面
软件是数据中心GPU部署的另一个主要组成部分。
Irani称:“你可能拥有世界上最强大的硬件,但如果你没有软件来巧妙地利用这些硬件,那么它们可能会变得无用。你肯定需要软件来配合硬件。”
软件需要代码,以将计算指向GPU资源,而不仅仅是使用CPU进行处理。Irani指出,在这方面,Nvidia的CUDA被视为行业标准。
并行计算平台和编程模型使程序员更容易根据关键字添加扩展。虽然数据中心管理员通常不会直接编写软件,但他们最好了解管理和工作负载均衡。
Irani补充道,软件开发是初创公司面临的挑战。他们拥有硬件,但他们需要确保有可用的软件抽象层。当缺乏具备创建软件层技能的人才时,企业将很难有效部署数据中心GPU。
看看这个市场
在过去的一年中,我们看到GPU的稳步增长,尽管它们的成本很高以及集成考虑因素。
Nvidia报告称,2017年的数据中心收入为19亿美元。根据Gwennap的说法,在2019年,这一数字预计将增长,紧跟2018年的增长势头。
他补充说,在2018年,Nvidia的收入增长了约55%。Gwennap解释说,在2019年,这一增长水平预计将放缓,大约会比2018年增加10%。这种放缓似乎与云服务器采购的周期性减少以及由于竞争加剧导致的价格下降有关。 AMD的预计收入更少,因为Nvidia占据着非常大的市场份额。
在2018年初,Nvidia更新了其许可协议,禁止GeForce和Titan软件驱动程序在数据中心级部署。根据Nvidia的声明,该软件未获得许可在数据中心部署,区块链用例除外。
Gwennap表示,由于性能和可靠性原因,很少有数据中心使用消费类GPU,因此许可证更改对市场影响不大。
这意味着,如果较小的企业想要运行更高级别的GPU的话,他们将需要评估GeForce和Titan产品线以外的选项。
随着基于GPU的计算在企业内增长,开始出现创新的应用程序,包括自动驾驶汽车、AI和加密货币。
Irani称:“AI是一个非常热门的领域,目前企业正在进行大量投资,这些投资不仅来自大型计算公司,还有风险投资公司。”
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号

TechTarget
官方微博

TechTarget中国
翻译
相关推荐
-
Nvidia收购Mellanox以应对日益激烈的人工智能、数据竞争
Nvidia公司正计划以69亿美元收购以色列互连制造商Mellanox公司,以应对竞争日益激烈的数据密集型计算 […]
-
聚焦超算发展 Intel助力人才培育
英特尔近20年来一直关注并积极推动产学研合作,致力于将行业最先进技术引入高校,推动高校计算机课程更新和改革。
-
首摘戈登·贝尔奖 我国超算软实力显著提升
11月17日,在美国盐湖城举行的2016年全球超级计算大会上,中国代表队首次获得国际高性能计算应用领域最高奖戈登贝尔奖(ACM Gordon Bell Prize),实现了我国高性能计算应用在此奖项上零的突破,成为我国高性能计算应用发展的一个新的里程碑。
-
超算榜单那些事:HPC的主流网络还是InfiniBand
2016年10月28日,中国HPC TOP100榜单公布,除了神威太湖之光主要用于科学工程计算外,其余6套新增系统均用于新兴的大数据分析及机器学习领域,且大多部署于互联网公司。