GPU,Graphics Processing Unit,即图形处理器,它是显卡的“心脏”,专为执行复杂的数学和几何计算而设计,用于图形渲染。一些GPU集成的晶体管数甚至超过了普通CPU。
NVIDIA(英伟达)在1999年发布GeForce256图形处理芯片时首先提出GPU的概念。它使显卡削减了对CPU的依赖,承担了部分原本是CPU的工作,尤其是在进行3D图形处理时用户体验更佳。
深度学习需要GPU加速
如今,GPU不再局限于3D图形处理。在浮点运算、并行计算等方面,GPU可以提供数十倍乃至于上百倍于CPU的性能。
在最新一期的TOP500超级计算机榜单上,加速型系统的数量首次突破100台,其中基于NVIDIA Tesla GPU的超级计算机占70台,包括24台新近上榜系统中的23台。
除了高性能计算,GPU自身具备的高并行度、矩阵预算与强大的浮点计算能力也符合深度学习的需求。它可以大幅加速深度学习模型的训练,在相同精度下能提供更快的处理速度、更少的服务器投入以及更低的功耗。
NVIDIA解决方案工程架构副总裁Marc Hamilton表示,过去三年,整个行业对深度学习的兴趣大幅提高。一是大数据的发展,拥有足够的训练数据可用;二是机器学习与深度学习算法的发展;三是GPU带来的强大计算能力,满足对数据与计算能力有高要求的训练。
NVIDIA解决方案工程架构副总裁Marc Hamilton
做语音云的科大讯飞负责人表示,目前市面上没有一个成熟的深度学习平台,需要自己拼凑,同时没有针对深度学习定制的加速芯片,目前芯片的处理性能仍然较弱。
Marc告诉TechTarget中国,NVIDIA首先需要从三个方面促进深度学习解决方案的成熟:一是基础的深度学习框架。主要指由开源社区开发的诸如Caffee、Torch都支持GPU,NVIDIA所做的是在它的下面构建cuDNN,即深度神经网络库,现在更新到3.0版本,可以支持很多常用的函数和功能。
其次是发布了Digits软件第二版升级本,增加了图形用户界面。与单一GPU相比,这种扩展在图像分类方面能够令深度神经网络训练的速度翻一番。
“以上都是软件平台,不涉及硬件,”Marc说,“很多用户希望我们推出软硬结合的设备。在美国,我们已经有DIGITS的设备出货。”他口中所说应该是DIGITS DevBox整机,是面向专业开发者的工作站,配备四路GTX Titan X显卡,预装了一套DIGITS软件包,包括Caffe、Theano、Torch及支持GPU加速的cuDNN等深度学习软件。
这显然需要与OEM厂商合作。他说:“目前,中国市场上还没有相关的产品出售。我们现在正在和中国本地OEM厂商积极商谈中。”
至于定制芯片,Marc打趣道:“我们年产8000万芯片,如果你要4000万颗,我们就为您定制。”基于研发与制造成本的高昂,以及芯片的快速迭代,NVIDIA生产的是通用GPU,只上面的编程不一样,可以承载不同的应用。而且,明年即将出货的下一代Pascal GPU比现有的性能提升十倍。
深度学习听起来就很高大上,实际上对于我们的意义在哪里呢?
Marc表示,在推断与视频处理方面GPU有很好的应用前景。无论是做社交网络还是做搜索的企业,他们需要处理快速膨胀的数据与视频资料,速度还得快,GPU加速就能派排上用场。
芯片中的超跑:Tesla
Tesla,为人熟知的是性能超强、外观超酷的超级跑车。NVIDIA的Tesla也可以说是芯片中的超跑。K20、K20X以及K40已经应用于众多企业、研究机构广泛,在机器学习、数据分析、科学计算以及高性能计算等领域发光发热。
新的Tesla K80双GPU加速器比当今最快的CPU高10倍,其单精度峰值浮点性能为8.74 Teraflops,双精度峰值浮点性能为2.91 Teraflops,峰值内存带宽为480 GB/s,非常适合于数据密集型应用。
比如瑞士国家气象局使用的Cray公司提供的超算系统,搭载就的是Tesla K80 GPU,为瑞士人提供精准的天气预报。
当然,NVIDIA拥有丰富多样的GPU产品。最早的GeForce主要针对游戏,低廉的价格也很适合普通开发者。同时,随着云计算的深入,NVIDIA在Microsoft Azure云平台上向用户提供基于NVIDIA GPU的专业图形应用和加速计算功能。
“K40的架构目前最适合深度学习,”他表示,“K80更适合油气行业。”当然,除了微软,IBM与阿里云未来也将在云端推出基于K80的图形应用和加速功能。
NVIDIA全球副总裁、PSG &云计算业务总经理Ashok Pandey补充,企业根据自身的需求以及预算采用合适的GPU。
“比如汽车无人驾驶,”NVIDIA中国区企业传播高级经理Steven Jin说,“我们现在利用Tegra K1和Tegra X1,让汽车具有学习的能力。”
NVIDIA亚太区首席技术官Simon See表示,日本在汽车领域利用深度学习进行了许多研究。
未来计算在GPU应用上完成
高性能计算、数据中心、互联网、云计算、大数据、深度学习……只要是需要强大计算能力与加速功能的地方,都能看到GPU的身影。
不仅有各种型号各种用途的芯片,还有300多款支持GPU加速的应用,以及与诸多伙伴打造的生态圈,作为视觉计算与加速计算领域的领导者,NVIDIA显然有了更广阔的发展空间。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
作者
相关推荐
-
NVIDIA宣布:2017年将培训10万名深度学习开发人员
NVIDIA今日宣布,2017年将通过NVIDIA深度学习学院培训10万名开发人员,以满足人工智能领域对专业技能飞速增长的需求。
-
当GPU加速计算遇上传统数据中心……
曾经被视为游戏技术的GPU,如今已经进入企业数据中心,并促进了在这一领域机器学习、人工智能等方面的发展……
-
2016:弱人工智能发展前沿观察
当前,人工智能已经成为风靡全球的科技焦点和投资热门。各大科技巨头都在提前布局自己的大脑计划(DeepLearning Program),意在抢占AI时代的重要入口。2016,为您盘点弱人工智能领域具有代表性的技术和公司。
-
网红时代 增强现实怎么玩?
活跃于AI领域的商汤科技拥有专利技术产品SenseAR增强现实感特效引擎,在直播平台竞争进入白热化的当下,进一步满足了终端用户的娱乐和个性化需求。