英伟达(Nvidia)凭借强大的GPU赢得了最大的云提供商的业务,以运行其AI模型和服务。该供应商正在转向下游,带着专注于企业数据中心的广泛工具集和合作伙伴大军。
本周,该公司的年度开发人员会议Nvidia GTC吸引了数千名数据科学家以及电气和计算机工程师,希望学习如何构建、部署和管理人工智能特有的软件。除了技术人员外,还吸引着客户和合作伙伴进行交易,并推动“分析师将改变业务”的行业。
现在为运行业务软件的服务器提供动力的CPU数据中心将让位给生成AI(GenAI)模型特有的基础设施。部署和运行GenAI模型将需要新的工具集。
英伟达首席执行官Jensen Huang在本周的开幕主题演讲中表示,通用计算已经筋疲力尽。我们需要另一种计算方式。
Huang推出了该公司 AI Enterprise platform的第5版,其新技术被这位高管描述为Nvidia inference microservice(NIM)。这款集成软件简化了创建和开发GenAI应用程序的过程,这些应用程序利用Nvidia的CUDA(Compute Unified Device Architecture)、并行计算平台和针对该公司GPU的编程模型。
分析师们预计很多企业会在内部部署小型语言模型,以便他们能够对企业数据进行微调,而无需将敏感信息转移到公共云。在数据中心运行模型有时比云更便宜。
英伟达合作伙伴瞄准企业
NIM很有帮助,因为它简化了定期将现实世界数据提供给训练有素的模型的过程,以便它可以做出最新的响应,这个过程被称为推理。人工智能模型培训平台制造商Weights & Biases公司首席营销官Robin Bordoli说,拥有自动化与模型相关的流程的工具意味着传统软件工程师可以完成这项工作,而不是难以找到的人工智能专家。
Weights & Biases已将其软件与Nvidia的推理引擎集成,因此开发人员可以从支持30个基础模型的平台进行训练和推理。Bordoli说,现在,Weights & Biases有1000名客户,其中很多是政府机构和生命科学组织。
他说:“我们正在帮助下一组客户:企业。他们永远不会从头开始构建模型,但他们想采用现有的模型,并在企业数据上对其进行微调。”
人工智能应用程序矢量数据库提供商DataStax公司开发人员关系副总裁Patrick McFadin说,Nvidia已经构建了NIM作为容器在Kubernetes上运行,Kubernetes是企业熟悉的开源容器编排平台。
McFadin说:“我立即注意到的是,它是使用Kubernetes部署。在大型企业运营基础设施的人正在使用Kubernetes,所以可以很好地融入其中。”
英伟达合作伙伴戴尔技术公司提供各种PowerEdge服务器,具有英伟达AI Enterprise软件和GPU、H100和L40S。
戴尔基础设施和电信营销高级副总裁Varun Chhabra说:“我们从大多数企业中看到的是现成的模型,无论是大型模型还是小型模型,并将其与专有企业数据相结合。”
戴尔认为,检索增强生成(RAG)将与企业内部的推理一样重要。RAG是一个包含信息检索系统的架构,以保护私人数据。
Chhabra说:“RAG是我们关注的一大领域。”
Chhabra称:“Nvidia NIM最重要的好处是将推理所需的很多微服务打包在一个容器中。它以交钥匙的方式做到这一点。”
Chhabra说,人工智能软件和运行它所需的加速计算正在改变数据中心。
他说,这表明我们正处于一个拐点。数据中心的全面重建即将到来。
Nvidia GTC的客户
在会议上,Nvidia客户描述了他们如何与GenAI合作,所有这些都是在早期阶段。这些公司包括LinkedIn;全球广告公司WPP;化妆品制造商L’Oreál;以及德国索赔管理软件制造商ControlExpert GmbH。
WPP与Nvidia合作开发了内容引擎,用于使用Nvidia Omniverse Cloud和GenAI创建客户产品的视频、3D和2D图像。该系统还使用来自Getty Images的照片和Adobe内容创建技术。
WPP公司首席技术官Stephan Pretorius说,广告艺术的质量取决于生产这些作品的人工智能模型可用的数据。
他在一次演讲中说,我们发现,在我们与客户合作时,客户的品牌定义非常非常清晰,非常准确地描述了品牌的个性、语气、声音等,我们得到的结果比分散时要好得多。
Pretorius说,从本质上讲,WPP使用人工智能来模仿“人类内容创建过程”。鉴于这种工作的复杂性、规模和数据量,如果没有人工智能,你就无法完成这样的事情。”
Pretorius认为,基于AI的与网站访问者的语音通信最终将取代当今的内容驱动方法。
他说,我们相信内容消费的未来将在很大程度上是对话性的。
欧莱雅正在测试GenAI,为故事板制作图像,以及测试Nvidia Omniverse,为该公司包装产品制作3D渲染。他们还在使用几种人工智能模型。
该公司为其模型提供数千个品牌图像以及背景颜色、不同类型的光线和布景,例如优雅的巴黎日落。广告创作者可以使用自然语言让模型创建图像,以激发营销其37个全球品牌的想法。
该系统可以帮助想象场景,例如未来的美容院或使用红色星云等空间现象的广告。
欧莱雅首席数字和营销官Asmita Dubey在接受采访时谈到GenAI时说:“GenAI对数据进行了重新解释。这是创造的速度,它可以做得更快。”
在过去的六个月里,欧莱雅与Nvidia Omniverse和WPP合作,为其产品创建自定义3D模型,以便它可以更改背景、颜色和阴影,而不需要摄影师在工作室呆上几天。欧莱雅只需要简单拍摄产品包装的所有角度。
该公司认为这样做可以节省时间和金钱,但仍处于使用Omniverse的早期阶段。
在会议的小组讨论中,LinkedIn工程副总裁Sabry Tozin表示,该公司使用人工智能进行语言翻译。这让内布拉斯加州奥马哈的客户服务代表在不懂语言的情况下用西班牙语、法语或德语与客户交谈。
Tozin说,这实际上允许我们保留资深客服代表,他们非常了解我们的产品并可向客户提供深入答案。
ControlExpert公司软件使保险公司能够让客户拍摄事故后汽车损坏的照片,并通过移动应用程序将图像发送给供应商。
人工智能模型分析图像,评估损坏情况,并返回估计的维修成本和批准的汽车车身车间列表。据该公司称,ConrolExpert客户包括90%的保险公司。
该公司根据20多年来收集的数据对其模型进行了培训。据该公司创新和技术总监Sebastian Schoenen称,它每年处理2000万份索赔。
汽车模型设计定期发生变化,维修价格也会波动,因此ControlExpert不断更新其车型。尽管如此,仍有一小部分案件需要人为干预。
Schoenen说: “如果我们看到我们的模型无法处理,我们就会安排人员来处理索赔。”
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
翻译
相关推荐
-
英特尔收益超预期,但AI芯片Gaudi令人失望
尽管在快速增长的数据中心AI芯片市场遭遇挫折,但芯片制造商英特尔的最新收益报告让投资者感到乐观。 在10月31 […]
-
英特尔、AMD成立x86联盟,联手对抗Arm
英特尔和AMD成立了一个x86咨询小组,以提高互操作性,并避免未来市场份额流向Arm处理器。 X86生态系统咨 […]
-
博通CEO称,VMware平台是对用户的投资
在宣布公共云给IT团队带来“创伤后应激障碍”大约一个月后,Broadcom总裁兼首席执行官Hock Tan正试 […]
-
针对数据中心的平台工程最佳做法
现在企业需要更快的应用程序开发周期,这需要简化DevOps工作流程。新兴学科–平台工程提供对常见、 […]