对于现在的IT专业人士,机器学习和人工智能是流行词语,而对企业的数据中心而言,它们带来真正的希望。
与你或你的团队相比,机器学习软件可更快地主动预测情况,甚至可能更快地解决问题。这些系统是当今混合数据中心环境的逻辑延伸,也是数据中心基础设施中不断增长的一部分。
根据Uptime Institute 在2022年的调查显示,57%的数据中心运营商相信人工智能和机器学习可以执行常规操作决策;很多人仍然只将其用于电力和冷却优化以及异常检测。
而在Uptime Institute 的2023年调查中,73%的受访者认为基于人工智能的软件将降低设施人员配置水平,25%的受访者认为这将在五年内发生。数据中心的人工智能和机器学习可以优化你的大部分整体运营,包括规划和设计、工作负载、正常运行时间和成本管理。
数据中心机器学习用例
机器学习可以从场景和数据集中学习,以形成即时反应,而不是需要人为干预或依赖一组有限的预编程行动。这项技术可以帮助你更好地了解数据中心系统,更有效地管理它们,并防止意外停机。以下是机器学习和人工智能可以优化数据中心性能的几个用例。
1. 创建更高效的数据中心
企业可以使用机器学习自主管理其数据中心的物理环境,通过软件对物理设施和数据中心架构进行实时调整,而不是软件警报。
谷歌、Meta和微软使用人工智能和机器学习来监控其数据中心的能源和性能优化。
2. 降低运营风险
对于数据中心运营,防止停机至关重要。机器学习可以预测和防止停机时间。数据中心机器学习软件监控来自关键设备(例如电源管理和冷却系统)的实时性能数据,并预测硬件何时可能出现故障。这使运营人员能够对这些系统进行预防性维护,并防止代价高昂的停电。
基于机器学习的风险分析可改善数据中心的正常运行时间,主要通过建模不同配置来提高灵活性;确定预防性维护的机会;并在潜在的网络安全风险出现之前确定这些风险。
3. 使用智能数据减少客户流失
企业可以在数据中心使用机器学习来更好地了解客户并预测消费者行为。作为客户成功计划的扩展,机器学习可以帮助分析数据中心内大量数据,这些数据在收集后就被闲置。
在结合机器学习软件与客户关系管理(CRM)系统时,人工智能驱动的数据中心可以搜索和检索存储在历史数据库中的数据,这些数据在传统上不用于CRM。这使得CRM系统能够制定不同的策略,从而实现客户成功。
4. 管理电力和能源消耗
企业可以通过机器学习来管理能源,并立即看到显著的收益。例如,西门子的数据中心基础设施管理软件Datacenter Clarity LC使用人工智能驱动的工具来分析单个服务器,以检测异常和优化机会。
机器学习和人工智能工具可发现效率较低的服务器,并工作负载重新路由到更高能效和工作效率更高的服务器。运营人员会收到更换旧服务器的通知。此通知让运营人员有时间在服务器过时之前升级服务器。
5. 分析系统日志
大多数数据中心系统在工作时生成日志,但如果没有得到管理,它们对运营人员没有用。机器学习可以集中和分析日志,并创建对数据中心团队有价值的易于使用的报告。Elasticsearch等开源技术和Splunk的付费选项,可以分析和摄取机器学习例程收集的数据。
6. 执行根本原因分析
当出现性能错误时,运营人员必须能够快速识别根本原因并修复它。人工智能预测引擎,例如Hewlett Packard Enterprise的InfoSight,提供工具可在企业的本地数据中心和云设置中几乎实时识别和解决错误。
AI和机器学习策略以优化数据中心
随着技术的发展,数据中心硬件和软件正变得越来越复杂。这些需求影响了IT员工和整个IT基础设施的运营。
AIOps和MLOps
AIOps和MLOps是指在IT运营中利用人工智能和机器学习来自动识别和解决IT运营问题。这些方法是多层平台,将机器学习、分析和数据科学应用于企业级的IT运营,无论是在本地还是在数据中心。
AIOps分解数据孤岛,以汇总和分析来自服务和运营管理工具和应用程序的IT数据。所识别的模式决定了它是否可能自动处理修复或提醒IT团队。
MLOps是机器学习的演变,可用于提高自动化。MLOps还部署、维护和监控机器学习模型。
SecOps和DevOps
SecOps和DevOps是相关术语,指的是网络安全和技术开发活动中的人工智能和机器学习。以前的自动化工具并没有减少安全分析师的工作量;甚至增加了工作量。带有人工智能的SecOps可以减少错误,并使分析师的工作更加高效和全面。分析师必须找到导致警报的原因,但SecOps工具可以更主动地识别错误。
在DevOps中,人工智能工具自动化并优化软件开发和交付流程。人工智能使测试和部署流程自动化,提高软件开发的准确性和质量,并优化资源使用和资产配置,例如云基础设施。当代码通过测试时,它会自动集成到生产代码库中。
人工智能可以在开发人员工作时向他们提供代码建议,这减少了创建新功能或产品所需的时间。人工智能还可以在开发过程中对代码中的错误进行根本原因分析,使DevOps团队能够识别错误并采取纠正措施。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
翻译
相关推荐
-
英特尔收益超预期,但AI芯片Gaudi令人失望
尽管在快速增长的数据中心AI芯片市场遭遇挫折,但芯片制造商英特尔的最新收益报告让投资者感到乐观。 在10月31 […]
-
英特尔、AMD成立x86联盟,联手对抗Arm
英特尔和AMD成立了一个x86咨询小组,以提高互操作性,并避免未来市场份额流向Arm处理器。 X86生态系统咨 […]
-
博通CEO称,VMware平台是对用户的投资
在宣布公共云给IT团队带来“创伤后应激障碍”大约一个月后,Broadcom总裁兼首席执行官Hock Tan正试 […]
-
针对数据中心的平台工程最佳做法
现在企业需要更快的应用程序开发周期,这需要简化DevOps工作流程。新兴学科–平台工程提供对常见、 […]