系统宕机:设备和应用不再是大问题,人为错误是关键

日期: 2017-03-21 作者:张程程 来源:TechTarget中国

如果问系统管理员什么是最令其担心的问题,十有八九会说是系统宕机,这一点对业务中断忍受度极低的金融行业来说尤为如此。随着数字化转型的进一步推进,越来越多的企业业务依赖IT技术,IT系统宕机极易导致企业的瘫痪,造成的影响和损失不可估计。

对于IT团队来说,即便尽全力也几乎不能保证系统100%正常运行,只能通过规划冗余以尽可能地保持更多的正常运行时间。

实际上与几年前相比,现在的软件更具弹性,无论是商业软件还是开源软件出问题的几率都比较小,出了问题管理员也可以通过使用虚拟机、配置和编排以快速恢复正常运行。

系统宕机最常见原因不再是设备或应用程序故障,而是人为因素,即系统管理员的错误操作。随着企业更多地部署虚拟化及采用公共平台,现代企业IT变得越发复杂,这导致了人为错误的增加。且很多管理员仍在使用命令行界面,和系统情况变更之间没有任何把关。这样即便管理员操作正确,在复杂环境中也可能造成极大影响,诸如其指令可以解决当下的问题,但调用资源可能会与数据访问产生冲突而导致其他工作负载问题。

在此种情形下,采用自动化以减少人为错误显得弥足重要。比如创建可运行脚本库,可重复授权使用这些脚本;此外,使用编排系统不仅可以调配脚本,也可以调配修补程序,对于部署混合云的企业可以采用编排工具以帮助自动化和管理。

除人为错误外,网络攻击也会导致非计划性系统宕机。DDoS攻击能拖垮服务、恶意软件会导致数据损坏和系统停机,而臭名昭著的勒索软件则更为棘手,一旦中招会加密企业数据。对此,企业可采取安全供应商提供的安全产品和保护服务来提高系统安全性,从而避免系统宕机。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

作者

张程程
张程程

TechTarget中国编辑。专注报道企业级安全、网络领域的技术更迭和趋势变革,负责安全网站与网络网站的内容规划、组稿、原创和编辑。

相关推荐

  • IT运维机器人的崛起

    机器人真的以软件形式来到IT世界了吗?很有可能。机器人,以某种有效方式模拟人类技能或人类功能特性,是一种自动化实施方式……

  • 精简Linux系统管理工作的五个秘诀

    Linux系统内部比较复杂,因此高效的管理效果大有不同。了解诸如systemd和开源PowerShell等工具如何帮助管理员的工作更加轻松……

  • 因地制宜:为企业数据中心添加自动化

    如今,自动化是很多数据中心的建设重点,这个术语已与云计算融合。人们都在宣扬自动化,在某些情况下,IT人员甚至不确定什么是自动化或为什么需要自动化……

  • 精简大型机系统管理的五项诀窍

    从容量规划到更高效的虚拟存储管理等等,市面上都有各种各样的工具及策略可以实现大型机性能的优化。在本文中,主要介绍了精简大型机系统管理的五项诀窍……