您是否已经为贵公司的非结构化数据转化为可操作的商务智能的前景感到兴奋了呢?您首先要做的第一步是创建一个数据存储架构,能够处理字节数据。EMCIsilon的尼克·基尔希表示横向扩展网络附加存储(scale-outNAS)是最好的解决办法,他建议CIO们利用如下五大原则来进行判断。
随着企业纷纷开始寻求进军大数据领域,大量的数字化文件、保存电子邮件通讯、Word文档、Excel文件以及各种其他非结构化数据均有可能被挖掘出可操作的商务信息,他们需要解决当前的一个大重大问题:存储。
EMCIsilon产品管理总监尼克·基尔希说:“企业大量的数据信息突然激增,他们面临着类似的挑战:他们要如何利用他们已经得到的所有信息;他们如何在一个可扩展的架构内存储这些数据信息?”
一种可能性是垂直扩展(规模)。这样做是为了使您现有的存储节点更大、更快/或利用新的,更高容量的设备取代您现有的存储设备,使之更强大。通过这样一种方式巩固存储基础设施是相当具有吸引力的,因为它简化了管理,减少了占地空间和电力消耗的数量。但这也并非完全没有问题:其不能轻易跨越多个位置,它不会有很多内在的整体弹性,高性能的存储设备可能会在繁忙时段无暇顾及。而当处理日益增长的海量信息时,最大的问题是,今天的存储设备是有限的。
“您可以建立一个越来越大的单元控制器,但是,在某些时候,您不能任意扩大该系统,您必须添加第二个系统,您可以结束需要管理的数百个独立单位。”基尔希说。
相反,基尔希建议采用横向扩展NAS。扩展的NAS架构放弃昂贵的用于存储组件组合成一个存储池的大容量存储设备。相反的,代替以更大的节点,而无需添加必要的节点。缺点是,您可以很快结束一个更为复杂的管理环境。但其可以跨多个位置,有一个很大的固有弹性。而且,也许最重要的是从管理角度大的数据的角度来说,您可以快速而廉价地添加存储。
基尔希说:“我认为最重要的事情,当涉及到存储的时,管理一个单一的单位真的很容易,但是当您有两个或两个以上的单位时,就变得复杂。”
对于大的数据,NAS采用SAN是可取的,基尔希说,因为SAN不是为了建立非结构化数据和文件共享。为了使用SAN网络协议,如NFS或CIFS/SMB,您就必须在SAN前面部署文件服务器,从而增加了额外的管理复杂性和影响的可扩展性。
NAS扩展的五大原则
基尔希给予CIO们在扩展存储架构的五大原则建议的第一条原则便是简单:
简单的规模。“他们正在寻找转移到的下一代架构需要简单的规模。”如果我有一个1TB的驱动器,在这个范围内,我可以很容易的管理、保护、复制数据。同样的简单的道理,为什么我不可以管理15个字节的呢?不应该说其容量增大就变得更复杂。”基尔希说。扩展的架构可以解决这一问题,利用软件管理和虚拟化/抽象层,使节点的行为就像一个单一的系统。
可预测性。“性能是可预测的。”基尔希说。如果我在本周和和下周分别添加6TB的数据,我需要同线性可扩展性方面的性能。我不想重新构建我的应用程序或重新指导我的用户。它应该是以可预见的方式扩展。我需要按照其不断的发展壮大进行投资。不要让我在今天就过度投资。我知道摩尔定律会在下个月给我更快的计算,驱动器密度会随着时间的推移更强。让我充分利用存储基础设施的优势。共享对称结构。不要强迫我去理解不同的架构。让我来扩展这个系统,因为我需要它。
高效。“让我能够充分利用所有存储系统的资源,无论他们在哪里。”基尔希说。“让我充分利用我的物理磁盘驱动器,而不是只有50%或55%,但超过80%的存储空间应当用于数据存储。不管CPU是计算或缓存,让我能够充分利用其优势。无论该应用程序是否热门,我希望应用程序存储系统性能最大化。并将此系统进行整合。”换句话说,您应该移动数据来优化性能或优化能力。扩展存储NAS大数据是需要满足您的智能自动化。
可用。“必须在任何时间都是可用的。”基尔希说。N路架构的优势,可以让我在经历两次失败后继续。可以让我在我的环境下当机架出现故障时继续。我需要其必须在任何时间都是可用的。而且是灵活的。可以让我根据业务保障的需要调整制度。如果他们愿意投入更多,我可以给提供更大的可用性。如果数据是不值钱的,我可以提供较少的可用性。”归结起来,因为扩展存储基础设施是部署在商品硬件上的,还有一个假设,硬件运行失败,该系统已被设计用来处理一个较高的硬件故障。
企业证明。“随着技术的成熟,这方面已经不再是IT这之外的项目了。”基尔希说。这是IT的一个关键部分。其有快照、复制、配额和其他传统IT的功能。该技术真正发展出的一种高性能计算的根,但如果您要去建立一个扩展系统,最终您必须适合您企业的环境。”
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
相关推荐
-
探索Hadoop发行版以管理大数据
Hadoop是一种开源技术,它也是数据管理平台,现在它通常与大数据分布相关联。它的创建者在2006年设计了原始 […]
-
超融合基础架构系统的四块短板
超融合基础架构能够帮助IT部门更有效地获取和交付资源,但有几个问题会是买家所无法忽视的。 作为高度集成的单一化 […]
-
数据经理应该研究GPU深度学习
与AI相关的深度学习和机器学习技术已经变成大数据圈常见的讨论话题。这一趋势对于数据管理者们来说是值得关注的,原 […]
-
机器学习在崛起:但其算法的结果是否公平?
算法正在通过很多很不可思议的方法控制着我们的生活。但在没有透明度的情况下,我们很难知道机器学习算法所评估的结果是否公平……