为什么列式数据库对IT很重要?

日期: 2014-01-15 作者:Wayne Kernochan翻译:唐琼瑶 来源:TechTarget中国 英文

有效利用列式数据库将对业务与IT产生重要影响。

如果列式数据库使用不当,将无法从数据中获取最佳价格与性能,甚至结果会背道而驰。列式数据库技术可让大数据分析更深入,加速企业报告生成速度,并减少存储所需的管理员数量。

如果与拥有列式相关的压缩技术的厂商合作,列式数据库就能大量节省数据仓库所需存储的成本。在处理数据时还能获得更好的用户支持、更好的性能,还能与现有的关系型数据库和谐工作。我这边关于总体拥有成本的研究表明,添加列式到关系型数据库会产生额外的管理复杂度,因为需要处理两个而不是一个数据库,不过列式数据库通常不太复杂,而且数据高度压缩,所以对管理员来说还是能搞定。

了解数据库结构

列式数据库存储数据,顾名思义,是列(所有给定区域的数据)而不是行(所有给定用户记录的数据)。列式技术最常用于商业智能与分析应用领域。但也有一些厂商通过列式架构来解决OLTP与混合应用负载,比如典型的企业应用。

事实上,列式数据库的应用甚至比我们所熟悉的行式数据库的历史更长。当IBM引入第一个面向行的关系型数据库时,来自美国的Computer公司已经在销售非关系型的列式Model 204数据库了。在90年代,Sybase推出了Sybase IQ产品,这样列式存储技术才真正应用到关系型数据库当中。

面向行的数据库技术擅长做随机读取、单个插入与更新,可访问拥有两到三个字段以上的单个记录。列式擅长跨大量包含共性的列(或字段)记录查询,以便有效压缩。目前列式数据库不涉及个人记录的更新,但处理大量上传到数据仓库还是可以的。

完全取代面向行的关系型数据库没有意义,比如SAP上的DB2与Peoplesoft上的Oracle。列式数据库技术将逐渐接管数据仓库与分析,是对现有运营型数据库的补充。IT经理可根据项目需求购买某个厂商的解决方案,比如用来支持大数据分析,但也可以将更多的核心数据仓库转移到列式数据库上。

另外,列式数据库是否能成为Hadoop的好基友还尚待分晓,因为MySQL和其他面向行的关系型技术也能很好地满足Hadoop环境。虽然来自社交媒体的半结构化与非结构化的数据能从一些列式压缩中受益,但真正的用户案例还是比较少。

如果你的企业决定采用列式数据库处理技术,那么需要制定正确的工具来进行。四大厂商甲骨文、惠普、SAP与IBM在列式数据库市场都有一席之地。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

作者

Wayne Kernochan
Wayne Kernochan

Infostructure Associates主席

相关推荐

  • 列式数据库在大型机上前景如何?

    早在上世纪70年代,VectorData和1010data的原型就被当作是大型机上的列式存储解决方案,而Sybase IQ则流淌着美国计算机公司Model 204反向列表数据库的血液……