搜狐数据中心建设运维经验谈

日期: 2009-05-06 作者:祁金华 来源:TechTarget中国 英文

  虽然由于种种条件限制,搜狐公司一直没有建设自有数据中心,但是这并不妨碍他们与IDC沟通,为建设新一代数据中心而积极努力。

  作为一家国内外知名的互联网企业,搜狐公司一直走的是非常普通的业务发展之路。像最初的时候,租用电信运营商IDC的几个机架放置服务器,到不断地租用更多的机架空间,甚至不断地租用更多的IDC或者不同城市的IDC来保障业务的可扩展性、稳定性和相关的冗余性。

  “很多年前开展的业务并不会最初就考虑容错、安全性、稳定性这些方面的要求,我们只是在一些核心的业务上面考虑这些,而奥运官网的建设以及整个奥运期间的奥运赛事报道战略,是搜狐公司网站架构技术能力的集中体现。” 搜狐网络运维部系统运维高级经理张蜀光在接受记者采访时表示。

  为了更好地服务北京奥运,使得北京奥运官方网站有一个更加稳定的基础架构,尽管没有自己独立承建的数据中心,但是搜狐公司利用现有的优势条件,与多家电信运营商及数据中心联手,尽可能地按照新一代数据中心的思路进行了北京奥运网站整体架构的IDC设计。

  这其中就包括了采用更为节能高效的服务器、更为安全可靠的CDN网络架构及其GSLB(全局服务负载均衡系统)。“最重要的是,我们有一个统一的强有力的公司团队,由CEO张朝阳先生、高级副总裁陈陆明先生带队,由高级技术总监周霖先生具体实施设计实施执行,以崇高的国家使命感和荣誉感,来建设运维了北京2008奥运官方网站。”张蜀光强调说。

  通盘设计架构

  在2008年北京奥运会之前,奥运会并没有互联网赞助商这么一种角色,相应的奥运官方网站也没有承载太多的功能。但随着互联网的日益普及,互联网上的奥运会官方网站和奥运会互联网赞助商也应运而生,互联网因此做为主流媒体第一次参与了奥运会盛典的报道工作。2008年奥运会的官方网站应该如何建设,应该需要有什么样的体系架构,北京奥组委对互联网赞助商搜狐公司给予了最大程度的信任和授权。根据张蜀光的回忆,当时北京奥运官方网站很多项目的立项、部署和实施都是搜狐公司的技术团队在起着主导作用。

  由于搜狐公司技术团队在公司内部的多个项目建设中已经积累了相当丰富的经验,因此在整个网站架构的设计中,张蜀光所在的网络运营团队在满足奥组委的各项网站建设要求的同时,提出了很多中肯的技术建议。

  奥运官方网站架构要求网络扁平化,网站支持高并发访问,并具备高可靠性。张蜀光介绍说,整个奥运网站有近千台服务器,比起搜狐公司网站来说虽然很少,但是其高规格的建设要求使得整个网站依然充满各项挑战。

  我们当时提了一个口号,就是‘One Team ,One Dream’,以便更好地促进我们的工作,事实上,我们搜狐的奥运各个相关部门也做到了这一点,很好地完成了奥运官网的建设和维护。”张蜀光表示。

  在雅典奥运会的时候,奥运的官方网站访问量高峰时刻大概是日均5000万次,但是考虑到互联网的发展和中国网民的基数,因此北京奥运会的官方网站要求服务器最高能够承受每日10亿次的访问量,这不光是奥运官方网站的访问量新纪录,也丝毫不逊色于包括百度搜狐等中国互联网的顶级门户网站访问量,因此对奥运官网的系统架构就提出了非常高的要求。

  “我们必须通盘考虑各种问题,从可扩展性、安全性到访问速度等。”张蜀光说。

  两地三中心架构

  毫无疑问,稳定性是奥运官网必需的目标,因此要求奥运官网的服务器必须有着相当高的容错能力。

  根据搜狐公司多年来的网站运营经验,如果要保障业务的稳定性,那么就必须充分考虑容错能力、安全性等方面的规划。在很多网站的初期阶段由于没有充分考虑这样的因素,使得一些业务在运行过程中曾经出现过灾难事件时业务中断的情况,这样的情形显然是奥运官网运行所不能容忍的。

  因此,搜狐网络运维团队提出,以两地三中心的IDC架构尽可能地保障奥运官方网站业务运行的平稳、安全和可靠,这也是跟北京奥组委反复认证确认之后的结果。

  由于搜狐公司并没有自建的数据中心,因此搜狐公司与国内多家基础电信运营商进行了深入的合作,在北京的两家IDC里面部署了奥运官方网站主中心节点,在成都的另外一个IDC里面部署了网站的异地灾备中心。

  同时,为了更好地为国内的各种用户服务,考虑到国内现有的网络情况,奥运官网在北京的两个IDC分别选择了北京两家不同的基础电信运营商的IDC,这样不仅能够确保来自不同运营商的用户都能够快速访问到奥运官网,而且可以快速将奥运赛时信息快速分发到全国各地各个奥运官网的各个分支IDC节点。

  “在整个奥运官方网站部署的过程中,得到了来自国内各个基础电信运营商等各个部门的大力支持,这才使得最终奥运官网的基础架构快速搭建成功。”张蜀光说。

  采用了两地三中心的架构之后,北京的两个IDC都是属于双激活状态,能够同时对外提供服务,而成都的IDC尽管没有处于激活状态,但是也一直保持着与北京IDC之间的同步,一旦北京的IDC中服务器都出现问题,成都的IDC能够立刻被激活,向外提供服务。

  “我们所采用的分布式、高容错奥运官网架构,保障了安全性,这这证明了我们采取的技术手段,以及之前的网站架构筹划相当成功。”张蜀光说。

  在整个北京奥运赛时期间,奥运官网的实际峰值访问量在接近每天5亿左右,比设计容量虽然有所差距,但是也已经说明最初的设计比较科学严谨。

  此外,张蜀光介绍说,整个奥运官网在奥运会和残奥会期间,奥运官网保持着零宕机、零事故的记录。

  部署CDN保障速度

  由于北京奥运会的官网不仅有图文播报的内容,也有很多的视频播报内容,因此这就需要部署CDN来实现流媒体的高速播报。

  根据张蜀光的介绍,奥运官网在北京主节点IDC有数十Gb带宽的主出口,还设置了10Gb的灾难备份带宽,同时在全国各地设置了多个分支IDC节点,每个节点大概都是在4Gb~10Gb之间的带宽规模,使得整个奥运官网有着数十Gb的带宽规模,充分保障网民访问的流量需求。

  此外,奥运官网跟国内外的CDN运营商进行了紧密的合作进行海外CDN推送,并在国内重点的奥运会主办城市部署了CDN。“CDN的部署,有效地保障了视频播报的效果,根据我们的监测,国内有2/3的CDN访问流量。而海外的CDN差不多能够占到奥运赛时期间整体流量的1/3强,说明奥运在海外的受关注程度。”张蜀光说。

  为了更好地平衡各CDN的能力,奥运官网在最上层采用智能的GSLB的策略,这能够保证如果某个CDN中心流量过高或存在风险时,可用被被快速引导至相近的CDN节点。

  多种手段 保障安全

  对于奥运官网来说,除了保障高效稳定之外,安全性是必须考虑的问题。除了前面所述的零宕机零事故,还需要防范相关的网络攻击。

  在相关的主要IDC节点,搜狐公司都为奥运官网的服务器、网络系统配备了先进的安全设备,同时也有专门的安全小组负责监控,不仅从应用的源头堵住漏洞,并定期扫描每台服务器和网络设备,甚至会先于软件的制造商发现漏洞。

  “有好几次,在我们发现了相关的漏洞并且采取了一定的措施之后的数周,才收到软件公司官方的通告。”张蜀光表示。

  即便如此,奥运官网在北京奥运会开幕之前,除了一次次的攻击和反攻击的演练外,还是真的受到了一次真正意义的DDoS攻击。此次攻击的规模相当大,如果网站的架构设计不完善的话,网站服务将会很快陷入瘫痪。

  在整个奥运赛时期间,搜狐公司负责的北京2008奥运官网一直高效平稳安全的运行,没有出现过任何安全事故,给北京奥运网络播报交出一份合格的答卷。“虽然有一些服务器的硬盘曾经坏掉过个别服务器出现突发故障,但是我们所设计的架构,单点的损坏毫不会影响到奥运官网前端用户的体验。”张蜀光说。

  追求节能 支持绿色奥运

  在为奥运官网搭建支撑架构的过程中,搜狐的技术团队有意识地采用了能够节能的服务器设备,这其中一方面有响应科技奥运绿色奥运的意味,另一方面也是搜狐公司自己一贯以来的考虑。

  “绿色节能这个理念,在搜狐公司一贯的IDC建设过程中一直秉承。”张蜀光介绍说,“这其中的原因主要是因为搜狐一直在租用运营商的IDC的机架空间,能够让配备了有限电力供应的IDC机架利用率更高,是采用节能型服务器的首要驱动力。”

  搜狐为奥运官网所采购的近千台服务器全部采用了某公司当时新发布的高效节能服务器平台。根据搜狐公司的内部评测,在性能同步提升的情况下,类似配置的单台服务器能够在提供同等性能的时候省电10%左右。

  “我们可能是国内第一家大规模采用该款服务器平台的互联网企业,采用这种服务器的最好效果就是单个的机架能够摆放更多的服务器。”张蜀光说。

  搜狐公司也曾经考虑过刀片服务器的采购,毕竟刀片服务器在满配的情况下比机架式服务器更为节能,但是后来被技术团队所否决。大家认为刀片服务器在没有成熟的行业标准的情况下,如果大规模采购,还不利于后面的投资保护。而且更重要的是刀片服务器能耗比并没有宣传中那么优秀。

  “现在购买刀片服务器除了目前可选厂商有限之外,更大的问题在于我们没有自己独立建设的数据中心,只是租用IDC的空间。”张蜀光说。而之所以有一些大学、企业购买大量的刀片服务器,那是因为这些大学或者企业有场地和空间可以自建数据中心,能够自己满足设计供电。而搜狐公司所租用的IDC,即便采用了刀片服务器,也难以在机架上实现满配,建设刀片高密度机房,最后的结果就是机架空间的浪费或者硬件投入的浪费。

  转向x86简化管理

  奥运官网建设中,搜狐公司全部采用了x86服务器的架构,并没有采用小型机的架构。“实际上,搜狐公司现在的应用已经全部运行在x86平台了,业务运行都非常平稳,这也是我们敢于在奥运官网项目上也全部采用x86架构的原因。”张蜀光表示。

  在2005年之前,搜狐公司还有不少业务上面使用着小型机。张蜀光解释说,那是因为相当部分的应用及其数据库需要运行在小型机平台,甚至有一些软件只能运行在小型机上面。随着x86平台的普及和性能提升,所有的厂商都开始加大对x86架构的支持力度。最关键的问题是,Linux整个生态环境的成熟,使得x86平台上面的应用愈来愈丰富和成熟,这些足够满足搜狐这样的互联网企业的需要。

  “另外一点就是,互联网行业对于错误的容忍度较高,并有很多廉价高效的避免单点故障的解决方案,不像金融行业,一定需要小型机或者大型机来保证其苛刻的安全性、稳定性和可靠性。”张蜀光说。

  全部采用x86架构的服务器,使得张蜀光他们得以简化服务器的管理,从而在某种程度上降低了x86架构的总体拥有成本。

  难以忍受的IDC

  尽管业务运行一直相当平稳,但是最近张蜀光所在的搜狐公司网络运维团队已经开始对部分IDC感到忧虑。就在记者采访的前一天,搜狐公司的某个IDC遭遇了UPS闪断事故,不仅使得搜狐公司的数十台服务器损毁,更重要的是,使得搜狐公司的某些业务中断了不短时间,对搜狐服务造成了很大的破坏。IDC的电力稳定性使得像搜狐这样的互联网企业不得不更多的去关注。

  不仅如此,IDC的设计落后问题也使得用户成本居高不下。“就整体而言,国内建设得很规范的IDC相当少,国外提出了相当多的数据中心建设标准,绿色、节能灯,而国内的IDC几乎都无法做到,他们的能耗非常大,而这种成本都转嫁到了我们客户身上。”张蜀光抱怨说。他表示,在很多新建的IDC中仍然采用古老的上通道送冷气的方式,效率很低,到了夏天只好采用大功率的鼓风机进行送风,否则根本无法保障散热的问题。

  另外就是电力容量的问题,绝大多数IDC的机架供电能力都没有跟上服务器发展的需要,难以满足需求。因此腾讯、百度等企业就在筹划或者已经在建自己的数据中心,以便满足高密度数据中心的需要。“我们可能也会在适当的时机考虑自建数据中心的问题,相信那样更能够满足我们各项业务对新一代数据中心的需求。”张蜀光表示。

  “新一代数据中心,稳定绿色环保是前提条件,另外应该能够很好的可扩展性,还要体现先进的设计理念。” 搜狐网络运维部系统运维高级经理张蜀光张蜀光。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

相关推荐