对服务器产业而言,2010年是很有纪念意义的一年。在产品上,我们迎来了包括英特尔至强 7500、IBM POWER7 在内的十多款重量级芯片及一系列服务器新产品的大发布;在应用上,从虚拟化到云计算,从 Web2.0的大规模分布式处理到超算中心里的高性能异构并行计算,我们看到了许多新的变化。那么,具体到x86服务器来说,这一年又给我们带来了哪些启示呢?特别是对于企业里的 CIO 和 IT 经理们,有哪些技术变化和应用特点需要关注呢?对此,笔者整理出了以下九点,供大家参考。
1、重新审视 x86服务器的作用
传统上,x86服务器被定位于中低端服务器,因为在向上扩展(Scale-up)、性能和 RAS 可靠性等方面明显要比 RISC 小型机矮上一截。不过进入 2010年以来,这种定位发生了一些变化,特别是上半年推出的英特尔至强7500处理器,通过 QPI 直连架构、8核16线程设计、22条 RAS、最大32路 SMP 扩展等特性,将 x86平台推向了一个新的高度,并引发了服务器厂商的积极跟进,如富士通在推八路 PRIMEQUEST 1800E 时甚至打出“x86架构小型机”的概念,浪潮与华为等国产厂商在开发基于这一平台的高端容错计算机,IBM 则依托其新一代企业级eX5架构在内存扩展、I/O 虚拟化等方面的五大创新技术重新定义了 x86服务器的工业标准。
这些技术进步使得今天的 x86服务器在性能、可靠性、可扩展性、可管理性等方面大幅提升,进而可以承担更多、更关键的业务负载,如服务器整合、虚拟化、大规模数据处理等,甚至吸引一部分传统小型机用户的应用迁移。因此,对于用户而言,特别是在那些大规模整合或核心关键应用的场合,需要重新审视和考虑x86服务器的用途,进行相应的测试和部署。
2、重视 I/O 瓶颈
尽管应用负载会存在计算密集型、内存密集型和 I/O 密集型等差异,但对于 CPU 芯片和通用服务器系统来说,这些应用需求都需要照顾到。值得注意的是,在不同时期,随着应用需求的变化,要考虑的侧重点会有所不同。
对 x86服务器来说,今天 CPU 的发展速度远远超过了内存、磁盘、网络等 I/O 系统,使得 I/O 瓶颈在实际应用中越来越突出,特别是对于虚拟化、大规模数据库等内存密集型应用而言,更是如此。我们知道,在一个向上扩展的多核系统中,数据存取的层次是 CPU、缓存、内存、硬盘,越往外层,I/O 越慢,因此,随着 CPU 的核心数量越多,CPU 喂不饱的现象会更加严重,I/O 因此成为多核计算之路上最重要的因素。
这一点也得到了从芯片厂商到服务器厂商的一致认同,如英特尔最新的至强 7500处理器通过引入 QPI 直连架构、集成内存控制器和大容量缓存,跟上一代产品相比,内存带宽提高了 9倍;甚至还发布了至强 6500这样一款处理器来满足那些需要“双路服务器计算性能+四路服务器内存容量”的用户,比如一些内存密集型的高性能计算应用。在服务器厂商层面,IBM 在其新一代 eX5系统设计架构中更是着重考虑 I/O 问题,如 MAX5 内存扩展技术可以提高 2倍内存容量,eXFlash 固态存储子系统大幅提高磁盘 I/O,同时将网络 I/O 虚拟化技术引入 x86系统。比如,IBM System x3690 X5就是一款采用eX5架构设计的双路机架服务器,支持英特尔至强 6500系列(Nehalem-EX)处理器。一台 x3690 X5机箱里可以支持32个内存 DIMM,如果再配上 MAX5 内存扩展单元(上有 32个内存 DIMM),即可以扩展到 64个 DIMM; 而如果通过 QPI 线缆将两台 x3690 X5 连在一起,形成四路系统,总共内存 DIMM 数就可以达到 128条!可见,IBM 的 eX5已经巅覆了划分双路、四路系统的传统标准。
3、根据工作负载智能化调节资源
由于用户需求千差万别,理想的情况是让服务器变得更加“智能化”,即可以根据负载的变化实现自动调节资源。近两年来,这种智能特性已经开始呈现。比如,英特尔在其最新的处理器中增加了睿频加速 (Turboost)和超线程技术,可以通过感知工作负载的变化来打开或关闭核心,进而提高主频或增加并行线程,以满足不同需求。
除了性能,功耗也可以动态控制。比如 IBM 在服务器中使用了“海拔高度计”,通过测量服务器所在地的海拔高度来判断空气的密度,进而调整风扇的转速和送风量;另一家服务器厂商惠普公司则使用了“海洋式传感器”,通过机箱里多达32个温度传感器来实时地对系统进行细致的环境监测,防止过度散热和调整风扇转速以避免浪费电力。另外,服务器厂商也开始优化各自的功耗管理软件,如 IBM Director Active Energy Manager,以实现功耗封顶、监控调节等更多高级功能。
当然,虚拟化和云计算本质上就是为了实现灵活 IT 部署和服务而存在的。因此,今天在选购服务器时,你不仅仅要看性能、价格、可用性等方面,还应该把“智能”这一因素也考虑进去,以更好的应对“IT 系统僵化”、“功耗高涨”、“管理人手不足”等诸多困扰。特别是当你作为一个数据中心管理员,面对数以百计、甚至数以千计的服务器需要管理时,相信对系统智能特性的渴求会更加突出。
4、用系统的观点考虑节能问题
IT 经理对于服务器能耗的关注程度越来越高,特别是对于中大型数据中心来说,节能不仅意味着一种社会责任,也会实实在在地影响到成本支出。不过,对于用户来说,考虑节能问题既要有系统的观点,也要抓住重点,对症下药。因为从芯片、组件、整机、管理软件到空调制冷系统、供电系统乃至数据中心建设,很多个环节都需要消耗能源。
就 x86服务器而言,在选型时一方面可以用 SpecPower 等指标来比较不同系统的性能功耗比,同时也要注意比较不同厂商的节能技术和功能,如机箱内的散热系统设计是否科学合理?电源转换效率能否达到 90%以上的级别?能耗控制与管理软件有什么样的功能?能否根据负载自动调节 CPU 主频和风扇转速?能否通过光通路诊断显示屏便捷地对主要部件进行监控?等等。
5、向管理要效率
“向管理要效率”,并非一句空言。随着业务应用的发展变化,企业后台的 IT 系统和数据中心日益复杂,管理支出也在不断攀升。有统计表明,企业 IT 部门把 70%的预算用在了 IT 运维管理方面,而只有 30%的资源可以用来支持业务创新。因此,向管理要效率,不仅必要,而且也大有可为。
在考察 x86服务器的可管理性和可维护性时,关键要看厂商能否提供齐全的管理模块和功能,包括安装配置、远程管理、光通路诊断、组件热插拔、高级管理软件等。同时也要注意厂商是否支持最新的管理技术,如统一可扩展固件接口(UEFI)?因为最新的 BIOS 不仅方便配置和部署,而且比上一代 BIOS 提供了更多的管理功能。当然,对于不同的用户来说,碰到的“痛点”是不一样的,需要的管理功能也不同,如有的注重功耗管理,有的注重虚拟化管理,有的关心管理的便捷性。
6、给刀片泼点冷水
凭借高密度、高可管理性、高度整合等优势特性,刀片服务器一度被认为是机架产品的替代品,甚至有厂商喊出了“Blade Everything”的口号。但刀片真的能适应所有环境,并完全取代机架吗?答案显然是否定的,因为没有一种架构完美到可以适用所有的场合,什么时候用刀片,关键还得具体情况具体分析。
由于刀片机箱在很小的空间里把服务器、存储、网络、供电、散热、管理等模块集成在一起,使得其单位空间的能耗大大提升,一般功率都在 2000-5000W 之间,远远高于同等空间大小的机架服务器。而且,实际上并不是所有的客户和机房都能支持这种高密度的设备,由于供电能力有限,数据中心里往往出现一个42U机柜里只能放置 1-2台刀片机箱的情况,宝贵的机柜空间反而被大大浪费。此外,机架服务器由于有足够的散热空间,可靠性也比刀片服务器更高,并且机箱里也有足够的空间去支持更高的 I/O 扩展能力。而这些因素对于关键业务应用而言都是不可忽视的。因此,用户在选型时应该根据应用特点来决定,特别是对于 I/O 吞吐比较大的应用,如数据库、大规模网络输入输出等,机架式产品反而更有优势。
7、标准化与定制化
由于应用负载多种多样,一般会存在计算密集型、内存密集型、I/O 密集型等差异,而且对于某些用户,特别是大规模 Web2.0企业、超级计算中心、云计算数据中心等,还有着更多的特殊需求,因此,我们看到服务器定制化在 2010年得到了长足的发展。
这种定制化体现在两个方面。第一种是工业标准服务器的“定制化模块”,如 IBM 在其最新的 eX5 架构中,引入了 FlexNode 节点互联技术和 MAX5 内存扩展技模块,可以把 HX5、x3690 X5、x3850 X5等三款产品扩展成覆盖“普通应用、内存饥渴型、计算密集型和复杂大型应用”在内的 12种不同优化配置。第二种是专门针对某类应用进行优化的功能型服务器,如面向高性能计算的 CPU+GPU 混合架构服务器集群,针对高密度互联网数据中心的“双胞胎”或“四胞胎”高密度服务器(即一台服务器里装有多块主板),针对云环境部署的软硬件集成化机柜式系统等等。
可见,前一种仍然是标准化服务器,只是通过技术创新实现了更好的扩展性,因此适用面更广,而后一种定制化服务器往往适用面比较窄,一般适合的都是“服务器大户”。当然,对具体用户来说,在选型时仍然是要首先分析自己的工作负载,然后衡量投入产出比。
8、从虚拟化到私有云
进入 2010年以来,虚拟化技术应用的广度和程度不断加深。一方面是虚拟化的范畴更广,不再只局限于服务器,很多用户开始考虑存储虚拟化和 I/O 虚拟化;另一方面是虚拟化与行业应用结合得会更加紧密,而不只是针对基础架构的虚拟化。如果我们把私有云建设当成一个过程来看,随着用户应用愈加深入,对虚拟化技术的要求也会越来越高,考虑的问题也会增多,比如虚拟化的效率、更高级功能、安全性、扩展性以及对虚拟化数据中心的管理等。
因此,为虚拟化应用选择 x86服务器时,我们需要有一种动态发展的观点,即你所选择的平台能否灵活按需扩展。如 CPU 和内存等资源是否方便扩展,比如 IBM eX5 架构中的 MAX5 内存扩展单元?是否支持 I/O 虚拟化功能?服务器厂商在云计算方面是否有相对应的升级产品或方案服务,如 IBM 的 CloudBurst 等等。对于某些用户来说,还要考虑 x86服务器与小型机甚至是大型机在虚拟化环境下的资源统一管理问题。
9、关注架构融合与统一管理
俗话说,“分久必合,合久必分。”IT 领域也是如此。大型机时代以集中为主,互联网时代强调分布式应用,而到了今天的虚拟化与云计算时代,又出现了融合的趋势,这一方面是得益于技术的进步,另一方面也是应用发展的需要。
具体到服务器领域来看,这种融合至少体现在了两个方面。一是计算、存储、网络资源的整合,如刀片服务器、模块化数据中心等,甚至开始把各种系统软件和中间件也集成在一起,以实现“Cloud in a Box”,如 IBM 的 Cloudburst 和 Oracle 的 Exalogic Elastic Cloud。另一种是不同体系架构之间的融合,如 CPU 与 GPU 的协同并行计算,又比如 IBM 最新一代的 zEnterprise 开始把大型主机与基于 POWER 和 x86 架构的刀片服务器资源整合在一起,并实现统一管理,以适应更多新兴的工作负载需求。
其实,从长远来看,在虚拟化和云计算环境下,软硬件架构和产品本身之间的差异性会变得不象以前那么明确和重要,而用户自身的业务创新和工作负载要求会变得越来越关键。
总之,从整个产业的角度来看,2010年是 x86服务器具有“转折意义”的一年,不仅性能上了一个大台阶,而且应用领域也在不断拓展。比如,以前你可能没想到把 x86服务器做成小型机?没想到 x86可以与 GPU 协同计算?没想到把 x86与大型机整合在一起?没想到把标准的 x86服务器做得跟“变形金刚”一样可以灵活配置?没想到 x86服务器芯片也能“超频”?……2010年,这些或得到进一步增强,或成为新的现实!所以,作为用户,你也需要用发展的眼光来重新审视 x86技术以及你的工作负载:没有不可能,只有想不到!