一、发展回顾
从上个世纪90年代中期我国第一套“机房场地监控系统”在深圳诞生起,机房监控技术与产业发展走过了近0个年头。与国内很多IT细分市场都是海外产品抢先开发并占领的情形不同,我国在机房场地监控方面是先有民族产品。多年来,经过业界的共同努力,民族品牌在机房监控市场占有优势。
由于社会体制、管理理念、技术发展水平与路线的不同,在该领域,国内外企业走着很不同的发展路线。
国外的楼宇控制技术发展较早,许多早期机房场地设施的监控由楼宇控制(或工控)软件实现,与IT密切相关的数据中心场地设施往往纳入楼宇监控管理的范畴,受物业部门管理。但楼控系统的技术与管理理念并不能满足数据中心场地设施监控管理发展的需求,因此近年数据中心场地设施的监控管理开始脱离楼宇控制技术与理念的制约向DCIM发展。而IT系统的建设管理在IT部门,使IT监控管理由“网络监控”(俗称网管)向IT服务管理(ITSM-不含机房基础设施)发展。可见,国外数据中心监控管理行业技术沿着两条侧重点有所不同的路线发展(分别以基础设施与IT系统为对象的监控管理),并分别经历了“监测”阶段,开始进入“管理”阶段(DCIM与ITSM)。
我国最早的信息化应用出现在政府部门,信息中心的场地设施与IT系统从开始就整体隶属于IT部门管理。这种一体化的管理模式使我国的数据中心场地设施的监控管理没有过多地受国外楼控技术的影响而独立发展并确立了领先地位,也使得业界有条件一体化地研究数据中心监控管理解决方案。我国这种统一管理模式是按照ISO/ITIL的IT服务主旨进行IT监控管理系统“顶层设计”与实施的必要条件,是一种体制优势,业界应当坚守并倍加珍惜,而特别不应该再人为地分离基础设施与IT系统的管理部门与匹配的监控管理系统,形成数据中心监控管理的信息孤岛。
二、监控管理技术发展IT管理的根本目标是用尽可能少的运营成本获得尽可能高的信息系统可用性。
1、可用性要求与精细化管理大规模、超大规模的数据中心越来越多,人们对信息系统的依赖程度越来越高。满足飞速发展的社会信息化的需求,保障信息系统的可用性,只有通过科学、精细的管理才能实现。
、精细化管理与IT管理信息化规范化、流程化、精细化的管理大幅增加了管理的工作量与复杂性,对数据中心运维与管理人员的要求明显提高,人力成本显著增加(如下图1)。提高管理效率,降低运行管理成本,数据中心管理信息化是必由之路。
图1数据中心运营费用逐年大幅增长
数据来源:IDC,On-DemandEnterprisesandUtilityComputing:ACurrentMarketAssessmentandOutlook
、信息化与组织架构信息系统由组织使用,是组织的外延(正如电脑是人脑的外延),因此数据中心监控管理系统必须与数据中心组织架构相匹配、相适应,成为一体。
数据中心的统一管理(组织架构)是监控管理系统“顶层设计”与高效使用的重要条件。
4、一体化监控管理平台数据中心场地设施作为IT设施的基础设施与信息系统可用性密切相关,是信息系统的不可分割的组成部分,必须纳入IT监控管理范畴。只有对场地设施、IT设施与IT系统统一监测,才能保证监测信息的完整性,才可能形成比较正确的管理决策。因此,数据中心基础设施与IT系统监测必将统一。
监测是发现问题,管理与控制是解决问题。只有用监测信息驱动管理或控制,监测的信息才能最大限度发挥作用,管理才能有的放矢;管理粒度取决于监测粒度,设定的管理目标的实现与监测点设计密切相关,监测与管理设计不能脱节。因此,数据中心监控与管理必将统一。
IT管理的根本目标是用尽可能少的运营成本获得尽可能高的信息系统可用性,所以信息系统才是IT监控管理的顶层对象,因此,IT监控管理系统的发展趋势是基础设施与IT系统监测一体化,监控与管理一体化,最终形成IT监控管理一体化平台。即以信息系统为顶层对象,以IT服务为目标的IT监控管理(一体化)平台,是IT监控管理系统发展方向。
三、监控管理系统与绿色数据中心
1、数据中心节能的重要性数据中心是能耗大户,这已经是不争的事实。随着能源价格上升,数据中心能耗成本所占比重不断增加(参见图1)。微软公司的首席供电与冷却架构师ChristianBelady说:到年时,数据中心中服务器和其支持性设备的耗能成本将占总体拥有成本(TCO)的75%,IT资本成本将仅占5%。降低数据中心能源消耗成为控制运营成本的重要方面。研究应用节能与能耗管理技术(绿色数据中心),降低能耗成本将是未来数据中心监控管理技术发展的重要方向。
、系统中的节能技术与监控管理系统相关的节能技术有很多,从IT设备芯片到数据中心场地环境都可通过监控管理系统实现节能。
(1)服务器能耗控制
Intel的芯片级的集成功率门限(IntegratedPowerGates)、自动低功耗状态(AutomatedLowPowerStates)、主频提升技术(TurboBoostTechnology)等;服务器平台级的智能功耗节点管理器(NodeManager)和数据中心管理器(DataCenterManager);数据中心级的散热感知调度(PowerThermalAwareScheduling)等IT设备能耗控制技术使得人们可以通过监控管理系统在保证运行性能的前提下,来降低低负荷芯片工作频率,使闲置芯片内核处于最低功耗状态,发现并退出“幽灵”服务器以及根据功耗与发热量进行动态资源管理等,从而实现数据中心节能降耗。
()温度场技术
温度场是用来进行机房热点监控的一项技术,基本原理是对导入的机房空间模型文件进行网格化处理,并采集部署在机房空间中离散的温度测点值(测点主要部署在机柜上),然后以网格和实际测点为基础,采用先进的算法模拟计算网格点的温度值,最后通过图像引擎生成机房的温度云图。
在温度云图中,不但可以清晰的查看机房的冷热分布,而且可以方便的查看任意点的温度值和历史曲线,及时获得热点和冷点区域的报警信息。温度场使得机房管理人员对温度分布时刻了然如胸,并为其进行能耗管理决策提供依据;温度场信息也作为监控系统冷量控制的输入信息,可以通过人工或自动调节的方式实现机房冷量的合理配置。
有条件的也可结合CFD(ComputationalFluidDynamics)即计算流体动力学的方法进行气流组织仿真模拟。有利于提出气流组织的优化方案,使冷量配置更趋合理。
图CFD模拟空调送回风气流组织分布效果
图CFD模拟数据中心整场气流组织分布