电力是机房可靠性的基础。香港地区电网总体稳定,但租用机柜或整机房时,必须确认机房是否提供足够的额定功率、是否支持双路供电以及是否具备UPS与柴油发电机等备用电源。没有充足且可靠的电力,服务器一旦断电会导致数据丢失、服务中断和业务损失。
检查点包括:每个机柜的额定功率(如3kW、6kW或更高)、机房总电力容量、是否提供双回路供电(A/B路分配)、UPS容量与拓扑(如在线式UPS)、发电机自动切换时间及燃油保障天数。
不同楼宇的配电能力差异很大,某些旧楼无法支持高密度计算负载。因此在香港选址时,机房的电力设计直接决定你能否部署高性能与高密度的服务器。
散热能力决定服务器能否稳定运行,特别是在高密度机架(每柜10kW以上)场景下更为关键。评估时要看机房的制冷方式、冷却冗余和冷热通道管理是否合理。
常见有CRAC/CRAH直冷、液冷与机架级浸没冷却等。香港多数商业机房采用CRAC/CRAH+冷热通道隔离,优点成熟、成本可控;液冷和浸没冷却适合超高密度,但对机房基础设施要求更高。
确认机房的制冷冗余(如N+1或2N)、冷却能耗指标(PUE),以及是否预留未来扩容的冷量模块。如果机房位于热岛或通风受限的楼层,散热设计必须更保守。
PUE(电源使用效率)越低表示基础设施越节能。选择机房时参考长期PUE(年平均)比单次宣传更可靠。UPS应为在线双转换结构,能在电力波动时提供稳定输出;发电机需做好自动启停与定期维护记录。
要求查看历史运维记录:机房年平均PUE(理想<1.5),UPS切换时延(最好<10ms),发电机冗余与燃油储备(能支撑至少24-72小时),以及定期负载测试报告。
在合同中明确电力可用率目标(如99.99%)、UPS与发电机维护计划、电力故障响应时间与赔偿条款,确保运营风险可控。
不同业务对可用性与延迟的要求不同。金融交易和实时交易平台优先关注极高的可用性与低延迟,需要2N级别的电力冗余、严格的散热控制与本地冗余机房。网站与内容分发对成本敏感,可接受N+1冗余和较高的PUE以降低费用。云计算与AI训练更偏向高密度功率和液冷方案。
根据业务将资源分层:关键业务放在电力与制冷最可靠的机房;开发/测试或非关键负载可放在成本更低的共享机房。同时提前规划每柜功率、网络带宽与冷量预留。
优先选择那些支持模块化扩容的机房,能在负载增长时快速增加UPS组、发电机和制冷单元,避免搬迁或大规模改造。
合规包括消防、建筑用电许可、噪音与废气排放限制等。运维方面关注监控告警(包括电力、温湿度、漏水、门禁)、远程管理能力和现场应急响应团队的资质与响应时间。
要求查看消防系统(IGS或灭火气体)、机房电力设计图、载入率测试、环境监控报警历史、维保合同与人员资质证书。确保机房通过相关第三方认证(如ISO27001、TIA-942等级)更有保障。
评估24/7监控与值守成本、定期负载测试频率与费用、燃油与能源费用分摊方式,以及在高峰用电时段的计费策略,避免后续运营成本不可控。