数据中心在 AI 时代过时了吗?我们不会坐视不管
首席技术官 Chris Sharp
这是我们关于 AI 和 AI 就绪型数据中心基础设施的 3 部分博客系列的第 2 部分。
- 阅读第 1 部分:发挥 AI 潜力,携手 Digital Realty 实现变革
- 继续阅读第 2 部分
- 阅读第 3 部分:AI 与传统基础设施整合
设计面向未来的数据中心
在我担任首席技术官期间,人们经常问我 Digital Realty 如何设计数据中心,从而高效、可持续地支持新型和未来的工作负载。
我们如何确保为简单的企业网络托管用例构建的数据中心能够支持下一代 AI 工作负载以及必须存储、传输和处理的大量数据?
我的答案?Digital Realty 于 2017 年首次公开介绍 AI 对数据中心的影响,但此前,我们就一直在跟踪 AI 的发展。预计到 AI 应用激增的临界点,我们已经将可变性和模块化融入数据中心的设计。
赋能 AI 创新所需的 AI 就绪型基础设施不仅涉及构建数据中心,还要了解为什么需要能够大规模支持需求的模块化全球数据中心平台。
IT 基础设施的需求总是在不断变化
互联网、我们使用互联网的目的以及支持互联网的基础设施一直在变化。
AI 不是第一个影响 IT 基础设施需求的新技术,也不会是最后一个。
随着电子邮件、网络浏览、社交媒体和流媒体视频等技术的出现和成熟,数据中心和数据中心内基础设施的规模和复杂性的要求发生了巨大变化。
AI 对 IT 基础设施的独特需求
AI 正在将新一代芯片、网络设备和其他基础设施推向数据中心。连接数据中心的网络规模和数量以及典型企业存储的数据量发生了巨大变化。为此,我们多年来一直在分享我们对互连数据社区和数据引力影响的洞察。
自云技术出现以来,AI 需要更多的计算、网络和存储基础设施,而非互联网的转变,在许多情况下,我们相信这种需求会更加激烈。
我们一直是这一演变的积极参与者:Digital Realty 的全球数据中心平台 PlatformDIGITAL® 成为许多突破性、展示可能性的 AI 训练集和应用的所在地。例如,我们为客户(如 Castle Globali、SURFsaraii 和Graphcoreiii)提供创新所需的基础设施,我们正在利用自身的经验、专业知识和关键伙伴关系来帮助准备开始 AI 之旅的企业。最近,根据英伟达 DGX-Ready 数据中心计划,我们是全球首批通过英伟达 DGX H100 认证的数据中心提供商,位于日本大阪的最新数据中心 KIX13 也通过了该认证。
系统的系统:模块化是永恒设计理念的关键
Digital Realty 数据中心由许多单独系统组成:小到一个机架、一层楼、一个套间、一栋楼和一个园区所使用的冷却技术。
通过将数据中心设计为模块化、互连的系统,一次只需调整或升级一个或少量系统,无需一次性重新设计或改造所有系统。这称为“系统的系统”设计理念,具有成本效益和运营效率。我们希望客户能够从模块化中受益,因为模块化能减少客户支持新基础设施所需的时间和成本。
模块化可实现定制 AI 部署
秉持这种设计理念,我们还可以在不影响他人的情况下满足客户的定制要求。这对于满足 AI 需求至关重要,因为新的部署往往需要快速完成,并且有特殊的功耗和冷却需求。
AI 应用改变了部署在 PlatformDIGITAL® 上的计算基础设施的规模和密度,这直接影响数据中心设施的设计,以满足客户的需求。
例如,某些 AI 基础设施每个机架的耗电量是行业平均水平的 10 倍,但可能仍需要与其他低能耗基础设施部署在相同的物理空间内。我们的高度模块化方法可轻松实现这种灵活性。
模块化实现可持续冷却技术
Digital Realty 模块化设计理念的另一个实例是在数据中心部署液体冷却的能力。
AI 基础设施对冷却的要求推动人们对在数据中心使用液体冷却产生新的浓厚兴趣。与传统空气冷却不同,这种方法使用在设施周围泵送的冷却液回路,连接到机架中的发热芯片,然后将热量转移到大型散热器。
通过主板上的液体冷却装置冷却计算机 CPU
液体冷却是一种高效的 AI 基础设施冷却方式,因为液体的密度是空气的 800 倍,更容易带走 IT 设备中的多余热量;还能使数据中心更高效地使用公用事业部门的电力,从而降低总体用电量。
液体冷却是模块化设计理念的一个显著实例。即使在五年前,数据中心使用液体冷却技术也被视为边缘案例之外的深奥技术——当时应用程序使用的基础设施根本不会产生这么高的热量,足以证明该术的必要性。如今,液体冷却日益被视为密集 AI 基础设施部署的硬性要求。
Digital Realty 的许多数据中心都有可用于此目的的冷冻液体系统,有些则没有,但这并不妨碍我们为客户提供液体冷却解决方案。
我们花费数年时间研究、开发和运营多种方法来支持新的冷却需求。例如,我们使用高效空气冷却和其他替代性液体冷却技术,可以运用在一个楼层、一个套间,甚至一个单独的机架上。模块化设计使得我们可以采用这些替代方案。
为 Digital Realty 数据中心设施中的高性能计算部署提供冷却的后门热交换器
依托模块化方法,我们不仅能够满足客户的交期求和性能目标,还能实现成本效益和高度可持续发展。我们的目标是使用最有效的技术,满足客户的特定需求,甚至在全球范围内,在一个楼层内也可以进行混合和匹配。
这种灵活性也有复杂性:没有放之四海而皆准的解决方案
使用许多独特的系统以超过 2.4 吉瓦的功率进行大规模运行可能看起来令人生畏,但这是 Digital Realty 最擅长的。PlatformDIGITAL® 是世界领先的全球数据中心平台,多租户数据中心覆盖范围全球第一,与全球 5,000 多家最大、最具创新性的企业合作,积累了深厚的专业知识和能力。
这不仅关乎我们今天能做什么:我们已准备好在未来几十年为客户提供支持。Digital Realty 预计将在 2023 年和 2024 年新增超过 400 兆瓦的数据中心容量,这些数据中心依然采用面向未来的设计理念。
IT 基础设施应以终为始
Digital Realty 于六年前开始评估 AI 对互联网和数据中心的未来影响。
虽然我们无法预测应用何时成熟,或者 AI 服务何时会成为下一件大事,但我们与客户反复看到,成功数字化转型的关键是尽可能以终为始来规划基础设施部署。
现在慢速设计和部署面向未来的基础设施,将为企业节省时间和金钱。
保持创新,与我们联系,让我们以可扩展且最有效的方式为您部署 AI。
这是关于 AI 就绪型数据中心基础设施的 3 部分系列的第 2 部分:
- 第 1 部分:发挥 AI 潜力,携手 Digital Realty 实现变革
- 第 2 部分:数据中心在 AI 时代过时了吗?我们不会坐视不管
- 第 3 部分:AI 与传统基础设施整合
i Digital Realty,Digital Realty 投资者日演讲文稿,幻灯片 18 页,2017 年。
ii Digital Realty,Digital Realty 投资者日演讲文稿,幻灯片 18 页,2017 年。
iii Digital Realty,Digital Realty 与 G-Core Labs 和 Graphcore 合作,加速 PlatformDIGITAL® 上的全球 AI 部署,2022 年。