对IT领导者而言,数字基础设施中 AI 和 HPC 的未来发展方向是什么?
今年,我们见证了新型人工智能 (AI) 技术在市场上的突飞猛进,并极大地促进了企业对 AI 的需求。这些新发展将从根本上改变我们对企业 IT 环境的看法。
Digital Realty 的三位顶级专家解答了业界最紧迫的问题,即AI、HPC 以及推动两者发展的数据的未来。以下是他们针对《IDC FutureScape:2024 年全球数字基础设施未来预测》* 中提及的三个预测的一些看法。
注:考虑到篇幅长度和清晰程度,我们对访谈内容进行了部分编辑。
预测 1:相互交织的 IT 基础设施将会增加
IDC FutureScape 指出:“以生成式 AI (GenAI) 为催化剂,到 2027 年,40% 的企业将依赖云、核心和边缘相互交织的 IT 架构来支持动态的、与地理位置无关的工作流程中的优先事项。”
对IT 领导者而言,想要更好的满足企业对 AI 和 HPC 日益增长的需求,有哪些简单可行的机会?
Patrick Lastennet,企业总监
经过分析指出,2024年及以后,企业将更多的部署经过训练的 AI 模型,并将它用于针对新的未知数据的预测或决策。我们将会看到更多生成式 AI (GenAI) 的推理集群被部署在主机托管中,并连接至企业广域网。
通过 GenAI 驱动的模式识别功能,大型企业将采用 GenAI 推理用例,例如欺诈保护和价格预测。GenAI 推理有助于编码、文档总结和聊天机器人。
要获得 GenAI 推理的优势,需要强大的 WAN,而不是云。运用 GenAI 推理可以扩大公司知识产权的体系和访问范围。这种可见性有助于企业识别并缩小对其产品理解方面的差距。为了充分利用这一机会,企业将投入准确、有效的数据来使用这种类型的 AI。
企业开始部署用于 AI 推理的 GPU 集群,并将其部署在运行网络数据中心的附近。
Daniel Ong – 亚太地区解决方案架构师兼总监
企业的 AI 盛世?2024 年,我们将看到企业为内部信息资源建立 ChatGPT-类似 GenAI 的系统。由于很多公司的数据存储于孤岛中,就产生了很多迫切的机会去管理 AI 需求、建立 AI 专业知识体系以及跨职能部门的协作。
这种对数据的访问将会带来一个关乎生存的安全风险,该风险可能会打击公司的核心:知识产权。这就是为什么在 2024 年,有远见的企业将使用 AI 来实施强大的数据安全和隐私措施,以确保知识产权不会暴露在公共互联网上。
它们还将关注内部安全风险来进一步缩小威胁范围。这包括制定内部规章制度,确保敏感信息不会泄露给没有权限的内部团体和个人。
开放性与数据安全和隐私之间的界限很难把握。如果能够很好地把握这一点,公司就能将语音助手、基于知识的聊天机器人和网络安全威胁检测三方面紧密结合在一起。
在北美地区,我们的客户发生了哪些变化,以及他们如何优先构建基础设施以应对 AI 需求的增长?
Steve Smith,美洲地区负责人兼总经理
无论是 AI,还是其他新兴技术,它们都是为了优化和确保您的业务能走向未来。
我们看到,许多北美公司将 AI 作为工具和杠杆,做出更明智的业务决策、优化业务方式,更好地为客户提供服务和产品。
尽管我们的许多客户还处于了解优化 AI 的早期阶段,但早期的发现就能呈现出良好的结果和功能,可以全面提高效率。
从识别前端客户的所在,到如何构建供应链,再到优化服务,AI 都能让我们深入了解客户的运作方式并增强运营。
与 Digital Realty 合作的客户正在研究如何利用这些大型学习功能来提高运营效率。成功的企业从简单做起,它们要求合作伙伴提供更高水平的服务,包括:提高他们对企业业务运作方式的理解,以及公司如何应用从 AI 中获得的洞察。
预测 2:将关键工作负载的“即服务”置于首要位置
IDC FutureScape 指出,“到 2028 年,80% 的 IT 买家将优先考虑把需要灵活部署的关键工作负载以即服务的模式进行消费,以帮助优化 IT 支出、增强 ITOps 技能并实现关键的可持续性指标。”
全球推广 AI 计划的最佳方式都有哪些?
Patrick Lastennet,企业总监
企业领导者要做的第一件事是列出所有关键工作负载,并确定首先要管理的工作负载。数据隐私(主权问题)和用户体验(延迟)将决定关键工作负载的本地化。
接下来,他们将考虑与能够提供 AI 支持基础设施全球编排服务的合作伙伴合作,例如:
- 软件开发和运营 (DevOps):这里的重点是通过单一窗口管理进行开发编排。
- 网络运营 (NetOps):强大的网络运营能力可以确保即使在分散的环境中,工作流程也能正常运行。了解在背后支撑的基础设施的全球编排。(在寻求访问广泛的 AI 合作伙伴网络时,ServiceFabric™ 是一个不错的切入点。)
智能工作负载分配的选项包括:
云端 AI:在AI 初始阶段使用云可带来灵活性和弹性。一旦训练越来越多,企业就会失去弹性,或者失去增加或缩小 CPU、存储、内存和输入/输出带宽容量的能力,并且总体拥有成本 (TCO)的问题就凸显出来了。
要在内部进行扩展,可与托管解决方案提供商合作,通过 GPU 即服务提供商来管理云以外的 GPU,这些提供商还咳进行成本管理和提供相同级别的云工具。
Daniel Ong – 解决方案架构师兼总监
在 AI 计划实施的早期阶段,企业依赖技术提供商和合作伙伴为 AI 计划的全球推广提供建议和支持。
在亚太地区,建立、部署和训练适合的 AI 集群是一场竞赛。由于主要用例是网络安全威胁检测,因此与网络安全技术提供商合作是关键。
顶级企业利用 GPU 附加组件与其现有的计算系统提供商合作。Lenovo、Dell 和 HPE 都提供这种服务。
北美地区的企业如何借助合伙伙伴 Digital Realty 的开放式生态系统?
Steve Smith,美洲地区负责人兼总经理
企业可以借助 Digital Realty 的开放式生态系统,战略性地连接到优先的 AI 即服务提供商,并选择符合自身需求的服务。
企业还应当考虑:
- 谁可以支持 AI 工作负载高计算环境呢?
- AI 如何赋能合作伙伴访问我们的计算环境呢?
- 公司如何开始使用这些服务呢?
企业可以在高度互联的数据中心园区(如 Digital Realty 拥有和运营的数据中心园区)内找到这些问题的答案。这些园区是很多合作伙伴使用 ServiceFabric™,传送 AI 工作流程数据的中心点。
预测 3:更广泛地采用实时获取数据的分类
IDC FutureScape 指出,“到 2028 年,60% 的 IT 组织将采用实时获取数据分类引擎来改善数据流工作,以加强数据治理、数据丢失防护 (DLP) 和数据分析,从而获得具有竞争力的业务优势。”
IT 领导者应如何处理分布式数据,以满足对计算资源的更大需求?
Patrick Lastennet,企业总监
处理分布式数据的可靠方法基于张量引力。为了优化数据获取,IT 领导者需要在数据来源方面投入更多精力。想象一下,一旦实现 AI 工作流程工业化,您的发展方向将如何。问问自己,所有获取数据的区域将会在哪里,然后将计算引入数据,而不是将数据引入计算。
Daniel Ong – 解决方案架构师兼总监
数据所在的位置会影响 AI 工作流程的效率和有效性。它影响整个 AI 管道的可访问性、安全性和延迟。
将计算转移到数据收集位置的优势包括:
- 减少延迟,提高准确性:数据更靠近 AI 集群有助于改善结果。这样可以更快地进行预测和决策。
- 节省网络和能源成本:数据位置和相应的网络成本将影响能源节约,并最终影响总拥有成本。
- 数据隐私和安全合规:全球企业使用计算收集地区特定的数据,以遵循不断变化的数据安全法规和安全控制措施。
北美地区的 IT 领导者如何处理分布式数据,以满足对计算资源的更大需求?Digital Realty 如何应对北美地区计算密集型工作负载?
Steve Smith,董事总经理兼美洲区负责人
过去,AI 是大型计算模块,企业获取大量数据,并将数据运行模型,从中得出结论,然后在这些数据中进行迭代。
现在,企业将更紧密地整合分布式数据,以做出实时决策。在竞争异常激烈的环境中,哪些组织能更好地保护、验证和使用大型语言模型或数据块中的数据,就能比竞争对手做出更好的决策,这将是区别于其他组织的关键因素。
合伙关系将能力转化为价值
通过更深入地审视我们在此讨论的三个预测,我们可以获得哪些洞察?
Steve Smith,美洲地区负责人兼总经理
能否加速实现 AI 效率,取决于企业如何与能将能力转化为价值的合作伙伴合作。从 Digital Realty 的规模和能力来看,我们拥有卓越的竞争优势。从我们的全球影响力到平台的广度,再到连接性,以及我们遍布全球的主要城市,我们将人员、公司和数据汇聚在一起,更高效地开展工作。
我们在架构、创新方式以及互联解决方案方面都取得了巨大进步,我们不仅当前具有竞争优势性,而且在未来数年内也能为企业提供面向未来的有竞争力的解决方案。
详细了解如何让您的 AI 战略适应未来需求,请下载我们最新的白皮书:《面向 IT 领导者的 AI》。
*《IDC FutureScape:2024 年全球数字基础设施预测》,文档编号:US50401023,2023 年 10 月