针对AI工作负载优化数据中心的四种方法
创始人
2024-01-09 07:02:06
0

原标题:针对AI工作负载优化数据中心的四种方法

AI有望以多种方式改变数据中心,例如改变数据中心就业市场以及改进数据中心监控和事件响应操作。

然而,AI可能对数据中心产生的最大影响是改变数据中心的工作方式。对于那些想要充分利用现代AI技术的企业来说,数据中心所容纳的基础设施及其管理方式必须有所改变。

AI将会引发数据中心怎样的发展还有待观察,但以下是一些值得期待的关键变化。

AI对数据中心的独特需求

要评估AI对数据中心的影响,你必须首先了解的是AI工作负载与数据中心中其他类型的工作负载(例如标准应用托管)之间有什么不同。

虽然AI工作负载有很多形式且要求各异,但大多数都满足以下的独特需求:

  • 需要大量的计算资源,尤其是在执行模型训练的时候。
  • 运行在裸机硬件上使其从中受益,特别是那些可访问GPU资源的服务器。
  • 资源消耗率可能会大幅波动。在训练阶段,AI工作负载需要大量的资源,但训练完成之后,大多数情况下资源消耗会显着下降,直到再一次训练模型。
  • 需要超低延迟的网络才能实时做出决策并交付结果。

当然,其他类型的工作负载也可能有这些要求,例如,运行AI应用和服务并不是唯一可以从裸机服务器中受益的用例,但总的来说,AI软件要比其他类型的工作负载需要更多上述资源。

为了AI升级数据中心

为了优化AI工作负载的设施,许多数据中心运营商需要做出改变,以满足AI独特的需求。以下是数据中心在这方面的关键升级。

  1. 重新设计或更换裸机服务器

至少在过去十年中,虚拟机一直是托管工作负载的首选基础设施资源。但考虑到AI应用和服务对于裸机硬件的需求,有越来越多的数据中心运营商可能会发现扩展裸机产品变得十分重要。

在某些方面,这实际上是简化了数据中心的运营。如果你在裸机上运行工作负载,最终会得到一个不太复杂的托管堆栈,因为你没有混合使用虚拟机管理程序和虚拟机编排器。

另一方面,扩展用于托管工作负载的裸机基础设施可能需要数据中心对托管的服务器以及服务器所在的机架进行更新升级。传统上看,在数据中心设置服务器的最简单方法,就是配置非常强大的裸机机器,然后根据工作负载的需求将其分配到任意数量的虚拟机中。但如果你需要直接在裸机上运行工作负载,那么则可能需要更多的服务器来隔离工作负载——这意味着数据中心必须将高功率服务器更换为较小的服务器,并且可能要相应地更新服务器机架。

  • 共享支持GPU的服务器

尽管在AI工作负载进行训练的时候,使用支持GPU的服务器是有利的,但AI应用不一定需要GPU来进行日常操作。因此,许多企业只需要临时访问支持GPU的基础设施即可。

为了满足这一需求,数据中心运营商应该考虑那些让企业能够共享基于GPU的基础设施的产品。少数企业可能希望拥有配备GPU的服务器,因为他们并不会永远都需要这种服务器。但如果数据中心运营商能够临时提供对GPU资源的访问(例如通过GPU即服务的模式),那么他们就能够更好地吸引那些有AI工作负载需求的企业。

  • 增强的网络解决方案

大多数企业级数据中心已经提供了对高性能网络基础设施的访问,以及有助于尽快将数据移动到外部设施的互连。但为了充分利用AI,数据中心网络产品可能需要变得更加强大。

那些拥有AI工作负载的企业需要两个关键功能:首先,高带宽网络连接,可以非常快速地移动大量数据,这在分布式基础设施上训练AI模型的时候尤其重要。其次,网络能够提供个位数的延迟,如果你希望AI应用和服务真正做到实时执行,这一点至关重要。

  • 更高的数据中心灵活性

由于AI工作负载的资源需求波动很大,因此可能需要在支持基础设施数量方面更加灵活的数据中心。AI还可能让人们更加需要能够让企业在其他数据中心内按需部署服务器、而不是自己设置这些服务器的服务,因为按需基础设施是解决资源需求波动的一个好方法。

为此,那些想要优化AI的数据中心运营商应该考虑使其设施更加灵活的产品。短期合同,和那些不仅仅包括了客户可以建立自己基础设施的机架空间服务,二者的结合可能对于那些需要部署AI工作负载的组织来说是有吸引力的。

结论

AI变革仍在上演,现在想要确切地知道AI将如何改变数据中心的运营方式或者其中部署的基础设施类型,还为时过早。但可以相对肯定地是,支持GPU的服务器和更灵活的解决方案等变化,可能在以AI为中心的世界中变得至关重要。想要分一杯羹的数据中心运营商应该确保更新他们的设施,以满足AI工作负载的独特要求。

相关内容

热门资讯

智能家居系统究竟有多神奇?全方... 智能家居系统依托物联网技术,为用户提供了便捷、舒适的居住体验,该系统通过运用多种传感器和智能设备,对...
2025SDVoE技术白皮书 一、技术背景与核心要素 在数字化转型浪潮中,高清视频传输需求爆发,4K乃至8K分辨率视频在商业、医疗...
深圳一校长携机器人“学长”送比... 机器人“学长“给高三学子送比萨。通讯员 供图 中新网广东新闻5月23日电 (记者 蔡敏婕)“哇,机...
中国石油获得发明专利授权:“一... 证券之星消息,根据天眼查APP数据显示中国石油(601857)新获得一项发明专利授权,专利名为“一种...
青岛中集取得固定可翻转式中间隔... 金融界2025年5月24日消息,国家知识产权局信息显示,青岛中集冷藏运输设备有限公司取得一项名为“一...
娱乐无国界:TikTok公会如... 在全球化浪潮席卷下,TikTok娱乐公会正以技术为利刃,打破文化与商业的双重壁垒,构建起跨越国界的娱...
正力新能取得一种储能电池系统专... 金融界2025年5月23日消息,国家知识产权局信息显示,江苏正力新能电池技术股份有限公司取得一项名为...
亲子家庭日 乐趣享习俗 5月24日,小女孩在展示制作好的手工龙舟。 当日,中铁建工青岛上合大厦项目部举行“童心同行 粽享端午...
以AI助力产业出海,文博会深澳... 5月23日,深圳文博会深澳国际文化科技园分会场活动开幕。系列活动以“AI出海产业跃迁”为主题,集中呈...
小米十年 “造芯” 终结果 在科技领域,芯片一直是核心关键,犹如皇冠上的明珠,吸引着众多科技企业为之拼搏。小米,这家以创新为驱动...
锐尔觅申请转轴组件及电子设备相... 金融界2025年5月24日消息,国家知识产权局信息显示,深圳市锐尔觅移动通信有限公司申请一项名为“转...
刚刚,罗永浩百度带货首秀爆了 作者|天宇 来源|派代 5月23日晚8点,罗永浩带着标志性的黑框眼镜,正式开启在百度优选的直播带货首...
新一届TR35中国区入选者名单... 5月23日晚,在上海举办的2024年度“35岁以下科技创新35人”中国区发布暨中国科技青年论坛上,新...
大中赫取得一种石料加工高效筛分... 金融界2025年5月24日消息,国家知识产权局信息显示,湖南大中赫锂矿有限责任公司取得一项名为“一种...
新华社点赞小米玄戒O1:中国大... 5月24日消息,近日,小米正式发布了首款自研3nm手机SoC芯片,已经在小米15S Pro和小米Pa...
科技“整活”文化,这届文博会含... 当AI咖啡师递来一杯拉花精准的拿铁,当“硬核”机械臂现场挥毫泼墨,当隔空“打鼓”成为现实——走进第二...
人工智能技术在地铁运营场景中的... 今天分享的是:人工智能技术在地铁运营场景中的典型应用 报告共计:26页 人工智能技术在地铁运营场景中...
企业积极布局深海科技产业 海底... 本文转自【央视网】; 央视网消息:随着深海科技产业的不断发展,相关企业也在积极布局,抢抓深海科技产业...
原创 近... 不得不说,5月上市的手机新品确实有点多,不知道有多少产品能让各位留下印象呢?有些产品甚至刚发布没多久...
格力电器获得发明专利授权:“防... 证券之星消息,根据天眼查APP数据显示格力电器(000651)新获得一项发明专利授权,专利名为“防腐...