2025-07-10 13:13:51
loading...
AWS推出IRHX液冷系统应对Nvidia AI芯片过热挑战
摘要
亚马逊AWS发布定制液冷系统IRHX,专为Nvidia Blackwell GPU设计,解决AI芯片高功耗散热难题。新推出的P6e实例搭载72个GPU,提升大规模AI训练效率,强化云服务竞争力。
亚马逊云计算部门亚马逊网络服务(AWS)近日宣布推出全新定制液体冷却系统In-Row Heat Exchanger(IRHX),旨在高效应对Nvidia最新一代AI GPU在运行中的高温问题。该系统专为配备高性能GPU的数据中心设计,通过在服务器排附近循环冷却液,实现对密集部署的GPU集群精准控温。
随着生成式AI应用爆发,大型模型训练对算力需求激增,传统空气冷却方式已难满足超大规模数据中心的散热要求。为此,AWS选择自主研发而非依赖外部方案。IRHX具备高度灵活性,可无缝集成于新建或改造项目中,避免大规模基础设施重构,显著降低部署成本与时间。
与此同时,AWS正式推出搭载Nvidia GB200 NVL72平台的P6e实例,单机架集成72个Blackwell GPU,形成强大超级计算能力。该实例专为训练超大规模语言模型和图像生成任务优化,目前仅微软、CoreWeave等少数厂商具备类似部署能力。
AWS计算与机器学习服务副总裁Dave Brown指出,传统冷却系统不仅占用大量空间,且水耗效率低下,无法支撑其全球规模的运营需求。而结合IRHX与GB200 NVL72架构,客户可在云端获得接近本地部署的性能表现,同时确保系统长期稳定运行。
这一系列技术创新进一步巩固了亚马逊在云基础设施领域的领先地位。2025年第一季度,AWS创下历史最高营业利润率,成为公司核心盈利来源。其自主芯片、存储及网络设备研发战略持续深化,减少对外部供应链依赖。
其他科技巨头如微软、谷歌和Meta也在推进自研AI硬件与冷却方案,但亚马逊凭借遍布全球的数据中心网络和多年大规模硬件部署经验,建立起显著竞争优势。IRHX系统的引入不仅提升了计算能效,更增强了系统的可持续性与可扩展性,为未来人工智能基础设施演进奠定基础。
声明:文章不代表比特之家观点及立场,不构成本平台任何投资建议。投资决策需建立在独立思考之上,本文内容仅供参考,风险自担!转载请注明出处!侵权必究!