北美CSP大规模采购NVIDIA GB/Rubin整柜式方案,2026年AI推理算力预计提升1.2倍

5天前更新 775800
1 0 0

5月20日讯,TrendForce集邦咨询发布的最新AI产业研究显示,预计到2026年,AI训练机型将占AI服务器出货的约55%,而中长期内市场主力将转向AI推理机型。根据北美五大云服务提供商(CSP)所构建的GB/VR整柜式方案分析,预计到2026年,这五大厂商的AI训练算力将实现超过56%的年增长,而AI推理算力则将激增约122%。同时,NVIDIA(英伟达)、AMD(超威)及CSP自研ASIC平台将在2026年同步推出,推动五大CSP服务器功耗年增116%。

北美CSP大规模采购NVIDIA GB/Rubin整柜式方案,2026年AI推理算力预计提升1.2倍的封面图

相关快讯

Anthropic与微软洽谈合作,共同开发AI芯片

据报道,Anthropic正在与微软进行谈判,计划租用搭载微软自主设计的AI服务器芯片的服务器。

联想集团推出创新龙虾湖企业解决方案

联想集团推出了“龙虾湖”解决方案,整合了多种产品,包括万全异构智算平台、问天WA5480 G3服务器、存储和数据网络交换机。该方案能够高效执行复杂工作流,延迟低于12毫秒,成本控制在每百万Tokens不到1元。它支持最多1000只龙虾常驻,并在4K上下文长度下实现每日输出百亿Tokens的能力。

联想集团推出创新企业龙虾湖解决方案

联想集团发布了“龙虾湖”解决方案,整合了多种产品,包括联想万全异构智算平台、问天WA5480 G3服务器、存储和数据网络交换机。该方案能够实现复杂工作流的高效执行,延迟低于12毫秒,每百万Tokens的成本不到1元。它支持最多1000只龙虾常驻,并在4K上下文长度下每天输出百亿Tokens。

中国AI大模型周调用量突破4.69万亿Token!

OpenRouter最新数据显示,截至3月15日,中国AI大模型的周调用量达到4.69万亿Token,连续第二周超越美国,且全球调用量排名前三均为中国模型。摩根大通预测,中国的AI推理Token消耗量将从2025年的约10千万亿增长至2030年的约3900千万亿,预计在五年内增长约370倍。

一季度AI融资突破1100亿元,国产大模型迎来融资热潮

近期,人工智能创投市场热度上升,国产大模型如月之暗面和阶跃星辰在5月融资超过300亿元。同时,具身智能领域也引起关注,维他动力和鹿明机器人等企业在一周内获得数亿元融资。算力方面,GPU采购和云服务租赁占融资额的30%到50%。到2026年,中国大模型企业的迭代周期普遍缩短至3个月以内,人工智能推理成本显著降低,商业化进程不断加快。

浙江启动2026年养老托育专项中央基建投资资金分配

浙江省财政厅近日发布通知,拨款2026年中央基建投资资金,专用于养老托育建设项目。各市县财政局需严格遵循国家及浙江省的基本建设财务管理规定,加快预算执行进度,并强化资金监督管理,以提升政府投资的效益。

暂无评论

暂无评论...