英伟达刷新 DeepSeek V4 推理纪录:单 Token 成本降至 1/5,吞吐量最高提升 20 倍

4天前更新 haozi9365
21 0 0

英伟达近日发布博文称,在 Blackwell 平台上通过全栈推理优化后,和 DeepSeek V4 模型1个月前刚上线时相比,单 Token 成本最高可降至原来的五分之一。单 Token 成本(Cost Per Token)是衡量模型生成或处理单个 token 所需成本的指标,通常用于对比不同硬件、软件栈或部署方式下的推理成本表现。英伟达在文中强调,已将单 Token 成本纳入 AI 总拥有成本的核心衡量维度,并表示针对 DeepSeek V4,Blackwell 平台已把这一成本压低到行业最低水平。

英伟达刷新 DeepSeek V4 推理纪录:单 Token 成本降至 1/5,吞吐量最高提升 20 倍的封面图

相关快讯

英伟达前光互连高管Ashkan Seyedi加盟艾迈斯欧司朗,掌舵光互连业务

艾迈斯欧司朗宣布,前英伟达光互连技术高管 Ashkan Seyedi 已加入公司,出任光互连业务线副总裁兼总经理,负责推进面向下一代 AI 数据中心的光互连技术。Seyedi 此前在英伟达参与高速光通信研发,推动 AI 集群和数据中心互连发展。

Valar 用先进反应堆为英伟达 Blackwell 芯片供电,核能 AI 时代来了

美国核能初创公司瓦拉原子能在犹他州用先进反应堆成功为英伟达Blackwell芯片供电,完成美国境内下一代反应堆首次此类示范,并临时运行网站。双方还将合作建设小型数据中心,测试先进核能供电与闭环液冷技术,以减少对电网和水资源依赖。

英伟达开源机器人技能库,具身智能迎来“Skill时刻”

ASPIRE可以理解为机器人版的Coding Agent:它把机器人在任务中的失败与修复经验,持续沉淀为可复用的Sensorimotor Skills。模型不只是浮点权重,更像一个不断扩展的技能库,能通过代码执行任务、分析多模态轨迹、修正程序,并把改进后的经验存入skills library,帮助后续任务持续复用。

英伟达推出AI基础设施新合作模式,与AI云厂商共享收入加速算力建设

英伟达推出新的AI基础设施合作模式,通过收入分成和信用支持,与AI云服务商共建大规模、多租户AI工厂。AI云厂商将基于DSX AI Factory架构提供云算力服务,帮助初创企业、模型开发者、企业和科研机构更快获取AI资源,同时为英伟达带来与算力使用挂钩的持续收入。

AI时代已进入精打细算阶段

AI行业正从“免费争夺”转向“全面收费”。豆包推出专业版并最高年费达5088元,DeepSeek改为峰谷定价,高峰时段调用成本翻倍,ChatGPT也开始加广告、加强招商。各家不再比拼低价,而是在探索如何让AI摆脱持续烧钱的困境。

英伟达推出AI基础设施新合作模式:通过收入分成推动算力建设

英伟达推出新的AI基础设施合作模式,通过收入分成和信用支持,与AI云服务商共建大规模、多租户AI工厂。该方案基于DSX AI Factory架构,由云厂商对外提供算力服务,帮助初创企业、模型开发者、企业和科研机构更快获取AI算力,同时为英伟达带来与使用量挂钩的持续收入。

暂无评论

暂无评论...