美团开源万亿参数大模型 LongCat-2.0,五万卡国产算力全流程训练

3天前更新 zmtzn
1 0 0

美团正式发布并宣布开源新一代基础大模型 LongCat-2.0,中文名“龙猫2.0”。官方披露,这一模型总参数规模达到 1.6 万亿,也是国内首个基于 5 万张国产算力卡集群,完成预训练与推理全流程的大型语言模型。

与行业过去更强调通用能力展示的发布方式不同,美团这次将重点放在底层基础设施的国产化替代、模型推理成本压降,以及面向智能体和代码场景的专项优化上,意在突出工程落地和实际应用效率。

公开资料显示,LongCat-2.0 此前曾以 “Owl Alpha” 代号在 OpenRouter 等平台进行灰度测试。从技术架构看,该模型是在超过 5 万张国产 AI 芯片集群上完成 30 万亿 Token 预训练,并主要采用稀疏注意力与动态激活机制来提升训练和推理效率。

美团开源万亿参数大模型 LongCat-2.0,五万卡国产算力全流程训练的封面图

相关快讯

扎克伯格坦言:AI智能体发展速度比我预想更慢

扎克伯格在内部全员会上表示,Meta仍在冲击“超级智能”,但需要投入更多时间和精力。尽管公司正大举押注AI,AI Agent的发展未达预期,近期战略调整也凸显其AI路线的两难:既要加速研发,又要兼顾员工信任、士气与团队稳定。

特斯拉给员工设定每周200美元AI工具使用上限

特斯拉通过内部备忘录通知员工,自7月6日起将AI使用支出上限设为每周200美元。此举表明,即便积极推进AI落地的企业,也开始收紧相关成本控制。此前特斯拉一直在内部鼓励员工广泛使用AI工具,并将其融入日常工作流程。

“白月光”回归却成“吞金兽”?Claude Fable 5限时限额引发口碑两极分化

Anthropic宣布Claude Fable 5重新上线,距离6月12日下架已19天。新版在底层能力上与首发版一致,但订阅用户每周分配给Fable 5的额度仅为原来一半,包月使用将于7月7日结束,之后改为按usage credits计费。同时,安全风控进一步收紧,可能误拦开发需求,触发后会拒答并自动降级到Opus 4.8。

特朗普称AI需护栏但应尽量少设限制

特朗普表示,人工智能需要基本标准和“护栏”,但应尽量减少对美国企业的繁重限制。他称,一旦发现不良行为者并存在风险,政府会迅速有效干预,但未指明具体案例。

微软豪掷25亿美元,组建6000人AI部署团队

微软投入25亿美元成立新部门Microsoft Frontier Company,整合约6000名工程师、顾问和销售人员,专门帮助企业客户部署人工智能技术,并将团队直接派驻客户企业内部提供支持。

Anthropic两周连揽四将:抢诺奖得主后又挖伯克利CS掌门

7月1日,UC伯克利EECS计算机科学部主任、理论计算机科学教授Jelani Nelson宣布加入Anthropic,并从大学休假,教职暂时保留。他在X上表示,很高兴与一群有使命感的人研究这一时代的决定性技术。其X简介也已更新为Anthropic技术研究员,和5月加入的Karpathy成了同事。

暂无评论

暂无评论...