没有数据！等待你的参与哦 ^_^

35B Agent能否超越万亿参数模型？上海AI Lab开源Agents-A1揭秘scaling the Horizon

3天前更新 DataEye

39 0 0 0

长程（Long-Horizon）任务，正是当前 AI Agent 亟待攻克的关键难题之一。在软件工程、科学研究和复杂决策等场景中，Agent 往往必须在长程条件下持续做出连续判断，任何一步出错，都可能连带影响后续任务推进。

过去，这类能力通常依赖更大的模型来支撑；而扩展 Agent Horizon 也被视为另一条重要路径，但长期受限于基础设施不足，以及异构能力难以统一等问题。

针对这些瓶颈，上海 AI Lab 团队推出了一个参数规模为 35B 的 MoEAgent 模型 Agents-A1。其思路并不是继续单纯堆叠参数，而是通过扩展 Agent Horizon，尝试用更小的模型逼近万亿参数级模型在长程任务中的表现。

35B Agent能否超越万亿参数模型？上海AI Lab开源Agents-A1揭秘scaling the Horizon的封面图

相关快讯

看懂脑白金的逻辑，你就懂了豆包为什么能付费

豆包专业版上线后引发大量争议，用户最常吐槽的是“太不值”，甚至有人表示“要付费就卸载”。作者认为，500元/月的定价并非在对标 Claude 或 ChatGPT，而是在做更偏符号价值的产品，对标的是“脑白金”式营销逻辑。随着互联网进入 AI 时代，这种符号价值模式可能迎来爆发。

谷歌市值蒸发数千亿美元，Gemini Spark能否力挽狂澜？

一周内，谷歌接连失去四位大模型核心人才：Transformer 八子之一 Noam Shazeer 转投 OpenAI，另有 Jonas Adler、Alexander Pritzel 等参与 Gemini 预训练、编程与 AlphaFold 的关键成员离职。几人分别覆盖架构、科学、编程和预训练等核心环节，引发外界对谷歌士气与技术竞争力的关注，也让新牌 Gemini Spark 是否能稳住局面成为焦点。

来客兄弟AI集团联合柯菲平医药发布AI免疫健康大数据模型，推动健康管理新升级

来客兄弟AI集团与柯菲平医药发布全球首个AI免疫健康大数据模型“大福”，基于HeyBro大模型底座，融合150万+免疫细胞样本和500万级知识图谱，并已落地AI智能脉诊仪等产品。集团还自研搭建了670亿参数HeyBro多模态垂直大模型和Haibro智能体操作系统，支持行业低成本微调。

OpenAI首席研究官最新表态：AGI倒计时，人类窗口期“很小”

OpenAI首席研究官Mark Chen表示，OpenAI并不认为scaling laws失效，预训练、数据工程、推理训练和更长任务链仍是通向AGI的主线。他认为AGI正在逼近，模型将能自主提出创新并开展自我维持的研究，同时今年初许多人已明显感受到AI agent开始真正能在工作中发挥作用。

百度持续加码AI技术投入，再度引进年轻技术人才

大模型技术专家孙天祥近日加入百度，出任基础模型研发部（BMU）负责人，并进入百度模型委员会（BMC）。他此前在MOSS研发、MaaS理念及创业方向上的经历，与百度在基础模型上的战略布局较为契合。此前百度已设立BMU和AMU，应用模型研发部由贾磊负责。

美团开源万亿参数大模型 LongCat-2.0，五万卡国产算力全流程训练

美团正式发布并开源新一代基础大模型LongCat-2.0，参数规模达1.6万亿，成为国内首个在5万张国产算力卡集群上完成预训练与推理全流程的大模型。该模型此前以“Owl Alpha”灰度测试，技术上采用稀疏注意力和动态激活机制，重点强化国产基础设施替代、推理成本控制以及智能体和代码场景优化。

暂无评论

暂无评论...