长程(Long-Horizon)任务,正是当前 AI Agent 亟待攻克的关键难题之一。在软件工程、科学研究和复杂决策等场景中,Agent 往往必须在长程条件下持续做出连续判断,任何一步出错,都可能连带影响后续任务推进。
过去,这类能力通常依赖更大的模型来支撑;而扩展 Agent Horizon 也被视为另一条重要路径,但长期受限于基础设施不足,以及异构能力难以统一等问题。
针对这些瓶颈,上海 AI Lab 团队推出了一个参数规模为 35B 的 MoEAgent 模型 Agents-A1。其思路并不是继续单纯堆叠参数,而是通过扩展 Agent Horizon,尝试用更小的模型逼近万亿参数级模型在长程任务中的表现。
相关快讯
看懂脑白金的逻辑,你就懂了豆包为什么能付费
豆包专业版上线后引发大量争议,用户最常吐槽的是“太不值”,甚至有人表示“要付费就卸载”。作者认为,500元/月的定价并非在对标 Claude 或 ChatGPT,而是在做更偏符号价值的产品,对标的是“脑白金”式营销逻辑。随着互联网进入 AI 时代,这种符号价值模式可能迎来爆发。
谷歌市值蒸发数千亿美元,Gemini Spark能否力挽狂澜?
一周内,谷歌接连失去四位大模型核心人才:Transformer 八子之一 Noam Shazeer 转投 OpenAI,另有 Jonas Adler、Alexander Pritzel 等参与 Gemini 预训练、编程与 AlphaFold 的关键成员离职。几人分别覆盖架构、科学、编程和预训练等核心环节,引发外界对谷歌士气与技术竞争力的关注,也让新牌 Gemini Spark 是否能稳住局面成为焦点。
来客兄弟AI集团联合柯菲平医药发布AI免疫健康大数据模型,推动健康管理新升级
来客兄弟AI集团与柯菲平医药发布全球首个AI免疫健康大数据模型“大福”,基于HeyBro大模型底座,融合150万+免疫细胞样本和500万级知识图谱,并已落地AI智能脉诊仪等产品。集团还自研搭建了670亿参数HeyBro多模态垂直大模型和Haibro智能体操作系统,支持行业低成本微调。
OpenAI首席研究官最新表态:AGI倒计时,人类窗口期“很小”
OpenAI首席研究官Mark Chen表示,OpenAI并不认为scaling laws失效,预训练、数据工程、推理训练和更长任务链仍是通向AGI的主线。他认为AGI正在逼近,模型将能自主提出创新并开展自我维持的研究,同时今年初许多人已明显感受到AI agent开始真正能在工作中发挥作用。
百度持续加码AI技术投入,再度引进年轻技术人才
大模型技术专家孙天祥近日加入百度,出任基础模型研发部(BMU)负责人,并进入百度模型委员会(BMC)。他此前在MOSS研发、MaaS理念及创业方向上的经历,与百度在基础模型上的战略布局较为契合。此前百度已设立BMU和AMU,应用模型研发部由贾磊负责。
美团开源万亿参数大模型 LongCat-2.0,五万卡国产算力全流程训练
美团正式发布并开源新一代基础大模型LongCat-2.0,参数规模达1.6万亿,成为国内首个在5万张国产算力卡集群上完成预训练与推理全流程的大模型。该模型此前以“Owl Alpha”灰度测试,技术上采用稀疏注意力和动态激活机制,重点强化国产基础设施替代、推理成本控制以及智能体和代码场景优化。