Kimi杨植麟:开源模型引领AI研究的新标准

3个月前更新 zmtzn
7 0 0

在2026中关村论坛开幕式上,月之暗面创始人兼CEO杨植麟于3月25日发表了关于开源AI的主题演讲。他指出,以Kimi K2.5为代表的开源模型正逐渐成为行业新标准,硬件厂商需通过开源模型评测集来验证其性能提升。

杨植麟还提到,当前AI领域的研究方式正在经历转变。过去,行业主要依赖大量互联网数据和少量人工标注,由人类判断数据是否符合价值观和偏好。自去年以来,行业开始更加重视强化学习,尽管仍需人类筛选高质量任务,编程和数学领域的效果提升正是得益于此。

展望未来,AI将在研究中扮演更为主导的角色。每位研究员将配备大量token,以合成新的任务和环境,AI将负责定义这些环境下最合适的奖励函数,并探索新的网络架构。在这一背景下,整个AI研发进程将逐步加速。

Kimi杨植麟:开源模型引领AI研究的新标准的封面图

相关快讯

逆矩阵科技成功完成超亿美元种子轮融资,助力世界模型发展

逆矩阵科技(Physis)成功完成超亿美元的种子++轮融资,参与机构包括经纬创投、光合创投、五源资本、BAI资本和钟鼎资本,此外还获得了蚂蚁集团的战略投资。老股东高瓴创投和北大系基金燕缘创投也进行了追加投资。融资资金将用于通用世界基座模型的预训练研发和规模化训练体系的建设。该公司由北大青年学者陈博远和吉嘉铭共同创立,团队专注于强化学习和世界模型的研究。

华为云推出全新ModelArts Next模型训练与推理平台

华为云发布了新一代模型训推平台ModelArts Next,具备四大核心能力:RL服务、机密推理、模型路由和模型矩阵。MaaS模型路由提供成本优先、效果优先和均衡模式三种策略。企业级RLaaS服务允许用户在一分钟内创建任务,并实现全程可视化和训推一致性。机密推理能力利用硬件级可信执行环境,保障高敏感场景中的数据安全。模型矩阵能力支持主流SOTA模型的Day0上线,并结合自研模型Pangu,覆盖编程和多模态等多种应用场景。

扎克伯格发布全球首个开源AI蛋白质模型,药物研发迎来新机遇!

扎克伯格重金支持的AI蛋白质团队最近取得了新进展。2022年,该团队推出了名为ESMFold的模型,参数量达到150亿,速度比AlphaFold2快十倍。扎克伯格与妻子普莉希拉·陈共同成立的非营利机构“陈-扎克伯格倡议”(CZI)背后,投入5亿美元启动生物版“登月计划”Biohub,旨在到本世纪末治愈所有人类疾病。今年四月,该组织还宣布了一项为期五年、投入5亿美元的计划,旨在与全球顶尖机构合作,开发生命预测模型所需的技术和多模态数据集。

马斯克宣布Grok基础模型V9-Medium(1.5T)训练完成!

马斯克宣布Grok基础模型V9-Medium(1.5T)已完成训练,评估结果良好。该模型在补充训练中加入了大量Cursor数据,并计划继续添加更多数据。微调工作正在进行,强化学习将在数日后启动。预计该模型将在2至3周内正式发布。

英伟达向 Anthropic、OpenAI、SpaceXAI 和甲骨文首发 Vera CPU

英伟达宣布其首批Vera CPU已开始向多家AI公司发货,标志着该处理器进入量产阶段。这款专为Agentic AI设计的处理器的首批系统由英伟达副总裁伊恩·巴克交付给了Anthropic、OpenAI、SpaceXAI和甲骨文云基础设施。SpaceXAI正在评估Vera在强化学习和智能体仿真中的表现,这对其训练系统至关重要。

华为GTS推出创新AI训练数据方法,Amazon与Google迅速响应:难度自适应训练引领新潮流

在大模型后训练中,数据选择不再是简单的“越多越好”,而是需动态挑选最适合的样本难度,以模拟人类学习过程。华为 GTS 研发部 AI 数据团队提出的 EDCO(Entropy-based Dynamic Curriculum Orchestration)方法,通过推理熵动态编排训练课程,使模型始终面对最具挑战性和学习价值的样本。数月后,DARE 论文引用了EDCO,成为难度感知强化学习训练的重要对比基线,作者包括 Rutgers、Amazon 和 Google 的研究人员。

暂无评论

暂无评论...