北京大学与百度联合推出了新的代码生成基准RepoZero,旨在为“从零生成完整代码仓库”提供可验证、可扩展的评测框架。这一突破标志着大语言模型(LLM)在代码生...
OpenAI联合创始人安德烈·卡帕西宣布加入Anthropic,表示对大语言模型未来发展的期待。他将在预训练团队负责人尼克·约瑟夫的领导下组建新团队,致力于利用Clau...
《自然》15日发布的研究表明,大语言模型(LLM)可能会将自身偏好“夹带私货”,影响其他算法,即使原始特征已在训练数据中清除。研究中一个案例显示,模型通过...
云服务提供商Nebius正在与以色列人工智能初创公司AI21 Labs进行收购谈判,旨在扩展其人工智能服务。Nebius由英伟达支持,市值达到320亿美元,主要业务为服务...
4月3日,LMArena旗下的Code Arena发布了最新的编程能力排名。阿里巴巴的大语言模型Qwen 3.6-Plus在全球榜单中位居第二,成为中国大模型中排名最高的。
阿里巴巴于4月2日正式发布了新一代大语言模型Qwen3.6-Plus,并将其接入到企业级市场的旗舰AI应用悟空中。这标志着阿里在AI技术领域的进一步发展和应用。
阿里发布了新一代大语言模型Qwen3.6-Plus,具备原生多模态理解和推理能力。该模型在前端网页开发和复杂任务处理等实测场景中,能够自主拆解任务、规划路径并...
谷歌推出了TurboQuant压缩算法,旨在降低人工智能系统的内存需求,特别是大语言模型和向量搜索引擎。该技术主要解决AI系统中高频访问信息的键值缓存瓶颈问题...
北大推出RepoZero:首个可验证的仓库级生成基准,评测LLM从零构建代码仓库能力
北京大学与百度联合推出了新的代码生成基准RepoZero,旨在为“从零生成完整代码仓库”提供可验证、可扩展的评测框架。这一突破标志着大语言模型(LLM)在代码生...