大语言模型 - 自媒体指南

北大推出RepoZero：首个可验证的仓库级生成基准，评测LLM从零构建代码仓库能力

北京大学与百度联合推出了新的代码生成基准RepoZero，旨在为“从零生成完整代码仓库”提供可验证、可扩展的评测框架。这一突破标志着大语言模型（LLM）在代码生...

in 未分类

1个月前 6 0 0 0

“卡神”加盟Anthropic，担任“最具挑战性AI”职位

OpenAI联合创始人安德烈·卡帕西宣布加入Anthropic，表示对大语言模型未来发展的期待。他将在预训练团队负责人尼克·约瑟夫的领导下组建新团队，致力于利用Clau...

kw178

in 未分类

1个月前 6 0 0 0

大语言模型在蒸馏过程中可能引入自身偏好

《自然》15日发布的研究表明，大语言模型（LLM）可能会将自身偏好“夹带私货”，影响其他算法，即使原始特征已在训练数据中清除。研究中一个案例显示，模型通过...

zmtzn

in 未分类

2个月前 5 0 0 0

Nebius积极洽谈收购以色列AI初创公司AI21，英伟达收购未果后新动向

云服务提供商Nebius正在与以色列人工智能初创公司AI21 Labs进行收购谈判，旨在扩展其人工智能服务。Nebius由英伟达支持，市值达到320亿美元，主要业务为服务...

zmtzn

in 未分类

3个月前 7 0 0 0

阿里Qwen 3.6-Plus荣获全球大模型盲测榜单第二名

4月3日，LMArena旗下的Code Arena发布了最新的编程能力排名。阿里巴巴的大语言模型Qwen 3.6-Plus在全球榜单中位居第二，成为中国大模型中排名最高的。

媒体派

in 未分类

3个月前 12 0 0 0

悟空成功整合国产编程模型Qwen3.6-Plus

阿里巴巴于4月2日正式发布了新一代大语言模型Qwen3.6-Plus，并将其接入到企业级市场的旗舰AI应用悟空中。这标志着阿里在AI技术领域的进一步发展和应用。

媒体派

in 未分类

3个月前 7 0 0 0

阿里推出全新千问大语言模型Qwen3.6-Plus

阿里发布了新一代大语言模型Qwen3.6-Plus，具备原生多模态理解和推理能力。该模型在前端网页开发和复杂任务处理等实测场景中，能够自主拆解任务、规划路径并...

zmtzn

in 未分类

3个月前 8 0 0 0

谷歌发布TurboQuant压缩算法，内存节省率高达6倍！

谷歌推出了TurboQuant压缩算法，旨在降低人工智能系统的内存需求，特别是大语言模型和向量搜索引擎。该技术主要解决AI系统中高频访问信息的键值缓存瓶颈问题...

zmtzn

in 未分类

3个月前 17 0 0 0

标签：大语言模型

北大推出RepoZero：首个可验证的仓库级生成基准，评测LLM从零构建代码仓库能力

“卡神”加盟Anthropic，担任“最具挑战性AI”职位

kw178

大语言模型在蒸馏过程中可能引入自身偏好

zmtzn

Nebius积极洽谈收购以色列AI初创公司AI21，英伟达收购未果后新动向

zmtzn

阿里Qwen 3.6-Plus荣获全球大模型盲测榜单第二名

媒体派

悟空成功整合国产编程模型Qwen3.6-Plus

媒体派

阿里推出全新千问大语言模型Qwen3.6-Plus

zmtzn

谷歌发布TurboQuant压缩算法，内存节省率高达6倍！

zmtzn