智源宣布FlagOS成功适配DeepSeekV4八款芯片

1个月前更新 zmtzn
5 0 0

DeepSeek今日推出了DeepSeek-V4-Pro旗舰模型,参数量达到1.86万亿,以及高效模型DeepSeek-V4-Flash,参数为2840亿。由智源研究院主导的众智FlagOS迅速对这两个模型进行了全面适配,成功实现DeepSeek-V4-Flash在超过8款AI芯片上的推理部署,涵盖海光、沐曦、华为昇腾、摩尔线程(FP8)、昆仑芯、平头哥真武、天数和英伟达(FP8)等。与此同时,FlagOS也在积极推进DeepSeek-V4-Pro模型在多个芯片上的迁移适配,后续将开源。

智源宣布FlagOS成功适配DeepSeekV4八款芯片的封面图

相关快讯

DeepSeek大幅降低V4Pro API价格至每百万输入代币仅0.435美元

DeepSeek宣布将V4Pro API的价格降低75%,调整为每百万输入代币0.435美元和每百万输出代币0.87美元。此外,原定于5月31日到期的折扣价格将永久生效。

宁德时代豪投105亿,锁定AI算力领军者DeepSeek!

宁德时代计划参与DeepSeek的首轮融资,显示其在全球动力电池市场的战略扩展。过去一个半月,宁德时代已投资105亿元推进AI算电协同发展,旨在整合电力、算力、储能和AI产业链。该公司还通过旗下投资平台投资了能源大模型公司达卯科技,并与商汤合作开发AIDC算电协同平台,以抢占智能调度市场。此外,四部门联合发布的行动方案目标到2030年实现全国算力枢纽节点的绿电应用比例达到80%以上,进一步推动AI与能源的融合。

Anthropic与微软洽谈合作,共同开发AI芯片

据报道,Anthropic正在与微软进行谈判,计划租用搭载微软自主设计的AI服务器芯片的服务器。

俄罗斯联邦储蓄银行计划采购中国AI芯片以支持GigaChat AI模型运行

俄罗斯联邦储蓄银行首席执行官German Gref表示,银行希望通过中国制造的芯片为其AI模型“GigaChat”提供算力支持。该行致力于推进自主AI发展,但在从中国采购芯片的过程中可能面临激烈竞争,尤其是字节跳动、阿里巴巴和腾讯等公司也在争相采购华为昇腾950芯片。Gref未透露具体希望采购的芯片种类。目前,俄罗斯在AI领域相较于中国和美国处于落后状态,并且在敏感行业高度依赖进口电子产品。

DeepSeek正式推出Claude竞品,直面美国编程巨头挑战

DeepSeek于5月20日发布了V4系列大模型,性价比高,但在AI编程领域仍需改进。公司计划推出一款与Calude Code竞争的编程Agent。AI编程是当前AI生产力最强的领域,Anthropic通过Claude Code实现了显著的市场估值提升。由于对国内开发者的支持不足,许多人期待国产编程Agent能够超越或至少对标Claude Code。DeepSeek近期的招聘信息表明,他们将专注于Harness编程方向的开发。

DeepSeek发布Agent Harness职位,或将推出智能体产品

DeepSeek近期发布了两个与Agent Harness相关的职位:产品经理和研发工程师。招聘信息表明,公司致力于将前沿模型能力应用于智能体产品的开发,强调Harness在这一过程中承担的核心角色,涵盖模型以外的所有相关工作。

暂无评论

暂无评论...