SpaceX宣布以600亿美元收购Cursor,后者推出了一个新的1.5万亿+参数的大模型,该模型在超过10万块GPU上预训练。至今,只有Anthropic成功达到约10万亿参数规模...
谷歌于6月10日发布了实验性开源模型DiffusionGemma,采用文本扩散架构,在专用GPU上文本生成速度比传统自回归大语言模型快最多4倍。该模型以Apache 2.0许可证...
6月8日晚,小米MiMo技术团队推出了Xiaomi MiMo-V2.5-Pro-UltraSpeed模式。该模式通过优化模型推理系统的全链路工程能力,实现了推理速度提升至1000 tokens/s...
阿里巴巴达摩院发布了“敏迭”求解器(MindOpt)的GPU版本,充分利用GPU的并行加速特性,并引入新算法以解决“长尾效应”难题。经过对约2000个通用算例的测试,敏...
摩尔线程与光轮智能近期达成战略合作,旨在联合开发高置信度仿真数据合成方案。合作将依托摩尔线程的全功能GPU和光轮智能的夸娥(KUAE)智算集群,同时结合其...
在2026年中关村论坛年会上,中科曙光发布了首个无线缆箱式超节点scaleX40。该设备内置40张GPU,具备超过28 PFLOPS(FP8精度)的总算力和超过5TB的显存总容量...
在2026年中关村论坛年会上,中科曙光发布了首个无线缆箱式超节点scaleX40。该设备内置40张GPU,具备超过28 PFLOPS的算力(FP8精度),显存总容量超过5TB。sca...
Cursor发布新模型:10万卡加持与Opus、GPT同台竞技
SpaceX宣布以600亿美元收购Cursor,后者推出了一个新的1.5万亿+参数的大模型,该模型在超过10万块GPU上预训练。至今,只有Anthropic成功达到约10万亿参数规模...
媒体派
in 未分类