中科曙光scaleX40超节点在中关村论坛精彩亮相

3个月前更新 zmtzn
14 0 0

自媒体指南报道,2026年中关村论坛年会期间,中科曙光正式推出首款无线缆箱式超节点scaleX40。该设备内置40张GPU,整体算力超过28 PFLOPS(FP8精度),显存总容量超过5TB,采用16U标准机箱设计,兼容99%以上的机房环境。

中科曙光scaleX40超节点在中关村论坛精彩亮相的封面图

相关快讯

Cursor发布新模型:10万卡加持与Opus、GPT同台竞技

SpaceX宣布以600亿美元收购Cursor,后者推出了一个新的1.5万亿+参数的大模型,该模型在超过10万块GPU上预训练。至今,只有Anthropic成功达到约10万亿参数规模。分析师Michael认为OpenAI在年底前追赶Anthropic将面临挑战,同时OpenAI正在应对GPT-4.5后的调整压力。此外,xAI和Meta也在为下一阶段的大模型竞争做准备。

谷歌发布全新开源模型DiffusionGemma

谷歌于6月10日发布了实验性开源模型DiffusionGemma,采用文本扩散架构,在专用GPU上文本生成速度比传统自回归大语言模型快最多4倍。该模型以Apache 2.0许可证发布,主要面向研究者和开发者,但整体输出质量低于标准Gemma 4,仍建议在生产环境中使用后者。DiffusionGemma的速度优势主要体现在本地及低并发推理场景,然而在高并发云端部署中,其优势相对有限。

小米推出全新MiMo-V2.5-Pro-UltraSpeed模式,提升网络体验

6月8日晚,小米MiMo技术团队推出了Xiaomi MiMo-V2.5-Pro-UltraSpeed模式。该模式通过优化模型推理系统的全链路工程能力,实现了推理速度提升至1000 tokens/s,且无需定制芯片,仅使用通用GPU即可完成。这一创新在不降低模型能力的前提下,标志着小米在推理速度方面的重大进展。

阿里达摩院推出首款GPU版本求解器

阿里巴巴达摩院发布了“敏迭”求解器(MindOpt)的GPU版本,充分利用GPU的并行加速特性,并引入新算法以解决“长尾效应”难题。经过对约2000个通用算例的测试,敏迭能够稳定求解99%以上的问题类型至高精度。此外,它还支持传统上被认为“不可解”的亿级变量线性规划问题。

中科曙光推出全新高端闪存存储解决方案

中科曙光于5月13日发布了全新高端全闪存存储产品FlashNexus 9000,具备2亿IOPS的整体性能和0.09ms的低时延。该产品采用自研的“超级隧道”与NexusMatrix全互联矩阵技术,确保在极端情况下的系统稳定性和数据安全。同时,核心部件和软件均实现100%国产化,并兼容20余种主流操作系统,全面支持国内外主流数据库及云原生、K8s等架构。

摩尔线程携手光轮智能开启战略合作新篇章

摩尔线程与光轮智能近期达成战略合作,旨在联合开发高置信度仿真数据合成方案。合作将依托摩尔线程的全功能GPU和光轮智能的夸娥(KUAE)智算集群,同时结合其自主研发的“求解—测量—生成”三位一体全栈仿真平台。这一合作将推动仿真技术的发展,提升数据合成的准确性和可靠性。

暂无评论

暂无评论...