相关快讯
美团AI重磅开源商用数字人,超越三大闭源竞争者!
美团龙猫大模型团队近日开源了商用级数字人视频生成模型 LongCat-Video-Avatar 1.5,该模型在权威评测中表现优异,用户偏好胜率超过了Kling Avatar 2.0、OmniHuman-1.5和HeyGen等主要竞争者。该模型以MIT协议开放,无商用限制。团队构建了多阶段数据处理流水线,通过自动过滤低质片段并注入三类增强数据,提升模型性能。其中,多人社交课功能通过主动说话人检测,确保仅保留单人发声片段,有效解决了多人场景中的干扰问题。
4K花园发布AI短剧画质提升工具蝶变3.0,公测即将开启!
在第22届中国(深圳)国际文化产业博览交易会上,4K花园推出了面向AI短剧创作者的画质提升工具“蝶变3.0”。该工具在展会期间首次亮相,并将很快开放公测。
有道发布全新开源“子曰4”多模态与TTS引擎
网易有道近日宣布“子曰”大模型升级至4.0版本,正式进入全模态时代。该版本全面支持文本、图片和音频的融合交互。此外,有道还宣布将“多模态模型”和“语音合成(TTS)模型”开源,进一步推动技术的开放和应用。
智象未来发布超2000亿参数全模态大模型,成功完成亿级融资
智象未来发布了基于Unified Transformer(UiT)架构的图像大模型HiDream-O1-Image-Pro,该模型超2千亿参数,在多个基准测试中刷新了SOTA纪录,标志着其在多模态统一建模方面的进展。此外,智象未来还完成了新一轮亿级融资,参与机构包括深创投、金浦投资、财鑫资本和复聚资本,这是公司在半个月内的第二次融资。
群核科技的空间智能大模型成功获得国家备案
群核科技的空间智能大模型近日获得浙江省网信办备案,成为国内首批合规落地的空间智能大模型之一。该模型基于大量3D数据训练,拥有空间认知与生成能力,已经在机器人训练、数字孪生和AI设计等多个领域得到应用。其开源子模型SpatialLM在2025年曾在HuggingFace全球趋势榜上排名第一。
电气装备领域迎来“电擎”大模型发布新篇章
中国电气装备集团近日正式发布了电气装备领域的垂类大模型“电擎”。该模型专注于新型能源体系的建设,旨在构建一个覆盖输配电装备全生命周期的智能化能力体系,从而实现产品全链条的智能驱动。
