相关快讯
阿里巴巴推出全新视频生成模型HappyHorse 1.1
阿里巴巴于6月22日发布了视频生成模型HappyHorse 1.1版本。与1.0版本相比,HappyHorse 1.1在动态表现力、主体一致性、指令遵循、视觉质感和音频能力等多个方面进行了系统性升级。新版本已在HappyHorse官网、阿里云百炼和千问云等平台上接入。
Grok Imagine Video 1.5 发布:25 秒内生成 6 秒 720P 视频!
马斯克旗下的 xAI 公司宣布正式上线 Grok Imagine Video 1.5 模型,并结束了其在 xAI API 中的预览阶段。该模型于2026年6月3日首次发布,专注于“静态图一键生成带同步音频的短视频”。与前代相比,Grok Imagine Video 1.5 在音画同步、运动真实性和生成速度方面进行了显著升级。它能够在单次生成中同时输出音效、环境音和对话,确保音频与画面动作精准对齐。同时,语音清晰度和口型同步效果得到了提升,适合用于人物配音的短片创作。
开悟世界模型在RoboTwin 2.0具身智能评测中领先表现
大晓机器人推出的开悟世界模型(Kairos)在多个全球评测中表现卓越,分别在RoboTwin 2.0、LIBERO-Plus、WorldModelBench Robot和DreamGen等具身智能视频生成与状态预测领域中获得第一名。该模型采用了“多模态理解—生成—预测”的一体化架构,并已向整个行业开源。
LobsterAI推出“专家套件”、Sites建站及多语言语音输入三大新功能
全场景AI助手LobsterAI近期进行了更新,推出了三个核心功能:专家套件、Sites一键建站和多语言语音输入。这些功能旨在将AI深度融入用户的真实工作流程,提升工作效率,使其成为一个全天候的岗位级助手。
中文在线:AI短剧引领Token消费新趋势
6月3日,中文在线发布数据显示,AI短剧已成为Token消耗的主要场景,占比55%。在所有Token消耗中,AI短剧和视频生成位居首位,其次是电商与营销,占比24%。软件开发领域因Vibe Coding的热潮曾被看好,但在Claude等编程工具的影响下,仅占15%。AI短剧和视频生成的Token消耗量是软件开发的两倍以上,显示出其在Token经济学中的重要地位。
美团AI重磅开源商用数字人,超越三大闭源竞争者!
美团龙猫大模型团队近日开源了商用级数字人视频生成模型 LongCat-Video-Avatar 1.5,该模型在权威评测中表现优异,用户偏好胜率超过了Kling Avatar 2.0、OmniHuman-1.5和HeyGen等主要竞争者。该模型以MIT协议开放,无商用限制。团队构建了多阶段数据处理流水线,通过自动过滤低质片段并注入三类增强数据,提升模型性能。其中,多人社交课功能通过主动说话人检测,确保仅保留单人发声片段,有效解决了多人场景中的干扰问题。
