美团AI重磅开源商用数字人,超越三大闭源竞争者!

2天前更新 DataEye
2 0 0

今日,美团龙猫大模型团队宣布开源商用级数字人视频生成模型 LongCat-Video-Avatar 1.5。该模型在权威评测中,用户偏好胜率全面领先于 Kling Avatar 2.0、OmniHuman-1.5 和 HeyGen 等主要竞争者。此外,该模型以 MIT 协议开放,无商用限制。美团龙猫团队设计了一套多阶段数据处理流水线,自动过滤低质量片段,并注入三类增强数据,犹如为数字人聘请了三位顶尖私教:👥 多人社交课 — 通过主动说话人检测,仅保留单人发声片段,有效避免多人场景中“围观群众乱张嘴”的问题,精准锁定真实发言者。

美团AI重磅开源商用数字人,超越三大闭源竞争者!的封面图

相关快讯

Hallo-Live:开启文本驱动音视频数字人的实时流式生成新时代

最近,上海创智学院和复旦大学的研究者提出了 Hallo-Live 方法,旨在解决异步双流扩散与人类偏好引导蒸馏之间的矛盾。该方法结合了这两种技术,能够在两张 NVIDIA H200 GPU 上实现20.38帧每秒的吞吐量和0.94秒的端到端延迟。Hallo-Live 的整体框架包括两个训练阶段,展示了其在性能上的优势。

Linus Torvalds:AI 再强大也不能替代思考的重要性

在北美开源峰会上,Linus Torvalds 透露 AI 正在显著改变 Linux 内核的开发速度。他指出,最近两个版本的提交量比以往增加了约 20%,这主要归功于 AI 编码工具的有效性,吸引了更多开发者参与。Torvalds 强调,闭源软件并不是解决方案,因为 AI 也能逆向分析闭源程序,而闭源软件更难依赖社区进行修复。尽管他承认 AI 工具能提升编程效率,他仍反对“99% 的代码由 AI 编写”的夸张说法。

企业推动员工使用AI,但算力成本高于人力薪资

《财富》杂志报道,越来越多企业要求员工广泛使用人工智能(AI)以提高效率和降低成本,但这一趋势也带来了新的成本压力。微软最近取消了大部分员工对Claude Code的直接访问权限,并转向推广自家AI编程工具。半年前,微软曾鼓励数千名开发者和项目经理使用Claude Code,导致该工具在公司内部迅速流行,使用规模超出预期。然而,随着员工大量使用,微软现在选择收缩该工具的授权。

美团无人机低空航网正式启用,开启空中配送新篇章

美团无人机于5月21日宣布其“低空航网”正式投入常态化运营,并启动全国低空物流运营人授权服务商招募计划。该计划依托新发布的自研软硬件产品,向行业开放低空配送能力,旨在提升物流效率。

有道发布全新开源“子曰4”多模态与TTS引擎

网易有道近日宣布“子曰”大模型升级至4.0版本,正式进入全模态时代。该版本全面支持文本、图片和音频的融合交互。此外,有道还宣布将“多模态模型”和“语音合成(TTS)模型”开源,进一步推动技术的开放和应用。

SpaceX IPO 招股书揭秘:盈利来自连接业务,航天与 AI 仍面临亏损挑战

SpaceX 最近发布的招股书首次揭示其内部财务状况及业务结构变化。公司已从单一火箭发射企业转型为同时投资卫星互联网和人工智能基础设施的新型企业。整合了 xAI 后,名为“SpaceXAI”的新业务在2026年第一季度营收达到8.18亿美元,但营业亏损高达24.69亿美元,调整后EBITDA亏损为6.09亿美元。SpaceX 计划将“火箭、卫星互联网和AI计算能力”整合为一体化战略,并计划在2028年部署轨道数据中心,申请发射最多100万颗卫星,形成支持AI项目的太空数据中心网络。

暂无评论

暂无评论...