网易推出Confucius4-TTS：首个支持14种语言的无口音语音克隆开源模型，仅需3秒音频即可实现音色复制

5小时前更新 kw178

1 0 0 0

网易有道今日发布了“子曰 4.0”TTS语音合成引擎——Confucius4-TTS。根据官方介绍，Confucius4-TTS 是行业首个支持14种语言无口音跨语种语音克隆的开源模型，且无需参考文本。

在技术性能上，Confucius4-TTS 实现了零样本语音克隆。情感表达方面，该模型突破了传统TTS依赖文本标签控制情感的局限，创新性地支持音频Prompt情感克隆迁移。

网易推出Confucius4-TTS：首个支持14种语言的无口音语音克隆开源模型，仅需3秒音频即可实现音色复制的封面图

AI视频生成公司Sand.ai成功完成两轮融资，发展势头强劲！

Sand.ai最近宣布完成新一轮融资，三个月内累计融资超过1亿美元，投资方包括宿华、Lollapalooza Capital等多家知名机构。该公司计划在今年第三季度开源一款新一代视频生成模型，采用MoE架构，旨在实现高效推理并拥有开源领域最大的参数规模。创始人兼CEO曹越表示，Sand.ai有信心达到行业领先水平，并将该模型开放给所有用户。

逻辑智能低资源语音研究获选ICML 2026，韩国首尔见！

逻辑智能团队将于7月6日赴韩国首尔参加ICML 2026，带来其入选论文，内容为SE-Bridge-TTS。这一研究专注于小语种场景中真实语音稀缺的问题，通过合成数据的扩展、自动筛选与偏好对齐，旨在提升语音合成的稳定性、自然度和可克隆能力。

雷军：AI无法取代人类的独特价值

在北京国际图书博览会上，小米创始人雷军与作家刘震云探讨了人工智能与人类创造力的关系。雷军表示，尽管AI的能力迅速提升，能够完成许多传统上由人类执行的任务，但它仍难以替代深度情感的表达。他还透露，小米已在内部全面推广AI工具，应用于文稿撰写、工作报告等日常办公场景，显著提高了团队的运转效率。

大晓机器人发布开源 ACE-Ego VLA 模型，提升塑料袋打包与鞋盒装填效率

大晓机器人与香港中文大学多媒体实验室联合推出了全新的“一脑多型”具身操作 VLA 模型 ACE-Ego，并向行业开源。ACE-Ego 在人形机器人操作基准 RoboCasa GR1 TableTop 上以 72.8% 的成功率创下新纪录，领先于英伟达和京东等主流模型。在高难度的 RoboTwin 2.0 测试中，ACE-Ego 成功率达到 90.62%，远超行业平均水平。该模型目前能够稳定完成复杂的零售操作，如塑料袋打包和鞋子装入鞋盒等。

谷歌发布全新开源模型DiffusionGemma

谷歌于6月10日发布了实验性开源模型DiffusionGemma，采用文本扩散架构，在专用GPU上文本生成速度比传统自回归大语言模型快最多4倍。该模型以Apache 2.0许可证发布，主要面向研究者和开发者，但整体输出质量低于标准Gemma 4，仍建议在生产环境中使用后者。DiffusionGemma的速度优势主要体现在本地及低并发推理场景，然而在高并发云端部署中，其优势相对有限。

阶跃星辰发布开源 Step 3.7 Flash 模型：每秒生成高达 400 Tokens

阶跃星辰发布并开源了 Step 3.7 Flash，这是为 Agent 生产化阶段设计的新一代模型。该模型经过系统优化，专注于 Agent、Coding、Search 和多模态工作流。Step 3.7 Flash 采用稀疏 MoE 架构，拥有196B+1.8B（ViT）总参数和11B激活参数，最高生成速度可达400 Tokens/s，适合高频、多轮和低延迟的应用。其主要功能包括原生多模态理解与执行，能够处理UI、图表、文档、图片及应用界面，将复杂视觉信息转化为结构化结果、代码生成及可执行任务。

暂无评论

暂无评论...

网易推出Confucius4-TTS：首个支持14种语言的无口音语音克隆开源模型，仅需3秒音频即可实现音色复制

特朗普政府向Meta施压，要求提交AI模型进行安全审查

济南迎来国家人工智能中试基地：聚焦工业软件创新

相关快讯

AI视频生成公司Sand.ai成功完成两轮融资，发展势头强劲！

逻辑智能低资源语音研究获选ICML 2026，韩国首尔见！

雷军：AI无法取代人类的独特价值

大晓机器人发布开源 ACE-Ego VLA 模型，提升塑料袋打包与鞋盒装填效率

谷歌发布全新开源模型DiffusionGemma

阶跃星辰发布开源 Step 3.7 Flash 模型：每秒生成高达 400 Tokens

暂无评论

快讯
查看快讯

网易推出Confucius4-TTS：首个支持14种语言的无口音语音克隆开源模型，仅需3秒音频即可实现音色复制

特朗普政府向Meta施压，要求提交AI模型进行安全审查

济南迎来国家人工智能中试基地：聚焦工业软件创新

相关快讯

AI视频生成公司Sand.ai成功完成两轮融资，发展势头强劲！

逻辑智能低资源语音研究获选ICML 2026，韩国首尔见！

雷军：AI无法取代人类的独特价值

大晓机器人发布开源 ACE-Ego VLA 模型，提升塑料袋打包与鞋盒装填效率

谷歌发布全新开源模型DiffusionGemma

阶跃星辰发布开源 Step 3.7 Flash 模型：每秒生成高达 400 Tokens

暂无评论

快讯查看快讯

快讯
查看快讯