网易有道发布了“子曰 4.0”TTS语音合成引擎——Confucius4-TTS。该引擎是业内首个支持14种语言无口音跨语种语音克隆的开源模型,且无需参考文本。技术上,Confuc...
Sand.ai最近宣布完成新一轮融资,三个月内累计融资超过1亿美元,投资方包括宿华、Lollapalooza Capital等多家知名机构。该公司计划在今年第三季度开源一款新...
大晓机器人与香港中文大学多媒体实验室联合推出了全新的“一脑多型”具身操作 VLA 模型 ACE-Ego,并向行业开源。ACE-Ego 在人形机器人操作基准 RoboCasa GR1 Ta...
谷歌于6月10日发布了实验性开源模型DiffusionGemma,采用文本扩散架构,在专用GPU上文本生成速度比传统自回归大语言模型快最多4倍。该模型以Apache 2.0许可证...
阶跃星辰发布并开源了 Step 3.7 Flash,这是为 Agent 生产化阶段设计的新一代模型。该模型经过系统优化,专注于 Agent、Coding、Search 和多模态工作流。Step...
地平线于5月18日宣布开源HoloMotion-1,这是一个拥有4亿参数的机器人小脑大模型,旨在实现人形机器人的全身控制。HoloMotion-1是HoloMotion技术路线的第一阶...
4月24日,国家超算互联网宣布DeepSeek-V4预览版已上线其AI社区,企业、科研机构和个人开发者可下载模型文件并快速进行部署、推理和开发。超算互联网表示,将...
月之暗面发布并开源了Kimi K2.6模型,显著提升了其在通用Agent、代码处理和视觉理解等方面的能力。该模型在多个基准测试中表现优于或持平于GPT-5.4、Claude O...
智谱发布了新一代开源模型GLM-5.1,并宣布该模型价格上涨10%。此次调价使得GLM-5.1在Coding场景中的缓存命中Token价格接近Anthropic的Claude Sonnet 4.6水平。
网易推出Confucius4-TTS:首个支持14种语言的无口音语音克隆开源模型,仅需3秒音频即可实现音色复制
网易有道发布了“子曰 4.0”TTS语音合成引擎——Confucius4-TTS。该引擎是业内首个支持14种语言无口音跨语种语音克隆的开源模型,且无需参考文本。技术上,Confuc...
kw178
in 未分类