相关快讯
网易推出Confucius4-TTS:首个支持14种语言的无口音语音克隆开源模型,仅需3秒音频即可实现音色复制
网易有道发布了“子曰 4.0”TTS语音合成引擎——Confucius4-TTS。该引擎是业内首个支持14种语言无口音跨语种语音克隆的开源模型,且无需参考文本。技术上,Confucius4-TTS具备零样本语音克隆能力,能够实现高效的语音合成。在情感表达方面,该引擎创新性地采用音频Prompt进行情感克隆迁移,突破了传统TTS依赖文本标签的限制,提升了情感表达的精准性和多样性。
谷歌向《后室》制片公司A24注资7500万美元
谷歌正在向独立电影公司A24投资约7500万美元,并计划与其建立新的人工智能研究合作关系。A24成立于2012年,以其代表作品《瞬息全宇宙》、《月光男孩》和《后室》等知名。
AI视频生成公司Sand.ai成功完成两轮融资,发展势头强劲!
Sand.ai最近宣布完成新一轮融资,三个月内累计融资超过1亿美元,投资方包括宿华、Lollapalooza Capital等多家知名机构。该公司计划在今年第三季度开源一款新一代视频生成模型,采用MoE架构,旨在实现高效推理并拥有开源领域最大的参数规模。创始人兼CEO曹越表示,Sand.ai有信心达到行业领先水平,并将该模型开放给所有用户。
Noam Shazeer:谷歌投资27亿美元却无法留住的Transformer核心作者加盟OpenAI
Noam Shazeer,Transformer的核心作者,近期宣布加入OpenAI。他曾因谷歌拒绝发布其开发的聊天机器人而在2021年离职创业。2024年,谷歌花费约27亿美元与Character.AI达成技术许可协议,将Shazeer重新招回。在他再次表达离职意向后,OpenAI和马斯克的xAI等多家公司积极竞争争取他的加盟。尽管多次向高层建议将Shazeer的技术向公众发布,但均遭拒绝,而这一事件发生在OpenAI推出ChatGPT震惊世界的两年前。
谷歌推出搭载Gemini技术的全新Google Home音箱
谷歌宣布其为Gemini AI模型打造的Google Home音箱将于下周开始销售,定价为99.99美元。这是谷歌首款专为该AI模型设计的音频设备。
谷歌DeepMind研究员诺姆·沙泽尔正式加盟OpenAI
谷歌DeepMind的研究员诺姆·沙泽尔将加入OpenAI,相关消息已被报道。
