相关快讯
网易推出Confucius4-TTS:首个支持14种语言的无口音语音克隆开源模型,仅需3秒音频即可实现音色复制
网易有道发布了“子曰 4.0”TTS语音合成引擎——Confucius4-TTS。该引擎是业内首个支持14种语言无口音跨语种语音克隆的开源模型,且无需参考文本。技术上,Confucius4-TTS具备零样本语音克隆能力,能够实现高效的语音合成。在情感表达方面,该引擎创新性地采用音频Prompt进行情感克隆迁移,突破了传统TTS依赖文本标签的限制,提升了情感表达的精准性和多样性。
AI视频生成公司Sand.ai成功完成两轮融资,发展势头强劲!
Sand.ai最近宣布完成新一轮融资,三个月内累计融资超过1亿美元,投资方包括宿华、Lollapalooza Capital等多家知名机构。该公司计划在今年第三季度开源一款新一代视频生成模型,采用MoE架构,旨在实现高效推理并拥有开源领域最大的参数规模。创始人兼CEO曹越表示,Sand.ai有信心达到行业领先水平,并将该模型开放给所有用户。
磷酸铁锂价格翻倍,强劲需求持续推动市场
磷酸铁和磷酸铁锂作为新能源和储能电池的重要原材料,价格在2023年持续上涨,一包约400公斤的磷酸铁锂价格已超过25000元,较去年翻倍。尽管价格增加,市场需求依然强劲,尤其是头部新能源车企的订单显著增长,推动了生产企业的销售。企业负责人指出,新能源汽车和储能产品的出口需求是拉动磷酸铁锂需求的主要因素。此外,上游原材料价格上涨,特别是磷酸铁的成本上升,也加剧了磷酸铁锂的生产成本,进一步推动了价格上涨。
尼吉康宣布全线铝电容价格上涨
日本铝电容制造商尼吉康(Nichicon)宣布将全线调涨铝电解电容价格,原因是部分产品订单量超过现有生产能力。此外,中东局势动荡导致核心原材料采购难度增加,使公司无法完全吸收成本上涨。
大晓机器人发布开源 ACE-Ego VLA 模型,提升塑料袋打包与鞋盒装填效率
大晓机器人与香港中文大学多媒体实验室联合推出了全新的“一脑多型”具身操作 VLA 模型 ACE-Ego,并向行业开源。ACE-Ego 在人形机器人操作基准 RoboCasa GR1 TableTop 上以 72.8% 的成功率创下新纪录,领先于英伟达和京东等主流模型。在高难度的 RoboTwin 2.0 测试中,ACE-Ego 成功率达到 90.62%,远超行业平均水平。该模型目前能够稳定完成复杂的零售操作,如塑料袋打包和鞋子装入鞋盒等。
智谱GLM-5.2正式向所有GLM Coding Plan用户开放
GLM-5.2将于今晚5:21面向所有GLM Coding Plan用户开放,涵盖Lite、Pro、Max及团队版。其API预计将在下周上线,模型也将在下周正式开源,并遵循MIT协议。
