PengChengStarling

PengChengStarling

PengChengStarling是由 PengCheng Labs 开发的多语言自动语音识别工具，支持中文、英语、俄语、越南语、日语、泰语、印度尼西亚语和阿拉伯语。相比 Whisper-Large v3，PengChengSt...

0收藏0点赞153浏览0评论

链接直达 0 0

PengChengStarling是开源的多语言自动语音识别工具，支持多种语言，推理速度快，适用于多种应用场景。

特别声明

本站自媒体指南所展示的PengChengStarling均来源于网络，本站无法保证外部链接的准确性与完整性，且不对外部链接指向的内容拥有实际控制权。收录于2026年3月2日下午2:30的网页内容，在收录时均合规合法；若后续内容出现违规情况，可联系网站管理员进行删除处理，自媒体指南对此不承担任何法律责任。

自媒体指南专为自媒体创作者打造的资源聚合平台！本文地址 https://www.zmtzn.com/sites/7223.html 转载请注明

PengChengStarling 相关网站

Gemini 2.5 Flash Image

Gemini 2.5 Flash Image

Gemini 2.5 Flash Image是Google最新AI图像生成模型，支持多图融合与精准编辑，适用于电商、教育等多个场景。

Goku

Goku是由香港大学与字节跳动研发的多模态视频生成模型，专为低成本、高效率的数字内容创作而设计。

YAYI2

YAYI2是中科闻歌推出的开源大语言模型，支持多语言，具备强大的知识问答和多模态交互能力。

YuE

探索YuE音乐生成模型，这是一款由香港科技大学开发的开源工具，支持多种音乐风格与语言，能够快速生成高质量的完整音乐音频。无论是音乐创作、影视配乐还是游戏开发，YuE都能满足您的需求，立即体验创意音乐制作的乐趣！

MAI-Voice-1

MAI-Voice-1是Microsoft AI的高效语音生成模型，支持多场景应用，提供自然、富有情感的语音合成体验。

FlashVideo

FlashVideo是由字节跳动和香港大学开发的高分辨率视频生成框架，支持快速生成1080p视频，优化流畅性和计算成本。

JoyGen

JoyGen结合音频输入与3D深度感知技术，实现逼真的唇部同步与面部表情，广泛应用于视频编辑与虚拟交互。

iTerms

iTerms是法大大推出的AI法律智能工作台，帮助企业快速甄别合同风险，提升审查效率，节约合规成本。

Tarsier

Tarsier是字节跳动研发的视频语言模型，具备高质量视频描述和理解能力，适用于多种视频理解任务。

暂无评论

暂无评论...