OuteTTS-0.1-350M：一款具有零样本语音克隆的创新型文本转语音合成模型

摘要：

近日，Oute AI 发布了一款全新的开源中文文本转语音模型，名为 OuteTTS-0.1-350M。该模型旨 […]

OuteTTS-0.1-350M：一款具有零样本语音克隆的创新型文本转语音合成模型的封面图

近日，Oute AI 发布了一款全新的开源中文文本转语音模型，名为 OuteTTS-0.1-350M。该模型旨在为开发者提供更便捷、更高效的中文 TTS 解决方案。OuteTTS-0.1-350M 基于 LLaMa 架构，并采用了 WavTokenizer 音频编码技术，从而实现了高质量的语音合成效果。

通过该模型，开发者可以轻松地将文本转换为自然流畅的语音，极大地提升了人机交互的体验。OuteTTS-0.1-350M 不仅支持标准的语音合成，还兼容 llama.cpp 框架，方便开发者进行快速部署和定制化开发。即使在算力有限的设备上（如 3.5 英寸屏幕），也能流畅运行，实现本地化、个性化的 TTS 语音生成。

OuteTTS-0.1-350M 的发布和开源，为语音技术领域注入了新的活力，为开发者提供了更多选择和可能性。Oute AI 在 CC-BY 许可下发布该模型，旨在鼓励更多开发者参与到中文语音技术的研究和应用中来，共同推动 TTS 技术的进步。

OuteTTS-0.1-350M 模型的发布，标志着开源中文文本转语音技术迈出了重要一步，它为开发者提供了一个功能强大且易于使用的语音合成工具。该模型基于 LLaMa 架构，并采用了 WavTokenizer 技术，不仅实现了高质量的语音输出，还降低了对硬件资源的需求，为更多应用场景带来了可能。有了它，开发者可以更加便捷地构建各种语音交互应用。

相关链接：https://www.outeai.com/blog/OuteTTS-0.1-350M

文章版权归作者所有，未经允许请勿转载。

本文地址：https://aidh.net/kuaixun/sig3clqv