MiniMax Audio发布全新产品Speech-02语音模型，单次支持20万字符输入

备受瞩目的音频技术创新公司MiniMax Audio最新发布了全新的Speech-02系列语音模型，支持30多种语言，一次性输入可达20万字符，为用户带来更真实、更流畅、更便捷的音频体验。

新系列的核心亮点是其多语言覆盖能力显著提升，更准确、更地道地呈现多种语言的发音。另外，Speech-02的人声相似度高达99%，合成的语音听起来更加自然、贴近真人。此外，模型实现了零节奏故障，彻底解决了音频播放过程中可能出现的卡顿和节奏不稳问题，保证了听感的连贯性和流畅性。尽管在多个方面进行了重大升级，Speech-02系列的价格依然亲民。

除了提升核心语音合成技术，MiniMax Audio还推出了多项实用新功能。全新的“Read Anything”功能允许用户通过上传本地文件或粘贴网络URL随时收听各类内容，极大地拓展了用户获取音频信息的途径。用户可以将文档、电子书或网页文章轻松转化为自己喜欢的音色进行聆听。

针对长文本处理需求，MiniMax Audio推出了强大的“Long-Text Mode（长文本）”，该模式支持高达20万字符的异步语音合成，使得创建音频书籍、播客等长音频内容变得前所未有的便捷，彻底解决了长文本合成时需要分段处理的问题。

为优化用户体验，MiniMax Audio增强了历史管理功能，使用户可以更方便地查看、删除和整理自己的语音合成历史和设置。同时，新增的“Discovery Hub”集中展示所有新功能和更新内容，帮助用户快速了解和掌握MiniMax Audio的最新动态。

体验入口：https://www.minimax.io/audio

文章版权归作者所有，未经允许请勿转载。

本文地址：https://aidh.net/kuaixun/nvgvd399