MiniMax Audio发布全新产品Speech-02语音模型,单次支持20万字符输入

4周前发布AI俱乐部
1 0 0
MiniMax Audio发布全新产品Speech-02语音模型,单次支持20万字符输入的封面图

备受瞩目的音频技术创新公司MiniMax Audio最新发布了全新的Speech-02系列语音模型,支持30多种语言,一次性输入可达20万字符,为用户带来更真实、更流畅、更便捷的音频体验。

新系列的核心亮点是其多语言覆盖能力显著提升,更准确、更地道地呈现多种语言的发音。另外,Speech-02的人声相似度高达99%,合成的语音听起来更加自然、贴近真人。此外,模型实现了零节奏故障,彻底解决了音频播放过程中可能出现的卡顿和节奏不稳问题,保证了听感的连贯性和流畅性。尽管在多个方面进行了重大升级,Speech-02系列的价格依然亲民。

除了提升核心语音合成技术,MiniMax Audio还推出了多项实用新功能。全新的“Read Anything”功能允许用户通过上传本地文件或粘贴网络URL随时收听各类内容,极大地拓展了用户获取音频信息的途径。用户可以将文档、电子书或网页文章轻松转化为自己喜欢的音色进行聆听。

针对长文本处理需求,MiniMax Audio推出了强大的“Long-Text Mode(长文本)”,该模式支持高达20万字符的异步语音合成,使得创建音频书籍、播客等长音频内容变得前所未有的便捷,彻底解决了长文本合成时需要分段处理的问题。

为优化用户体验,MiniMax Audio增强了历史管理功能,使用户可以更方便地查看、删除和整理自己的语音合成历史和设置。同时,新增的“Discovery Hub”集中展示所有新功能和更新内容,帮助用户快速了解和掌握MiniMax Audio的最新动态。

体验入口:https://www.minimax.io/audio

© 版权声明:
本文地址:https://aidh.net/kuaixun/nvgvd399

暂无评论

none
暂无评论...