语音合成

共 3 篇文章

Baichuan-Audio

百川智能推出的Baichuan-Audio是一款先进的端到端音频大语言模型,具备无缝音频理解与生成的能力,能够实现高质量、可控的实时中英文对话。该模型采用多码本离散化技术,成功将音频信号转化为离散标记,保留语义和声学信息,并通过音频处理模块增强音频特征的识别能力。Baichuan-Audio基于双阶...
AI工具箱8个月前
Baichuan-Audio

IndexTTS

IndexTTS 是 B 站推出的文本转语音模型,它结合了 XTTS 和 Tortoise 模型的先进技术,采用了 GPT 风格的生成技术。这个系统在将文本转换为自然流畅的语音方面表现出色,尤其擅长处理中文文本。IndexTTS 不仅支持拼音纠正汉字发音,还可以利用标点符号来精准控制停顿,有效解决多...
AI工具箱8个月前
IndexTTS

PySpur

PySpur是一款开源的,旨在简化人工智能系统开发流程的可视化AI智能体工作流构建工具。用户可以通过直观的拖拽式界面快速构建、测试和迭代AI工作流,无需编写复杂代码。PySpur具备循环与记忆功能、文件上传、结构化输出、RAG技术和多模态数据处理(包括文本、图像、视频等),并能与多种工具(如Slac...
AI工具箱9个月前
PySpur