

Groq 现在提供对 Whisper Large-V3 模型的支持,您可以通过 Playground 界面或 API 进行使用,从而实现快速的语音转录。该模型以其高质量的转录效果和相对较低的延迟而闻名。
Playground 地址:https://console.groq.com/playground
目前,您可以通过 Playground 体验该语音转录功能,它允许您在网页界面上直接进行语音转录,每次体验的时间限制为4到30秒。此外,Groq 也已经开放了 API 接口,方便开发者将此功能集成到自己的应用程序中。
与 OpenAI 提供的 Whisper API 相比,Groq 版本的 API 具有更快的处理速度,可以更快地完成语音转录任务。您可以通过指定相应的 API 接口进行调用,并根据您的需求进行配置,以获得最佳的转录效果。
请注意,使用 Whisper API 时,请确保指定 "whisper-large-v3" 模型,以便使用 Groq 提供的加速版本。
在 API 使用方面,音频文件的大小和格式有一些限制,例如支持 mp3、mp4、wav 等常见的音频格式,且文件大小不能超过 25MB。如果需要处理较大的音频文件,可以将音频分割成多个较小的片段,然后分别进行转录。此外,Groq 建议对音频进行预处理,以提高转录的准确性。
为了获得更好的转录效果和兼容性,建议将音频的采样率设置为 16,000Hz。Groq 能够快速处理各种音频转录请求,确保您在最短的时间内获得准确的转录结果。即使音频质量不佳,该模型也能提供相对不错的转录效果。
API 终结点:
语音转录:https://api.groq.com/openai/v1/audio/transcriptions
语音翻译:https://api.groq.com/openai/v1/audio/translations
快讯中提到的AI工具

致力于创造对全人类有益的安全 AGI