Groq推出whisper-large-v3模型，免费开放，提供语音转录与翻译服务

1年前发布AI俱乐部

标签：AI头条

摘要：

Groq 现在提供对 Whisper Large-V3 模型的支持，您可以通过 Playground 界面或 […]

Groq 现在提供对 Whisper Large-V3 模型的支持，您可以通过 Playground 界面或 API 进行使用，从而实现快速的语音转录。该模型以其高质量的转录效果和相对较低的延迟而闻名。

Playground 地址：https://console.groq.com/playground

目前，您可以通过 Playground 体验该语音转录功能，它允许您在网页界面上直接进行语音转录，每次体验的时间限制为4到30秒。此外，Groq 也已经开放了 API 接口，方便开发者将此功能集成到自己的应用程序中。

与 OpenAI 提供的 Whisper API 相比，Groq 版本的 API 具有更快的处理速度，可以更快地完成语音转录任务。您可以通过指定相应的 API 接口进行调用，并根据您的需求进行配置，以获得最佳的转录效果。

请注意，使用 Whisper API 时，请确保指定 “whisper-large-v3” 模型，以便使用 Groq 提供的加速版本。

在 API 使用方面，音频文件的大小和格式有一些限制，例如支持 mp3、mp4、wav 等常见的音频格式，且文件大小不能超过 25MB。如果需要处理较大的音频文件，可以将音频分割成多个较小的片段，然后分别进行转录。此外，Groq 建议对音频进行预处理，以提高转录的准确性。

为了获得更好的转录效果和兼容性，建议将音频的采样率设置为 16,000Hz。Groq 能够快速处理各种音频转录请求，确保您在最短的时间内获得准确的转录结果。即使音频质量不佳，该模型也能提供相对不错的转录效果。

API 终结点：

语音转录：https://api.groq.com/openai/v1/audio/transcriptions

语音翻译：https://api.groq.com/openai/v1/audio/translations

快讯中提到的AI工具

OpenAI

致力于创造对全人类有益的安全 AGI

文章版权归作者所有，未经允许请勿转载。

本文地址：https://aidh.net/kuaixun/dlra2v4p