

OpenAI 宣布为 ChatGPT Plus 用户推出更新的语音模型——ChatGPT-4o,它被誉为“里程碑式的进展”。OpenAI 在其 X(原 Twitter)平台上发布的帖子中指出,该模型在语音和文本处理方面实现了显著提升,使得用户能够更自然地进行实时对话,并享受增强的可用性。
据介绍,ChatGPT-4o 能够识别并模拟多种不同的情绪。一位用户甚至展示了如何利用该模型实时模仿 Eminem 的声音。另一位名为 Kyle 的用户评论道:“老实说,我一直在等待一个语音 LLM 能够像这样表达情感。而 ChatGPT-4o 已经将语音克隆技术的标准提升到了一个全新的水平。”
相关阅读:探索 AI 的无限可能:Midjourney 的创新应用
值得一提的是,ChatGPT 在理解视觉提示方面的能力也得到了显著增强。例如,它可以实时分析用户上传的图像,并提供有价值的反馈。
关于语音响应的速度,ChatGPT-4o 能够以更快的速度生成回应。用户不再需要等待较长时间才能听到 AI 的回复,从而实现了更流畅的交流体验。这一改进使其能够应用于实时翻译等需要快速响应的场景,进一步提升了用户体验。
目前,该模型已经向 ChatGPT Plus 订阅用户开放,并将逐步向所有用户推广。这意味着很快,每个人都将有机会体验到 ChatGPT-4o 带来的强大功能。
快讯中提到的AI工具

GPT-4o
OpenAI 最新的旗舰模型

GPT-4
OpenAI 发布的最新一代语言模型

OpenAI
致力于创造对全人类有益的安全 AGI

Midjourney
开启 AI 绘画的奇幻之旅

ChatGPT
OpenAI开发的一款先进AI聊天机器人
© 版权声明:
文章版权归作者所有,未经允许请勿转载。
本文地址:https://aidh.net/kuaixun/kvi87b47暂无评论...