谷歌云发布革命性高清语音模型Chirp 3,涵盖248种语言和方言的丰富声音库

1个月前发布AI俱乐部
3 0 0

Google Cloud于近日在伦敦DeepMind总部举办发布会,正式推出其高保真语音模型Chirp3。该模型现已通过Vertex AI统一机器学习平台向开发者开放,提供丰富的开发工具以促进应用创新。

谷歌云发布革命性高清语音模型Chirp 3,涵盖248种语言和方言的丰富声音库

Chirp3支持248种不同的音色,并可合成31种语言的语音。开发者可利用该模型创建各种应用,例如智能语音助手、有声读物和视频配音等。Google强调,Chirp3能够细致地捕捉人类语音的细微情绪变化,从而使对话更生动、更具感染力。

除了使用预设语音,用户还可通过Google Cloud的文本转语音API创建自定义语音。然而,为确保负责任地使用该技术并符合道德AI规范,Google对语音克隆功能的访问权限进行了限制,以防范潜在的滥用行为。

在发布会上,Google Cloud首席执行官Thomas Kurian强调了Google的总体愿景:提供一系列广泛的模型,包括Chirp3、Gemini、Imagen和Veil等。Google还推出了名为Agent Space的新产品,专门面向商业用户,以满足其特定需求。

Google DeepMind首席执行官Sir Demis Hassabis介绍了Gemini的演进,尤其侧重于其多模态理解能力。他指出,在AI Studio中,用户可以提供YouTube链接,Gemini能够处理视频内容,并利用其长时上下文窗口,帮助用户快速找到讲座或体育赛事中的关键时刻。

此外,Google还宣布了一项旨在提升英国AI技能的计划,该计划将通过综合培训项目,帮助专业人士有效掌握AI技术。Google将向英国初创企业提供云基础设施和AI工具的使用积分,以支持其快速开发和扩展创新解决方案,从而刺激创业活动。

在隐私和合规性方面,Google重申了其对数据驻留的承诺。其Vertex AI和Agent Space AI工具能够帮助组织在符合当地法律法规的前提下进行模型训练和服务部署。这对于医疗和金融等对数据隐私和合规性要求极高的行业尤为关键。

项目链接:https://cloud.google.com/text-to-speech/docs/chirp3-hd

要点概要:

  • Google Cloud推出Chirp3语音模型,支持248种音色和31种语言,助力开发者构建智能应用。
  • Google限制语音克隆功能的访问权限,以确保符合道德AI规范并防止滥用。
  • Google启动计划以提升英国AI技能,并向初创企业提供云基础设施支持,促进创新。

快讯中提到的AI工具

Imagen
Imagen

前所未有的文本生成图像技术

© 版权声明:
本文地址:https://aidh.net/kuaixun/ftp9um70

暂无评论

none
暂无评论...