Google 推出DolphinGemma:助力海豚语言研究迈向新里程碑

2周前发布AI俱乐部
1 0 0
Google 推出DolphinGemma:助力海豚语言研究迈向新里程碑的封面图

最近,Google 宣布推出一款名为 DolphinGemma 的大型语言模型,旨在帮助科学家更深入地理解海豚的交流方式。这项新技术由 Gemini2.5Pro Experimental 驱动,并与佐治亚理工学院及其野生海豚项目(WDP)紧密合作。WDP 通过长时间的非侵入观察记录和分析大西洋斑点海豚(Stenella frontalis)的自然行为和社会结构,特别是它们的交流模式。

多年来,WDP 积累了大量数据,可以将特定海豚声音与它们的行为进行关联。例如,母海豚和幼海豚团聚时发出的独特口哨声、争斗时的尖叫声,以及追逐鲨鱼时常用的“嗡嗡”声等。Google 表示,分析海豚复杂的交流方式是一项挑战,而 WDP 的数据为人工智能应用提供了绝佳机会。

DolphinGemma 是基于这些数据开发的。该模型采用 Google 的 SoundStream 分词器,将海豚的声音拆解成可管理的音频单元。整个系统的架构设计旨在理解复杂的声音序列,包含约4亿个参数,能够在 WDP 研究人员的 Pixel 手机上原生运行。

不同于传统的机器学习模型,DolphinGemma 专注于音频输入和输出,接收海豚的自然声音,通过类似大型语言模型理解人类语音的方法,预测下一个最可能的声音。这一过程类似于为海豚“自动完成”交流的功能。DolphinGemma 能够识别海豚声音的模式和结构,为科学家提供更多的研究可能性。

此外,在 DolphinGemma 推出之前,鲸鱼听觉增强遥测技术(CHAT)团队也在探索海豚双向交流的可能性。CHAT 的目标不是完全破解海豚语言,而是创建一个简单易用的互动词汇。通过将合成的声音与海豚偏好的特定物体(如马尾藻、海草等)关联,研究团队希望海豚能学会模仿这些声音,主动“索取”这些物品。

Google 表示,今年夏天将发布 DolphinGemma 作为开放模型,旨在为全球研究人员提供工具,帮助他们挖掘自己的声学数据集,从而更好地理解这些智慧的海洋哺乳动物。

© 版权声明:
本文地址:https://aidh.net/kuaixun/0u8ataf9

暂无评论

none
暂无评论...