SALMONN框架:赋予大型语言模型卓越的通用听觉能力

1年前发布AI俱乐部
6 0 0
SALMONN框架:赋予大型语言模型卓越的通用听觉能力的封面图

SALMONN框架通过整合多种音频编码器和激活调整阶段,获得了具有竞争力的通用听觉能力。其多模式架构为大型语言模型提供了直接解析和处理通用音频输入的能力,展示了在多种任务中的竞争性能。

© 版权声明:
本文地址:https://aidh.net/kuaixun/qgbjp0gm

暂无评论

none
暂无评论...