MLCommons发布大型音频数据集,包含超过百万小时的多语种录音资源

人工智能1个月前发布 AI之家
3 0 0

人工智能工程联盟 MLCommons 于当地时间 1 月 30 日宣布推出 Unsupervised People's Speech 数据集。该数据集包含超过 100 万小时的音频内容,**预示着人工智能在音频领域发展的新契机**。

MLCommons发布大型音频数据集,包含超过百万小时的多语种录音资源

Unsupervised People's Speech 数据集资源来源于 Archive.org,由 MLCommons 与 HuggingFace 联合创建,且未经任何数据推断和预处理。

该数据集**总体规模超过 48TB**。尽管 Unsupervised People's Speech 的内容以美式英语为主,但亦涵盖数十种语言;其中,多数音频时长介于 1 至 10 分钟之间,仅有 14 个音频超过 100 小时。

MLCommons发布大型音频数据集,包含超过百万小时的多语种录音资源
© 版权声明

相关AI热点

暂无评论

none
暂无评论...