MLCommons发布大型音频数据集，包含超过百万小时的多语种录音资源

人工智能9个月前发布 AI之家

人工智能工程联盟 MLCommons 于当地时间 1 月 30 日宣布推出 Unsupervised People’s Speech 数据集。该数据集包含超过 100 万小时的音频内容，**预示着人工智能在音频领域发展的新契机**。

MLCommons发布大型音频数据集，包含超过百万小时的多语种录音资源

Unsupervised People’s Speech 数据集资源来源于 Archive.org，由 MLCommons 与 HuggingFace 联合创建，且未经任何数据推断和预处理。

该数据集**总体规模超过 48TB**。尽管 Unsupervised People’s Speech 的内容以美式英语为主，但亦涵盖数十种语言；其中，多数音频时长介于 1 至 10 分钟之间，仅有 14 个音频超过 100 小时。

MLCommons发布大型音频数据集，包含超过百万小时的多语种录音资源

人工智能智能时代 # HuggingFace # MLCommons # 人工智能 # 数据集

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关AI热点

Anthropic 首席产品官迈克·克里格：未来三年内软件工程师将专注于审核AI生成的代码

Anthropic 首席产品官迈克·克里格：未来三年内软件工程师将专注于审核AI生成的代码

AI之家8个月前

人工智能提升亚马逊雨林野火监测成功率至93%

人工智能提升亚马逊雨林野火监测成功率至93%

AI之家8个月前

告别“生肉”的时代即将来临：亚马逊 Prime Video 引入 AI 辅助配音提升影视节目体验

告别“生肉”的时代即将来临：亚马逊 Prime Video 引入 AI 辅助配音提升影视节目体验

AI之家8个月前

上海交通大学2023年本科招生增加150名名额，扩大AI与集成电路等学科招生规模

上海交通大学2023年本科招生增加150名名额，扩大AI与集成电路等学科招生规模

AI之家8个月前

《iRacing》革新：自适应AI系统上线，电脑对手难度随玩家水平实时变化

《iRacing》革新：自适应AI系统上线，电脑对手难度随玩家水平实时变化

AI之家8个月前

上海交大发布AI使用规范：学生应明确人工智能辅助学习的价值定位

上海交大发布AI使用规范：学生应明确人工智能辅助学习的价值定位

AI之家8个月前

即梦 AI 推出“动作模仿”功能：通过照片和参考视频轻松让人物动起来

即梦 AI 推出“动作模仿”功能：通过照片和参考视频轻松让人物动起来

AI之家8个月前

谷歌Pixel手机助力纽约地铁检测轨道缺陷，效果媲美人工巡检

谷歌Pixel手机助力纽约地铁检测轨道缺陷，效果媲美人工巡检

AI之家8个月前

暂无评论

none

暂无评论...