智源发布全球最大的中英文语义向量模型训练数据集 MTP

2年前发布AI俱乐部
6 0 0
智源发布全球最大的中英文语义向量模型训练数据集 MTP的封面图

智源研究院推出了全球最大规模的中英文翻译数据集 MTP,其数据量达到三亿对。该数据集汇集了来自多种来源的中英文文本对,为中英文翻译模型的训练提供了重要的基础。智源研究院表示,这些数据对大模型训练具有关键作用,并将推动人工智能的协作创新。此数据集的发布有望解决中文模型训练数据集不足的问题。

© 版权声明:
本文地址:https://aidh.net/kuaixun/ulsk5tsi

暂无评论

none
暂无评论...