智源发布全球最大的中英文语义向量模型训练数据集 MTP

2年前发布AI俱乐部

标签：MTP 中英文语义向量模型智源研究院

摘要：

智源研究院推出了全球最大规模的中英文翻译数据集 MTP，其数据量达到三亿对。该数据集汇集了来自多种来源的中英文 […]

智源发布全球最大的中英文语义向量模型训练数据集 MTP的封面图

智源研究院推出了全球最大规模的中英文翻译数据集 MTP，其数据量达到三亿对。该数据集汇集了来自多种来源的中英文文本对，为中英文翻译模型的训练提供了重要的基础。智源研究院表示，这些数据对大模型训练具有关键作用，并将推动人工智能的协作创新。此数据集的发布有望解决中文模型训练数据集不足的问题。

© 版权声明：

文章版权归作者所有，未经允许请勿转载。

本文地址：https://aidh.net/kuaixun/ulsk5tsi

暂无评论

none

暂无评论...

智源研究院发布全球首个中文大模型辩论平台FlagEval Debate

5浏览 0点赞 1年前

智源研究院发布全球首个中文大模型辩论平台FlagEval Debate

智源研究院推出 Emu2：新一代多模态生成式基础模型重磅发布

12浏览 0点赞 2年前

智源研究院推出 Emu2：新一代多模态生成式基础模型重磅发布

智源研究院携手腾讯，深化大模型与AI技术应用落地

7浏览 0点赞 11个月前

智源研究院携手腾讯，深化大模型与AI技术应用落地

智源发布Emu3原生多模态世界模型：基于下一Token预测，融会贯通文本、图像与视频理解生成

7浏览 0点赞 1年前

智源发布Emu3原生多模态世界模型：基于下一Token预测，融会贯通文本、图像与视频理解生成

智源研究院开源JudgeLM：评测各类大模型并输出评分的裁判模型

9浏览 0点赞 2年前

智源研究院开源JudgeLM：评测各类大模型并输出评分的裁判模型

智源研究院发布开源中英双语大模型：340亿参数的悟道·天鹰Aquila2-34B

18浏览 0点赞 2年前

智源研究院发布开源中英双语大模型：340亿参数的悟道·天鹰Aquila2-34B

智源研究院发布10亿参数通用三维视觉模型Uni3D，现已开源

7浏览 0点赞 2年前

智源研究院发布10亿参数通用三维视觉模型Uni3D，现已开源

智源发布三款全新BGE模型，向量检索性能再创新高

6浏览 0点赞 1年前

智源发布三款全新BGE模型，向量检索性能再创新高