智源研究院推出了全球最大规模的中英文翻译数据集 MTP,其数据量达到三亿对。该数据集汇集了来自多种来源的中英文文本对,为中英文翻译模型的训练提供了重要的基础。智源研究院表示,这些数据对大模型训练具有关键作用,并将推动人工智能的协作创新。此数据集的发布有望解决中文模型训练数据集不足的问题。