阿里通义千问Qwen2.5系列模型开源，72B版本Qwen2-VL性能直逼GPT-4

摘要：

据了解，阿里云发布了Qwen2系列模型的最新版本，Qwen团队将其命名为——Qwen2.5，以强调其性能的显著 […]

据了解，阿里云发布了Qwen2系列模型的最新版本，Qwen团队将其命名为——Qwen2.5，以强调其性能的显著提升。本次更新的重点在于扩展了更大规模的预训练数据集，并针对性地推出了专门用于代码和数学的Qwen2.5-Coder和Qwen2.5-Math模型。

Qwen2.5模型在扩大预训练数据规模方面取得了进展，使用了超过18万亿个tokens的数据进行训练，相较于Qwen2，大幅提升了模型在长文本理解、代码生成及数学问题解决等多个领域的性能。此外，该模型还支持高达8K tokens的上下文长度，从而能够处理更长的输入序列。

Qwen2.5模型遵循开源许可协议Apache2.0，允许免费商用，旨在促进更广泛的创新应用。值得一提的是，阿里云还开源了性能卓越的Qwen2-VL-72B模型，该模型在视觉语言理解能力上可与GPT-4相媲美。

此次发布的模型在推理速度、代码生成能力以及处理数学问题的准确性等方面均实现了显著提升，能够更好地满足开发者在实际应用中的需求。特别是在代码和数学领域，Qwen2.5-Coder和Qwen2.5-Math模型展现出更强的专业能力。

Qwen2.5模型体验地址：

快讯中提到的AI工具

GPT-4

OpenAI 发布的最新一代语言模型

文章版权归作者所有，未经允许请勿转载。

本文地址：https://aidh.net/kuaixun/usgo2ool