阿里通义千问Qwen2.5系列模型开源,72B版本Qwen2-VL性能直逼GPT-4

6个月前发布AI俱乐部
5 0 0
阿里通义千问Qwen2.5系列模型开源,72B版本Qwen2-VL性能直逼GPT-4的封面图

据了解,阿里云发布了Qwen2系列模型的最新版本,Qwen团队将其命名为——Qwen2.5,以强调其性能的显著提升。本次更新的重点在于扩展了更大规模的预训练数据集,并针对性地推出了专门用于代码和数学的Qwen2.5-Coder和Qwen2.5-Math模型。

Qwen2.5模型在扩大预训练数据规模方面取得了进展,使用了超过18万亿个tokens的数据进行训练,相较于Qwen2,大幅提升了模型在长文本理解、代码生成及数学问题解决等多个领域的性能。此外,该模型还支持高达8K tokens的上下文长度,从而能够处理更长的输入序列。

Qwen2.5模型遵循开源许可协议Apache2.0,允许免费商用,旨在促进更广泛的创新应用。值得一提的是,阿里云还开源了性能卓越的Qwen2-VL-72B模型,该模型在视觉语言理解能力上可与GPT-4相媲美。

此次发布的模型在推理速度、代码生成能力以及处理数学问题的准确性等方面均实现了显著提升,能够更好地满足开发者在实际应用中的需求。特别是在代码和数学领域,Qwen2.5-Coder和Qwen2.5-Math模型展现出更强的专业能力。

Qwen2.5模型体验地址:

  • Qwen2.5体验:https://modelscope.cn/studios/qwen/Qwen2.5

快讯中提到的AI工具

GPT-4
GPT-4

OpenAI 发布的最新一代语言模型

© 版权声明:
本文地址:https://aidh.net/kuaixun/usgo2ool

暂无评论

none
暂无评论...