DeepSeek V2-Chat-0628模型开源：代码与数学推理能力显著提升

摘要：

近日，LMSYS 推出的知名大型模型竞技场（Chatbot Arena）公布了最新的排名结果。LMSYS Ch […]

DeepSeek V2-Chat-0628模型开源：代码与数学推理能力显著提升的封面图

近日，LMSYS 推出的知名大型模型竞技场（Chatbot Arena）公布了最新的排名结果。LMSYS Chatbot Arena 持续对众多大型模型进行评估，本次排名基于超过 11 万次用户投票，其中 Llama3-70B、Qwen2-72B、Nemotron-4-340B、Gemma2-27B 等模型也在评估之列，旨在确定各个模型的性能优劣。

DeepSeek-V2-0628 模型在本次评测中表现出色，超越了 0507 版本的 Chat 模型，尤其在代码生成、推理能力、长文本处理和 JSON 输出等方面展现了强大的实力。

Chatbot Arena 作为一个由用户参与评估的大型模型排行榜，通过收集用户的投票数据，对模型的性能进行排名。根据本次评测结果，DeepSeek-V2-0628 在复杂提示（Hard Prompt）、代码（Code）、长查询（Longer Query）以及数学（Math）等多个方面均表现出色，性能已接近甚至超过了 GPT-4-Turbo-0409 和 Claude3Opus 等顶级模型。

DeepSeek-V2-0628 不仅在特定任务上表现优异，而且在整体能力上也取得了显著的提升。相较于其他开源模型，DeepSeek-V2-0628 在多项指标上均名列前茅，展现了其卓越的综合实力。目前，DeepSeek-V2-0628 已于 2024 年 6 月 28 日发布，并提供 API 和推理服务，方便用户使用。

模型链接：https://top.aibase.com/tool/deepseek-v2-chat-0628

总结：

⭐ 整体评价：DeepSeek-V2-0628 在大型模型中表现突出，在 AI 社区中获得了高度认可。

🔍 优势能力：在复杂提示和代码生成方面，DeepSeek-V2-0628 展现了卓越的性能。

💻 应用体验：DeepSeek-V2-0628 的 API 和推理服务已正式上线，为用户提供了便捷的使用体验。