

近日,LMSYS 推出的知名大型模型竞技场(Chatbot Arena)公布了最新的排名结果。LMSYS Chatbot Arena 持续对众多大型模型进行评估,本次排名基于超过 11 万次用户投票,其中 Llama3-70B、Qwen2-72B、Nemotron-4-340B、Gemma2-27B 等模型也在评估之列,旨在确定各个模型的性能优劣。
DeepSeek-V2-0628 模型在本次评测中表现出色,超越了 0507 版本的 Chat 模型,尤其在代码生成、推理能力、长文本处理和 JSON 输出等方面展现了强大的实力。
Chatbot Arena 作为一个由用户参与评估的大型模型排行榜,通过收集用户的投票数据,对模型的性能进行排名。根据本次评测结果,DeepSeek-V2-0628 在复杂提示(Hard Prompt)、代码(Code)、长查询(Longer Query)以及数学(Math)等多个方面均表现出色,性能已接近甚至超过了 GPT-4-Turbo-0409 和 Claude3Opus 等顶级模型。
DeepSeek-V2-0628 不仅在特定任务上表现优异,而且在整体能力上也取得了显著的提升。相较于其他开源模型,DeepSeek-V2-0628 在多项指标上均名列前茅,展现了其卓越的综合实力。目前,DeepSeek-V2-0628 已于 2024 年 6 月 28 日发布,并提供 API 和推理服务,方便用户使用。
模型链接:https://top.aibase.com/tool/deepseek-v2-chat-0628
总结:
⭐ 整体评价:DeepSeek-V2-0628 在大型模型中表现突出,在 AI 社区中获得了高度认可。
🔍 优势能力:在复杂提示和代码生成方面,DeepSeek-V2-0628 展现了卓越的性能。
💻 应用体验:DeepSeek-V2-0628 的 API 和推理服务已正式上线,为用户提供了便捷的使用体验。