xAI Grok-2 跃居聊天机器人排行榜第二，直逼GPT-4o

摘要：

今日新闻，xAI 公&#x […]

今日新闻，xAI 公司的 Grok-2 与 Grok-Mini 两个模型在评估平台 LMSys 社区Arena上进行测试，其中Grok-2的维护质量超过了 OpenAI 的 GPT-4o（5月份），以及较早的 Gemini 模型，但仍位列6000多的大语言模型之列。

可以看出，Grok-2在语言处理相关任务表现上有所提升，但与顶尖模型之间仍然存在一定的差距，体现在效率、创造以及问题解决能力。另外，Grok-2-Mini 更倾向于轻量化的规格进行评估，以便更好地服务移动应用。

Grok-2-Mini 可能会适用于有限的硬件资源，尤其是移动硬件资源有限的应用。另外一个值得关注的是 xAI 的开源公司，它们正在探索开源方案，并计划以 SGLang 形式提供更多关于开源代码以及部署方案的资讯。当前，公司正努力充实其他技术与辅助服务构架，并倾向于提供更完整的应用服务方案。

就目前来看，Grok-2的表现与想象仍有差距，虽然比 OpenAI 的 GPT-4o 更加出色，但在深入地了解功能方面，以及模型运行维护方面，Grok-2在创造与语言处理任务仍然显示出明显差距。Grok-2目前来说模型尚未进行公开发布，据悉目前将会先上线 X 平台供其用户使用，之后，该模型或许会提供到 FLUX.1运算平台，为模型提供运算支持。