

埃隆·马斯克创立的人工智能公司 xAI,计划推出其新一代大型语言模型 Grok3。预计 Grok3 将成为“最强大的世界模型”,其能力将超越当前的大型语言模型。Grok3 的改进之处在于它能够处理更长、更复杂的上下文信息。Grok3 的升级使其在理解和生成文本方面表现更出色。
Grok3 的关键技术之一是“思维链”(Chain Of Thought)推理方法。通过这种方式,Grok3 在生成答案时能够进行多步骤的逻辑推理,从而产生更准确、更连贯的文本。此外,Grok3 还能支持多种模态,包括文本、代码以及未来可能加入的视频等多种信息类型。
在 2023 年 11 月,Grok1 首次亮相,展示了 Grok 模型的初步能力。Grok1 已经展现出在自然语言处理方面的潜力,但其推理能力和知识掌握程度仍有提升空间。Grok2 在 Grok1 的基础上进行了显著改进,提高了推理和上下文处理能力,从而在性能上实现了飞跃。目前,xAI 正在积极开发下一代模型,旨在与 OpenAI 等领先的 AI 公司竞争。
针对 Grok3 的具体性能指标,有报告指出 OpenAI 的 GPT-4o 模型的推理能力已经被 o3pro 超越,成为当前最顶尖的 AI 模型。因此,xAI 的 Grok3 是否能够超越埃隆·马斯克的竞争对手,备受关注。为了实现这一目标,埃隆·马斯克计划在 2024 年中使用超过 10 万块 H100 GPU 来训练 Grok3。
此外,xAI 也在积极寻求获取更多英伟达的 GB200 GPU 资源,以进一步提升其 AI 训练能力。据估计,xAI 最终可能需要超过 10 万块 GPU 才能满足其训练需求。相比之下,OpenAI 目前使用了大约 1500 块 GPU 进行模型训练,xAI 在硬件方面的投入可见一斑。
值得注意的是,埃隆·马斯克曾公开批评 OpenAI 在算力资源分配方面的不透明性,他认为其拥有的 974 亿tokens 的训练数据集远超 OpenAI 的公开数据。埃隆·马斯克认为 OpenAI 应该对其训练数据和算法进行更彻底的公开,从而提升行业的整体透明度。当前,关于埃隆·马斯克与 OpenAI 之间的竞争格局,以及 AI 领域未来的发展方向,仍有待进一步观察。