Meta发布Llama 3 70B：性能卓越，超越GPT-4和Gemini 1.5 Pro的新一代AI模型

12个月前发布AI俱乐部

摘要：

Meta 近期发布了 Llama 语言模型的最新成果——Llama 3.370B。Meta 的 AI 研究员 […]

Meta发布Llama 3 70B：性能卓越，超越GPT-4和Gemini 1.5 Pro的新一代AI模型的封面图

Meta 近期发布了 Llama 语言模型的最新成果——Llama 3.370B。Meta 的 AI 研究员 Ahmad Al-Dahle 在 X 平台上透露，Llama 3.370B 在性能上已经超越了 Meta 早期版本的 Llama 系列模型 Llama 3.1405B，并且在某些方面表现出了更强的竞争力。

Al-Dahle 指出，尽管 Llama 3.370B 并非一个大型模型，但它在特定任务上的表现却非常出色，甚至超越了一些大型模型。根据 Meta 发布的基准测试结果显示，Llama 3.370B 在某些指标上已经可以与 Gemini 1.5 Pro、OpenAI 的 GPT-4 以及一些新兴模型 Nova Pro 相媲美，尤其是在语言理解能力测试 MMLU 上表现突出。

这些模型目前都可以在 Hugging Face 和 Llama 官方网站上找到，Meta 将其定义为“社区”语言模型。Meta 认为 Llama 模型能够推动创新，并且为开发者提供更强大的工具，方便他们创建 AI 应用。Meta 的 Llama 模型具有广泛的应用前景，不仅可以用于代码生成、语言翻译，还可以用于问答系统和文本摘要，从而极大地提升了研发效率。据悉，Llama 模型的训练数据集超过 6.5 万亿个 token，使用了大量公开的 AI 数据集进行训练。

作为一个开源的 AI 模型，Meta 希望通过持续优化来提高其整体性能。近期发布的一项研究显示，只需对超过 100 亿参数的 AI 模型进行微调，Meta 就能显著提升开源 AI 模型的性能。未来的研发重点将是 Llama 4 模型，其性能目标是达到 Llama 3 的 10 倍。Meta 目前正在投入超过 100 亿美金采购 Nvidia GPU 硬件，以对抗 xAI 等新兴公司的竞争压力。

尽管 AI 模型的开发成本高昂，但 Meta 坚信开源模型对于推动 AI 技术的进步至关重要。Meta 的目标是到 2024 年底，将开源模型的性能提升 33%，并将其参数扩展到 85 万亿。这一举措旨在巩固 Meta 在人工智能领域的领导地位，并通过开源和社区协作来加速 AI 技术的创新。