Meta发布Llama 3 70B:性能卓越,超越GPT-4和Gemini 1.5 Pro的新一代AI模型

5个月前发布AI俱乐部
5 0 0
Meta发布Llama 3 70B:性能卓越,超越GPT-4和Gemini 1.5 Pro的新一代AI模型的封面图

Meta 近期发布了 Llama 语言模型的最新成果——Llama 3.370B。Meta 的 AI 研究员 Ahmad Al-Dahle 在 X 平台上透露,Llama 3.370B 在性能上已经超越了 Meta 早期版本的 Llama 系列模型 Llama 3.1405B,并且在某些方面表现出了更强的竞争力。

Al-Dahle 指出,尽管 Llama 3.370B 并非一个大型模型,但它在特定任务上的表现却非常出色,甚至超越了一些大型模型。根据 Meta 发布的基准测试结果显示,Llama 3.370B 在某些指标上已经可以与 Gemini 1.5 Pro、OpenAIGPT-4 以及一些新兴模型 Nova Pro 相媲美,尤其是在语言理解能力测试 MMLU 上表现突出。

这些模型目前都可以在 Hugging Face 和 Llama 官方网站上找到,Meta 将其定义为“社区”语言模型。Meta 认为 Llama 模型能够推动创新,并且为开发者提供更强大的工具,方便他们创建 AI 应用。Meta 的 Llama 模型具有广泛的应用前景,不仅可以用于代码生成、语言翻译,还可以用于问答系统和文本摘要,从而极大地提升了研发效率。据悉,Llama 模型的训练数据集超过 6.5 万亿个 token,使用了大量公开的 AI 数据集进行训练。

作为一个开源的 AI 模型,Meta 希望通过持续优化来提高其整体性能。近期发布的一项研究显示,只需对超过 100 亿参数的 AI 模型进行微调,Meta 就能显著提升开源 AI 模型的性能。未来的研发重点将是 Llama 4 模型,其性能目标是达到 Llama 3 的 10 倍。Meta 目前正在投入超过 100 亿美金采购 Nvidia GPU 硬件,以对抗 xAI 等新兴公司的竞争压力。

尽管 AI 模型的开发成本高昂,但 Meta 坚信开源模型对于推动 AI 技术的进步至关重要。Meta 的目标是到 2024 年底,将开源模型的性能提升 33%,并将其参数扩展到 85 万亿。这一举措旨在巩固 Meta 在人工智能领域的领导地位,并通过开源和社区协作来加速 AI 技术的创新。

快讯中提到的AI工具

xAI
xAI

探索科学与宇宙奥秘的AI公司

Hugging Face
Hugging Face

机器学习和人工智能技术的平台

GPT-4
GPT-4

OpenAI 发布的最新一代语言模型

OpenAI
OpenAI

致力于创造对全人类有益的安全 AGI

© 版权声明:
本文地址:https://aidh.net/kuaixun/fqtril0f

暂无评论

none
暂无评论...