Meta 推出 Llama 4 大模型:混合专家架构引领人工智能新时代

3周前发布AI俱乐部
1 0 0
Meta 推出 Llama 4 大模型:混合专家架构引领人工智能新时代的封面图

Meta 公司推出了最新的开源人工智能模型 Llama4,这标志着该公司在人工智能领域取得了重大进展。Llama4被分为 Scout 和 Maverick 两个版本,旨在提升 AI 模型的功能和性能。Meta 表示,Llama4是一个多模态大模型,可以处理文本、图像、视频和音频等多种数据类型,并能够在这些格式之间自由转换。

值得注意的是,Llama4系列首次采用了“混合专家”(MoE)架构,这一创新设计显著提高了模型的训练和响应效率。通过将模型划分为多个专注于特定任务的“专家”子模型,Llama4在处理复杂查询时能够更快速和准确地展现其能力。

根据 Meta 的介绍,Scout 和 Maverick 是目前公司最先进的模型。Scout 拥有170亿个活跃参数,配备16个“专家”模型,总参数量高达1090亿;而 Maverick 同样包含170亿个活跃参数,但“专家”模型数量增至128个,总参数量达到了惊人的4000亿。此外,Meta 还在研发一款名为 Behemoth 的更强大模型,该模型被称为“新模型中的教师”,预示着更多创新的可能性。

这些模型经过大量未标注的数据训练,展现出优异的视觉理解能力。目前,Scout 和 Maverick 可以在 Llama.com 及Meta 的合作伙伴平台上公开获取,并已在 WhatsApp、Messenger 和 Instagram Direct 等社交平台上推广使用。

Meta 的首席执行官扎克伯格在发布会上表示:“我们的目标是建立世界领先的人工智能,并将其开源,让更多的人受益。” 他强调,Llama4的推出标志着开源人工智能的兴起,将改变行业格局。

Meta 计划在未来一年内投资高达650亿美元来扩展其人工智能基础设施,尽管投资者对大型科技公司的实际回报仍持保守态度。这一系列举措将使 Meta 在人工智能领域更具竞争力,并推动整个行业的技术革新。

© 版权声明:
本文地址:https://aidh.net/kuaixun/hel6ng1u

暂无评论

none
暂无评论...