

Meta最近推出了新一代的大语言模型Llama3.1,它拥有一个庞大的405B参数集,在特定领域内的表现已经可以媲美GPT-4级别的模型。其中,Llama3.1-8B-Instruct是一个基于8B参数的模型,擅长文本生成、摘要、翻译、问答、代码编写、推理以及常识处理等多种任务,并且支持高达131072个tokens的上下文长度,发布时间为2023年12月。
关于Llama3.1-8B-Instruct的性能,Meta声称已经在超过2500个不同的基准测试中进行了评估,这些测试覆盖了总计405B个参数的数据集。结果显示,Llama3.1-8B-Instruct在推理、文本生成等多个方面均优于GPT3.5Turbo等同类模型。
OpenBuddy选择Llama3.1-8B-Instruct作为其模型的基础,并且融入了来自社区的丰富数据集,最终推出了OpenBuddy-Llama3.1-8B-v22.1-131K。这是一个在原始模型基础上经过进一步训练和优化的新版本。如果Llama3.1本身没有经过社区数据的训练,那么可能无法像现在这样流畅地进行多轮对话,也难以达到目前如此出色的指令遵循效果,更无法在特定情境下展现出令人满意的智能水平。
总的来说,为了构建一个更具对话能力和智能水平的模型,OpenBuddy-Llama3.1-8B-v22.1在原始模型的基础上进行了大量的优化和改进。这意味着它不仅拥有强大的基础能力,还具备了更出色的交互性能。
总而言之,OpenBuddy致力于为8B和70B参数的模型提供高质量的数据支持,从而提升这些模型在文本生成、智能对话等方面的能力,最终目标是超越405B参数模型的现有水平。
模型链接:https://modelscope.cn/models/OpenBuddy/openbuddy-llama3.1-8b-v22.1-131k
快讯中提到的AI工具

OpenAI 发布的最新一代语言模型