OpenBuddy团队发布Llama3.1-8B中文版开源大语言模型

Meta最近推出了新一代的大语言模型Llama3.1，它拥有一个庞大的405B参数集，在特定领域内的表现已经可以媲美GPT-4级别的模型。其中，Llama3.1-8B-Instruct是一个基于8B参数的模型，擅长文本生成、摘要、翻译、问答、代码编写、推理以及常识处理等多种任务，并且支持高达131072个tokens的上下文长度，发布时间为2023年12月。

关于Llama3.1-8B-Instruct的性能，Meta声称已经在超过2500个不同的基准测试中进行了评估，这些测试覆盖了总计405B个参数的数据集。结果显示，Llama3.1-8B-Instruct在推理、文本生成等多个方面均优于GPT3.5Turbo等同类模型。

OpenBuddy选择Llama3.1-8B-Instruct作为其模型的基础，并且融入了来自社区的丰富数据集，最终推出了OpenBuddy-Llama3.1-8B-v22.1-131K。这是一个在原始模型基础上经过进一步训练和优化的新版本。如果Llama3.1本身没有经过社区数据的训练，那么可能无法像现在这样流畅地进行多轮对话，也难以达到目前如此出色的指令遵循效果，更无法在特定情境下展现出令人满意的智能水平。

总的来说，为了构建一个更具对话能力和智能水平的模型，OpenBuddy-Llama3.1-8B-v22.1在原始模型的基础上进行了大量的优化和改进。这意味着它不仅拥有强大的基础能力，还具备了更出色的交互性能。

总而言之，OpenBuddy致力于为8B和70B参数的模型提供高质量的数据支持，从而提升这些模型在文本生成、智能对话等方面的能力，最终目标是超越405B参数模型的现有水平。

模型链接：https://modelscope.cn/models/OpenBuddy/openbuddy-llama3.1-8b-v22.1-131k