Cohere发布Aya Expanse开源AI模型，性能超越同规模的谷歌和Meta模型

摘要：

今天，Cohere 发布了其最新的 AI 模型，名为 Aya，并在开源社区中分享了 Aya 模型系列的详细信息 […]

Cohere发布Aya Expanse开源AI模型，性能超越同规模的谷歌和Meta模型的封面图

今天，Cohere 发布了其最新的 AI 模型，名为 Aya，并在开源社区中分享了 Aya 模型系列的详细信息。这些模型包括 Aya Expanse 8B 和 35B，均可在 Hugging Face 平台上找到。这两款模型的发布，旨在推动 23 种语言的 AI 技术创新。

据 Cohere 介绍，8B 参数的模型旨在帮助开发者构建具有成本效益的、适合边缘设备的应用，而 32B 参数的模型则提供更高的性能，适用于更复杂的语言任务。

Aya 项目的使命是构建一个能够理解并生成多种语言的 AI 模型。为了实现这一目标，Cohere 的研究人员训练并发布了 Aya，这是一个包含 101 种语言的大型语言模型（LLM），覆盖了 101 种不同的语言。此外，Cohere 还开源了 Aya 的权重，允许研究人员在全球范围内贡献于该模型的发展。

Aya Expanse 模型建立在 Aya101 的研究成果之上，旨在扩展其语言理解和生成能力。Cohere 解释说，Aya Expanse 的独特之处在于其对低资源语言的关注，旨在提升全球范围内各种语言环境下的自然语言处理能力。这些模型适用于多种场景，例如翻译、内容生成、问答系统以及其他需要多语言支持的应用。

在性能方面，Cohere 表示，Aya Expanse 的这些模型在 Google、Mistral 和 Meta 等大型科技公司开发的 AI 模型中具有竞争力。

具体来说，Aya Expanse 32B 在语言理解任务中的表现优于 Gemma 7B、Mistral 8x22B 以及 Llama3 70B 等模型。同时，8B 模型也胜过 Gemma 2 9B、Llama3 8B 和 Ministral 8B，准确率分别提高了 60.4% 和 70.6%。

为了确保可访问性和易用性，Cohere 提供了一个全面的评估框架，以便开发者能够轻松地评估模型的性能。这些评估结果涵盖了各种不同的自然语言处理任务，旨在帮助用户更好地理解模型的能力，并将其应用于实际场景中。此外，Cohere 还致力于推广负责任的 AI 开发，强调在使用大型语言模型时考虑伦理和社会影响。

Cohere 的 Aya 项目致力于推动 LLM 在多语言环境下的应用，旨在促进全球范围内更广泛的语言支持。通过开源 LLM 及其相关研究，并在模型训练中优先考虑代表性不足的语言，Cohere 旨在促进 AI 技术的公平性和包容性。

参考链接：https://cohere.com/blog/aya-expanse-connecting-our-world