

今天,Cohere 发布了其最新的 AI 模型,名为 Aya,并在开源社区中分享了 Aya 模型系列的详细信息。这些模型包括 Aya Expanse 8B 和 35B,均可在 Hugging Face 平台上找到。这两款模型的发布,旨在推动 23 种语言的 AI 技术创新。
据 Cohere 介绍,8B 参数的模型旨在帮助开发者构建具有成本效益的、适合边缘设备的应用,而 32B 参数的模型则提供更高的性能,适用于更复杂的语言任务。
Aya 项目的使命是构建一个能够理解并生成多种语言的 AI 模型。为了实现这一目标,Cohere 的研究人员训练并发布了 Aya,这是一个包含 101 种语言的大型语言模型(LLM),覆盖了 101 种不同的语言。此外,Cohere 还开源了 Aya 的权重,允许研究人员在全球范围内贡献于该模型的发展。
Aya Expanse 模型建立在 Aya101 的研究成果之上,旨在扩展其语言理解和生成能力。Cohere 解释说,Aya Expanse 的独特之处在于其对低资源语言的关注,旨在提升全球范围内各种语言环境下的自然语言处理能力。这些模型适用于多种场景,例如翻译、内容生成、问答系统以及其他需要多语言支持的应用。
在性能方面,Cohere 表示,Aya Expanse 的这些模型在 Google、Mistral 和 Meta 等大型科技公司开发的 AI 模型中具有竞争力。
具体来说,Aya Expanse 32B 在语言理解任务中的表现优于 Gemma 7B、Mistral 8x22B 以及 Llama3 70B 等模型。同时,8B 模型也胜过 Gemma 2 9B、Llama3 8B 和 Ministral 8B,准确率分别提高了 60.4% 和 70.6%。
为了确保可访问性和易用性,Cohere 提供了一个全面的评估框架,以便开发者能够轻松地评估模型的性能。这些评估结果涵盖了各种不同的自然语言处理任务,旨在帮助用户更好地理解模型的能力,并将其应用于实际场景中。此外,Cohere 还致力于推广负责任的 AI 开发,强调在使用大型语言模型时考虑伦理和社会影响。
Cohere 的 Aya 项目致力于推动 LLM 在多语言环境下的应用,旨在促进全球范围内更广泛的语言支持。通过开源 LLM 及其相关研究,并在模型训练中优先考虑代表性不足的语言,Cohere 旨在促进 AI 技术的公平性和包容性。
参考链接:https://cohere.com/blog/aya-expanse-connecting-our-world
亮点:
🌎 Cohere 发布多语种 AI 模型,专注于支持 23 种语言的创新应用。
💡 Aya Expanse 模型性能卓越,在语言理解方面与行业领先者相媲美。
🔍 易于评估和部署 提供全面的模型评估工具,促进负责任的 AI 应用。
快讯中提到的AI工具

全球领先的企业AI平台

机器学习和人工智能技术的平台