Cohere发布Aya Expanse开源AI模型,性能超越同规模的谷歌和Meta模型

5个月前发布AI俱乐部
3 0 0
Cohere发布Aya Expanse开源AI模型,性能超越同规模的谷歌和Meta模型的封面图

今天,Cohere 发布了其最新的 AI 模型,名为 Aya,并在开源社区中分享了 Aya 模型系列的详细信息。这些模型包括 Aya Expanse 8B 和 35B,均可在 Hugging Face 平台上找到。这两款模型的发布,旨在推动 23 种语言的 AI 技术创新。

Cohere 介绍,8B 参数的模型旨在帮助开发者构建具有成本效益的、适合边缘设备的应用,而 32B 参数的模型则提供更高的性能,适用于更复杂的语言任务。

Aya 项目的使命是构建一个能够理解并生成多种语言的 AI 模型。为了实现这一目标,Cohere 的研究人员训练并发布了 Aya,这是一个包含 101 种语言的大型语言模型(LLM),覆盖了 101 种不同的语言。此外,Cohere 还开源了 Aya 的权重,允许研究人员在全球范围内贡献于该模型的发展。

Aya Expanse 模型建立在 Aya101 的研究成果之上,旨在扩展其语言理解和生成能力。Cohere 解释说,Aya Expanse 的独特之处在于其对低资源语言的关注,旨在提升全球范围内各种语言环境下的自然语言处理能力。这些模型适用于多种场景,例如翻译、内容生成、问答系统以及其他需要多语言支持的应用。

在性能方面,Cohere 表示,Aya Expanse 的这些模型在 Google、Mistral 和 Meta 等大型科技公司开发的 AI 模型中具有竞争力。

具体来说,Aya Expanse 32B 在语言理解任务中的表现优于 Gemma 7B、Mistral 8x22B 以及 Llama3 70B 等模型。同时,8B 模型也胜过 Gemma 2 9B、Llama3 8B 和 Ministral 8B,准确率分别提高了 60.4% 和 70.6%。

为了确保可访问性和易用性,Cohere 提供了一个全面的评估框架,以便开发者能够轻松地评估模型的性能。这些评估结果涵盖了各种不同的自然语言处理任务,旨在帮助用户更好地理解模型的能力,并将其应用于实际场景中。此外,Cohere 还致力于推广负责任的 AI 开发,强调在使用大型语言模型时考虑伦理和社会影响。

Cohere 的 Aya 项目致力于推动 LLM 在多语言环境下的应用,旨在促进全球范围内更广泛的语言支持。通过开源 LLM 及其相关研究,并在模型训练中优先考虑代表性不足的语言,Cohere 旨在促进 AI 技术的公平性和包容性。

参考链接:https://cohere.com/blog/aya-expanse-connecting-our-world

亮点:

🌎 Cohere 发布多语种 AI 模型,专注于支持 23 种语言的创新应用。

💡 Aya Expanse 模型性能卓越,在语言理解方面与行业领先者相媲美。

🔍 易于评估和部署 提供全面的模型评估工具,促进负责任的 AI 应用。

快讯中提到的AI工具

Cohere
Cohere

全球领先的企业AI平台

Hugging Face
Hugging Face

机器学习和人工智能技术的平台

© 版权声明:
本文地址:https://aidh.net/kuaixun/4jg33qhi

暂无评论

none
暂无评论...