Mistral AI发布强大边缘AI模型Ministral 8B，具备128K token上下文窗口

10个月前发布AI俱乐部

近日，法国人工智能公司 Mistral AI 推出了其最新的开源语言模型系列，名为 Mistral3B 和 Mistral8B。

这两款模型均属于 “Ministraux” 系列，代表着一类擅长推理和语言理解的大规模语言模型，能够处理高达 128,000 个 token 的上下文长度。据悉，这些模型在各自的参数规模下表现出色，能够胜任各种自然语言处理任务。

据 Mistral 介绍，Ministraux 系列的语言模型旨在实现性能和效率之间的平衡，适用于文本摘要、代码生成、知识检索以及其他复杂应用。预计未来还将发布更多基于 Ministraux 系列的模型（例如 Mistral Large），以满足不同领域的需求。

值得一提的是，Mistral 发布的 Ministral3B 和 8B 模型，已在多个基准测试中超越了同等规模的其他开源模型，例如 Google 的 Gemma22B 和 Meta 的 Llama3 18B。特别是 Ministral3B 的指令微调版本，其性能甚至优于规模更大的 Mistral7B。

另一方面，Mistral8B 在同类开源模型中表现卓越，适用于搜索、问答、代码生成和文本生成等多种任务。

目前，Ministral AI 的这两款开源语言模型已可通过 API 访问。Ministral8B 的定价为每百万 token 0.10 美元，而 Ministral3B 则为 0.04 美元。同时，Mistral 还免费发布了 Ministral8B Instruct 模型的权重。此外，Mistral 的这两款模型也已集成至 Vertex 和 AWS 等云平台上。

要点总结:

– 🔥 Mistral AI 发布了 Ministral3B 和 8B，它们都支持 128,000 个 token 的上下文窗口。

– ✨ 这些模型擅长推理、代码生成、问答和知识检索等任务。

– 💰 在成本方面，Ministral8B 每百万 token 收费 0.10 美元，Ministral3B 收费 0.04 美元。

文章版权归作者所有，未经允许请勿转载。

本文地址：https://aidh.net/kuaixun/llr3jm4i