

近日,法国人工智能公司 Mistral AI 推出了其最新的开源语言模型系列,名为 Mistral3B 和 Mistral8B。
这两款模型均属于 “Ministraux” 系列,代表着一类擅长推理和语言理解的大规模语言模型,能够处理高达 128,000 个 token 的上下文长度。据悉,这些模型在各自的参数规模下表现出色,能够胜任各种自然语言处理任务。
据 Mistral 介绍,Ministraux 系列的语言模型旨在实现性能和效率之间的平衡,适用于文本摘要、代码生成、知识检索以及其他复杂应用。预计未来还将发布更多基于 Ministraux 系列的模型(例如 Mistral Large),以满足不同领域的需求。
值得一提的是,Mistral 发布的 Ministral3B 和 8B 模型,已在多个基准测试中超越了同等规模的其他开源模型,例如 Google 的 Gemma22B 和 Meta 的 Llama3 18B。特别是 Ministral3B 的指令微调版本,其性能甚至优于规模更大的 Mistral7B。
另一方面,Mistral8B 在同类开源模型中表现卓越,适用于搜索、问答、代码生成和文本生成等多种任务。
目前,Ministral AI 的这两款开源语言模型已可通过 API 访问。Ministral8B 的定价为每百万 token 0.10 美元,而 Ministral3B 则为 0.04 美元。同时,Mistral 还免费发布了 Ministral8B Instruct 模型的权重。此外,Mistral 的这两款模型也已集成至 Vertex 和 AWS 等云平台上。
要点总结:
– 🔥 Mistral AI 发布了 Ministral3B 和 8B,它们都支持 128,000 个 token 的上下文窗口。
– ✨ 这些模型擅长推理、代码生成、问答和知识检索等任务。
– 💰 在成本方面,Ministral8B 每百万 token 收费 0.10 美元,Ministral3B 收费 0.04 美元。