小团队大作为：10人精炼首个微调版Llama 3.1 405B模型，性能强悍！

12个月前发布AI俱乐部

一个拥有10亿参数的模型问世，专注于提升对话表现，它直接挑战了Meta的地位，宣称其目标是成为“终极对话模型”！

这家名为Nous Research的研究机构发布了一款开源模型，名为Hermes3，该模型基于Llama3.1的405B版本构建。与其他模型不同，他们的侧重点不在于通用性能。

这款名为“对话优先模型”的模型旨在超越Mistral、Yi、Llama等其他参数量达数百亿级别的模型，致力于成为AI领域的“对话大师”！

Hermes3的目标是提供卓越的AI对话体验，通过利用FP8量化技术，它能更高效地利用显存，从而降低对VRAM和计算资源的需求，这意味着Hermes3能够在更广泛的应用场景中发挥作用！

在具体性能方面，Hermes3专注于提升对话能力。它擅长处理指令遵循、多轮对话，并能进行更复杂的推理。借助Llama3.1的128K上下文窗口，Hermes3在处理长篇对话和复杂场景时表现出色。

Hermes3的强大之处不仅在于技术。其设计理念在于赋能开发者，它简化了定制化流程，使得根据特定需求调整模型变得更加容易。这意味着每个人都能拥有属于自己的独特模型！

对于那些追求卓越对话AI体验的人来说，Hermes3提供了一个强大的选择，它通过优化量化过程和改进架构设计，实现了性能与效率的平衡。

Hermes3的训练策略包含两个关键部分：监督微调（SFT）和直接偏好优化（DPO）。该模型借鉴了超过500万条高质量的SFT数据，旨在提高推理和对话处理能力。

Nous Research一直致力于推动2023年的开源社区发展，不断追求AI领域的“前沿创新”。他们的最终目标是实现真正的技术民主化，让每个人都能享受到最先进的对话能力。正如他们所说：“我们正在努力推进开源生态系统的发展，以便我们都能共同建设更美好的未来。”

目前，Nous Research已经发布了5个经过微调的版本和89个检查点，这些都可以在Hugging Face上找到：开源的力量，势不可挡！

技术报告：https://nousresearch.com/wp-content/uploads/2024/08/Hermes-3-Technical-Report.pdf

项目主页：https://nousresearch.com/freedom-at-the-frontier-hermes-3/

快讯中提到的AI工具

Hugging Face

机器学习和人工智能技术的平台

文章版权归作者所有，未经允许请勿转载。

本文地址：https://aidh.net/kuaixun/5akfgngr

暂无评论...