
纽约人工智能团队Nous Research,以其致力于打造“个性化、无限制”语言模型而闻名,近期发布了全新的模型推理API。此举标志着这家风格独特的AI机构,将自身引以为傲的语言模型,通过标准化的程序接口,提供给更广泛的开发者和研究人员使用。

“无限制”模型的API化
Nous Research 一直以来致力于挑战OpenAI和Anthropic等大型AI公司在模型开发方面的限制,其企业文化也体现出强烈的“自由主义”色彩。如今,他们将这一理念转化为API,让更多人能够体验其技术优势。
首批API包含两款核心产品:基于Meta Llama 3.1架构的Hermes3Llama70B大型通用模型,以及上月发布的、能够在标准回复和详细“思维链”(Chain-of-Thought,CoT)之间灵活切换的DeepHermes-38B Preview推理模型。 这为开发者提供了“高性能”和“高性价比”两种选择。
访问API并非直接下单,而是采用先到先得的候补名单制度。为缓解用户等待,每个新账户将获得5美元的免费额度。此举一方面源于技术限制,考虑到与拥有雄厚资金的大型企业相比,Nous Research的GPU资源相对有限;另一方面,也是一种精明的营销策略,通过制造“稀缺感”来提升产品吸引力。
值得关注的是,尽管Nous Research风格独特,其API设计却与OpenAI的API设计模式保持一致,包括completions
和chat completions
接口。这使得熟悉OpenAI接口的开发者能够无缝衔接,轻松集成Nous的模型,体现了Nous Research在坚持自身理念的同时,兼顾了务实的商业考量。
从“开源下载”到“付费部署”的商业模式转型
仅四个月前,Nous Research发布了其首个用户界面聊天机器人Nous Chat。在此之前,他们专注于发布开源模型,供用户本地部署。 此前的本地部署方式需要用户自行下载代码并运行,过程繁琐且成本较高。而现在,通过API,开发者可以直接使用高性能模型,无需再关注基础设施维护。 这标志着Nous Research从纯粹的开源模式向更具可持续性的商业模式转型。
此次API发布体现了Nous Research在坚持开源原则的同时,积极探索商业化道路的尝试。他们通过商业化部署获取收入,同时公开模型权重。 这是一种平衡开源精神和商业可持续性的策略。
这种混合模式旨在吸引不同用户群体:个人开发者和研究人员仍可免费下载和运行模型,而追求可靠性、便捷性和性能优化的企业则可以选择付费使用API。
Nous Research表示,其推理服务将持续扩展,未来可能包含更多特色模型,例如擅长函数调用的Hermes2Pro,以及Psyche项目。对于基于开源模型进行创新的AI初创公司而言,Nous Research的API提供了一个新的选择,可能加剧AI推理领域的竞争,并推动技术进一步发展。
快讯中提到的AI工具

致力于创造对全人类有益的安全 AGI