智谱AI开源全新域名Z.ai,发布32B/9B系列GLM模型

2周前发布AI俱乐部
1 0 0
智谱AI开源全新域名Z.ai,发布32B/9B系列GLM模型的封面图

智谱技术团队宣布开源了32B和9B系列的GLM(General Language Model)模型,并推出了全新的交互体验平台Z.ai。这些模型包括基座模型、推理模型和沉思模型,在MIT许可协议下提供给开发者,允许商业使用和自由分发。

32B基座模型GLM-4-32B-0414拥有320亿参数,经过15T高质量数据预训练,并丰富推理类合成数据。经过后续训练,该模型在指令遵循、工程代码生成、函数调用等任务表现强劲,部分指标已接近或超越了比其更大的GPT-4oDeepSeek-V3-0324(671B)等模型。此外,GLM-4-32B-0414提升了代码生成能力,支持生成更复杂的单文件代码,并在Z.ai平台内建了预览功能,让用户可以可视化查看生成的HTML和SVG结果,方便评估和优化。

推理模型GLM-Z1-32B-0414在基座模型基础上采用了冷启动和扩展强化学习策略,针对数学、代码、逻辑等任务进行了优化训练。部分任务上已达到与拥有671B参数的DeepSeek-R1相媲美的性能水平,展现了出色的数理推理能力。该模型的实测推理速度可达每秒200Tokens,是国内最快的商业模型之一,价格仅为DeepSeek-R1的1/30。

9B尺寸的GLM-Z1-9B-0414模型继承了上述技术,虽然参数量更少,但在数学推理和通用任务上表现优秀,整体性能媲美同尺寸的开源模型。特别是在资源受限情况下,该模型平衡了效率和效果,为需要轻量化部署的用户提供了强大选择。

沉思模型GLM-Z1-Rumination-32B-0414代表了智谱对AGI(通用人工智能)未来形态的探索。与推理模型不同,沉思模型通过更多步骤的深度思考解决复杂问题,整合搜索工具处理任务,运用多种奖励机制引导和扩展强化学习训练。支持完整的研究闭环流程,在研究写作和复杂检索任务上表现显著。

除了模型开源,基座和推理模型也同步上线智谱MaaS开放平台(bigmodel.cn),提供API服务。基座模型包括GLM-4-Air-250414和GLM-4-Flash-250414,后者完全免费。推理模型有GLM-Z1-AirX(极速版)、GLM-Z1-Air(高性价比版)和GLM-Z1-Flash(免费版),满足不同场景需求。

智谱还推出了全新域名Z.ai平台,整合32B基座、推理和沉思模型,作为最新模型的交互体验入口。目前已上线三款开源模型,用户可以在该平台免费体验这些模型的功能。

快讯中提到的AI工具

DeepSeek
DeepSeek

深度求索:引领未来人工智能技术的探索与创新

GPT-4o
GPT-4o

OpenAI 最新的旗舰模型

GPT-4
GPT-4

OpenAI 发布的最新一代语言模型

© 版权声明:
本文地址:https://aidh.net/kuaixun/re8ljg24

暂无评论

none
暂无评论...