

智谱技术团队宣布开源了32B和9B系列的GLM(General Language Model)模型,并推出了全新的交互体验平台Z.ai。这些模型包括基座模型、推理模型和沉思模型,在MIT许可协议下提供给开发者,允许商业使用和自由分发。
32B基座模型GLM-4-32B-0414拥有320亿参数,经过15T高质量数据预训练,并丰富推理类合成数据。经过后续训练,该模型在指令遵循、工程代码生成、函数调用等任务表现强劲,部分指标已接近或超越了比其更大的GPT-4o、DeepSeek-V3-0324(671B)等模型。此外,GLM-4-32B-0414提升了代码生成能力,支持生成更复杂的单文件代码,并在Z.ai平台内建了预览功能,让用户可以可视化查看生成的HTML和SVG结果,方便评估和优化。
推理模型GLM-Z1-32B-0414在基座模型基础上采用了冷启动和扩展强化学习策略,针对数学、代码、逻辑等任务进行了优化训练。部分任务上已达到与拥有671B参数的DeepSeek-R1相媲美的性能水平,展现了出色的数理推理能力。该模型的实测推理速度可达每秒200Tokens,是国内最快的商业模型之一,价格仅为DeepSeek-R1的1/30。
9B尺寸的GLM-Z1-9B-0414模型继承了上述技术,虽然参数量更少,但在数学推理和通用任务上表现优秀,整体性能媲美同尺寸的开源模型。特别是在资源受限情况下,该模型平衡了效率和效果,为需要轻量化部署的用户提供了强大选择。
沉思模型GLM-Z1-Rumination-32B-0414代表了智谱对AGI(通用人工智能)未来形态的探索。与推理模型不同,沉思模型通过更多步骤的深度思考解决复杂问题,整合搜索工具处理任务,运用多种奖励机制引导和扩展强化学习训练。支持完整的研究闭环流程,在研究写作和复杂检索任务上表现显著。
除了模型开源,基座和推理模型也同步上线智谱MaaS开放平台(bigmodel.cn),提供API服务。基座模型包括GLM-4-Air-250414和GLM-4-Flash-250414,后者完全免费。推理模型有GLM-Z1-AirX(极速版)、GLM-Z1-Air(高性价比版)和GLM-Z1-Flash(免费版),满足不同场景需求。
智谱还推出了全新域名Z.ai平台,整合32B基座、推理和沉思模型,作为最新模型的交互体验入口。目前已上线三款开源模型,用户可以在该平台免费体验这些模型的功能。