智谱GLM-4-9B:性能卓越,实力超越LLaMA 3 8B系列

11个月前发布AI俱乐部
3 0 0
智谱GLM-4-9B:性能卓越,实力超越LLaMA 3 8B系列的封面图

清华大学知识工程研究室推出了新一代GLM-4-9B开放模型,它具备强大的文本能力,并支持广泛的Chat模型和工具调用,性能直逼LLaMA38B。据悉,GLM-4-9B开放模型已在Github上开源,方便开发者获取并进行二次开发及学术研究。该模型的显著特点在于它在同等规模模型中实现了卓越的性能。

若要进一步提升性能,可以尝试GLM-4-9B-Chat 版本,该版本增强了推理能力、指令遵循能力,并且实现了工具调用(Function Call)和超长上下文处理(最大支持128K token)。

对于特定应用场景,可选择不同长度的上下文版本。标准上下文版本支持多达26种语言。我们还发布了支持1M token超长上下文(大约20万字内容)的 GLM-4-9B-Chat-1M 模型,以及扩展至多模态的 GLM-4V-9B。

GLM-4V-9B 支持1120*1120分辨率的图像输入,通过图文多模态理解能力,能够执行视觉问答、图像描述生成、知识推理和文档内容理解等复杂任务,在多项基准测试中,GLM-4V-9B 的性能优于 GPT-4-turbo-2024-04-09、Gemini1.0Pro、Qwen-VL-Max 和 Claude3Opus 等其他同类模型。

总而言之,GLM-4-9B开放模型为希望在本地部署具备卓越性能模型的开发者提供了理想选择,同时为学术研究提供了坚实的基础。未来,我们将继续开源更大规模的多模态和语言模型,敬请期待。

模型代码:https://github.com/THUDM/GLM-4

模型演示地址:https://modelscope.cn/studios/dash-infer/GLM-4-Chat-DashInfer-Demo/summary

快讯中提到的AI工具

Claude
Claude

由Anthropic公司开发的下一代人工智能AI助手

GPT-4
GPT-4

OpenAI 发布的最新一代语言模型

© 版权声明:
本文地址:https://aidh.net/kuaixun/0sgo87nt

暂无评论

none
暂无评论...