
行业大模型的现状与未来
在最近的人工智能算力论坛上,面壁智能发布了其最新的多模态大模型Luca 2.0版本。该模型在多项能力上表现出色,尤其是在推理和生成能力方面,标志着行业大模型技术的进一步发展。李大海对此表示,行业大模型是一个历史阶段性产物,而未来的发展方向将是通用大模型。
大模型的开发与应用
封闭式开发的效率
李大海强调,面壁智能在模型开发上采取封闭式开发的策略,这种方式提高了开发效率,使得模型在短时间内快速迭代。他指出,在过去的三个月里,Luca的能力提升了39%,其中推理能力更是提升了119%。这种高效的开发模式使得企业能够在市场竞争中快速响应需求。
大模型与应用之间的关系
李大海认为,大模型的应用必须建立在大模型之上,强调了大模型原生应用的重要性。他指出,现今很多应用虽然使用了大模型,但并未充分发挥其潜力。他提到,真正的应用应关注用户的真实需求,并确保在引入大模型后能够更好地满足这些需求。
B端和C端业务的平衡
当前的市场需求
在谈到B端业务时,李大海表示,虽然面壁智能在同步开展B端业务,但目前更侧重于C端。他指出,市场上对大模型的需求非常强烈,但在模型标准化尚未完善的情况下,企业需要花费大量人力来填补服务的空缺。
效率与盈利的关注
李大海强调,商业的本质是关注效率和盈利。他指出,B端业务如果仅以项目制运作,将很难获得良好的毛利。因此,企业需考虑如何高效交付,可能的选择包括开发适用于特定场景的模型或构建足够通用的大模型。
通用大模型的未来
行业大模型的局限性
李大海对行业大模型提出了看法,认为现阶段的行业大模型在能力和成本上都存在局限性。他相信,未来会出现既强大又具成本优势的通用模型,这将取代现有的行业模型。李大海称,行业大模型是现阶段的产物,随着技术的发展,通用大模型将成为未来的主流。
模型的技术演进
在技术上,面壁智能的千亿模型与其他公司的模型有所不同,特别是在结构方面。李大海提到,面壁智能推出的千亿模型采用了Decoder-only网络结构,与之前的稀疏模型CPM2存在显著差异。他强调,基础的大语言模型是构建多模态模型的关键,只有在此基础上,才能顺畅地整合多种模态的数据。
开源与市场竞争
开源大模型的现状
在谈到开源大模型时,李大海指出,虽然开源能提升模型的影响力,但目前尚未形成像安卓系统那样的生态。竞争加剧后,客户更关注服务提供商的能力和售后服务,而不仅仅是模型的好坏。
创新与市场机会
李大海认为,通用大模型的出现不局限于大公司或创业公司,关键在于公司的创新能力。他指出,成功的因素包括人才、资源、组织能力和战略方向等多种因素的综合作用。
对大模型评测标准的看法
李大海对大模型评测标准持批判态度,认为榜单的出现容易导致刷榜现象。他提到,当前的评测标准可能无法准确反映模型的真实能力,尤其在大模型能够快速记忆题目的情况下,理解能力的缺失将影响评测的有效性。
结论
综上所述,面壁智能在大模型的开发上采取了高效的封闭式策略,强调了大模型与应用之间的紧密关系。李大海对行业大模型的未来持乐观态度,认为通用大模型将是未来发展的主流。尽管目前开源大模型尚未形成完善的生态,但在市场竞争中,创新能力将是企业胜出的关键因素。
文章中提到的AI工具
设计稿一键生成多端代码