海斌访谈:DeepSeek如何重塑中国大模型产业生态

海斌访谈:DeepSeek如何重塑中国大模型产业生态

中国互联网巨头正因DeepSeek而发生深刻变革。

在2月14日,百度宣布计划于6月30日开源其文心大模型。次日,部分微信用户发现已具备使用DeepSeek模型的搜索功能。百度和腾讯各有自主研发的大模型产品,而其旗下的搜索引擎和微信则是拥有数亿用户的超级流量入口。这一转变凸显出中国科技公司在大模型技术领域尚未建立起足够的竞争壁垒。

这种现象并不仅限于互联网巨头,初创公司同样面临类似局势。在DeepSeek-R1发布之前,许多大模型初创公司中的数家已决定放弃开发基础大模型的方向。DeepSeek的推出引发了对部分初创企业的新一轮质疑:其成本是否仍具竞争优势?技术是否更加先进?能否实现商业模式的闭环?

创新与繁荣的另一面是残酷的优胜劣汰与巨大的沉没成本。DeepSeek的冲击使初创企业面临估值调整及融资压力。一位投资机构的合伙人表示:“即便我无法投资DeepSeek,我也不再希望投资你们。我个人认为,DeepSeek对他们的融资产生了显著影响,融资变得更加困难。”

海斌访谈:DeepSeek如何重塑中国大模型产业生态

战略转型

就在宣布开源文心大模型政策的前一天,百度已宣布其文心一言将于4月1日起全面免费。此前,用户在使用文心一言基础功能时可以免费获得,而自定义模型训练及API接口调用等功能则需支付费用。

百度曾坚定支持大模型的闭源战略,其美国竞争对手OpenAI、谷歌以及Anthropic同样采取闭源方式。闭源策略的优势在于技术保留于公司内部,便于在此基础上构建商业模式;而开源则意味着技术流出,盈利模式的构建将更加困难。考虑到大模型需要投入数亿美元,闭源策略对企业和投资者而言并不难以理解。

然而,DeepSeek的出现打破了这一常规叙述。其低成本、卓越性能及开源特性,使得该模型具有颠覆性的潜力。

开源中国董事长马越在接受第一财经采访时指出:“DeepSeek的独特之处在于,其论文极为开放,参数、权重及逐步的训练过程均详细告知公众。”他强调:“这使我们能低成本基于其方法论构建自己的小型模型,这一点十分了不起。”

这正是DeepSeek的影响力所在。投资较少就能实现更优模型,更易于进行端侧部署。因此,除非企业愿耗巨资追赶像DeepSeek这样实力雄厚的公司,否则从零开始构建闭源大模型的意义几何?

一位腾讯云工程师向第一财经表示:“除非闭源模型在技术上大幅领先,让所有人不得不跟随,如果存在同样能力的开源大模型,从逻辑上说,大家将有更多机会进行试错,调试产品,更新速度必然快于闭源模型。”

国内外闭源企业正重新审视其既有策略的可持续性。OpenAI的首席执行官萨姆·奥尔特曼也表示,闭源选择可能是站在历史的错误一方,但其对OpenAI的开源方向尚未定论。

与之相比,百度的举动显得更为果断。

马越表示:“如果技术足够强大,选择闭源也无可厚非,因为闭源商业变现的速度往往更快。问题在于,你真有那么强吗?”对于百度而言,开源之后还可能通过云计算资源实现盈利。

一些大规模模型如DeepSeek-R1如果下载至本地,完整版本的运行成本相当高。因此,开源大模型通常依托于云平台,而大型企业的闭源模型亦不例外。

“它们属于云计算模式,开源将更具可行性。(用户)需要购买云计算资源来维持其运行,否则谁为其保驾护航?”马越进一步指出。

百度的这一策略调整标志着中国大模型产业的重要转型。

巨额的投资与商业化困境,已使诸多大模型公司选择调整方向。

曾经备受关注的大模型六小虎如今也走上了不同的发展道路。百川、零一万物等公司已基本放弃了高成本的通用大模型路线。

在2025年1月初,零一万物宣布与阿里巴巴联合成立实验室,其部分团队成员并入后者,转而探索中小模型及商业应用的道路。

马越表示:“各自的路各有不同,像鱼和虾,各有各的路。”他指出,一些大模型公司已经转向资本化路径,演变为投资公司,而另一些公司则坚持专注于特定行业的模型,这种战略同样具备可行性。

马越称开源为勇敢者的游戏。

“选择开源的背后,是对知识共享的勇气,所担心的并非是他人免费获取我的智慧,而是他们在获得后,连更具挑战性的需求都无法反馈给我。”

海斌访谈:DeepSeek如何重塑中国大模型产业生态

DeepSeek对市场的影响

英诺天使并未投资于任何一家大模型六小虎。就当前而言,这未必不是一件幸事。

值,这在一定程度上透支了未来的估值。”

六小虎意识到ChatGPT所带来的技术革新机会,国内的科技巨头也同样如此。初创企业在起步阶段便与大企业站在了同一起跑线上。

王晟指出,“一开始便与大企业展开高强度竞争是我们应当避免的投资误区。”他表示,目前并未见到大模型企业能够产生显著盈利的可能性。“当然通过一些政企项目是可以盈利的,但这与大家对人工智能的巨大期待或者与公司估值之间的差距却显得很大。”

人工智能的商业化进程要么是对现有业务的转型,要么是开辟新的使用场景。

相较于初创的AI企业,阿里巴巴、百度和字节跳动等科技巨头在赋能既有业务方面拥有更为显著的优势。电商、工业和娱乐等领域均可借助人工智能进行提升。但这些产业通常被行业巨头占据,阿里巴巴在积极投资AI,而字节跳动的豆包项目发展也十分迅速。

“初创公司的AI技术无法撼动产业巨头的地位,这是不现实的。产业巨头掌握着资金、客户、收入、场景和数据,他们并非毫无警觉。”王晟认为,即便旧场景中存在庞大的市场,初创企业也难以获得相应的红利。

新的使用场景尚未显现。

目前,消费者的购物、办公、娱乐等需求都是通过成熟的设备如手机和电脑来满足的。因此,这些需求已基本得到满足。

“只有新设备才能创造新的使用场景。例如,智能眼镜的出现将会开辟全新场景。”王晟表示,然而目前智能眼镜的技术尚不成熟。

DeepSeek的出现加剧了大模型初创企业的商业化困境。

DeepSeek在产品交付速度上超过了任何大模型企业,其已成功进入普通消费者的手机。截至目前,其日活跃用户数量已超越字节跳动的豆包,并超越了月之暗面旗下的Kimi智能助手。

相较其他大模型,DeepSeek有望更快速地通过各大平台企业实现落地,服务开发者与企业。

在春节前后,国内的云计算平台如阿里云、腾讯云、优刻得以及百度智能云等,相继推出了DeepSeek模型。开源的DeepSeek提供接口,使得这些云计算平台无需与DeepSeek公司合作即可直接部署。免费开源的模型与低廉的算力吸引了众多开发者和用户转向DeepSeek。

“一旦我是一个应用程序,接入的正是大模型的API(接口),那么切换就会相对简单。”一名腾讯云工程师向记者表示。

最新消息显示,腾讯的微信已经接入了DeepSeek-R1模型,部分用户在使用微信搜索功能时可以调用这一模型。

微信作为一款超越10亿用户的应用,同时,腾讯元宝也已接入DeepSeek。这两款产品之前也曾接入了腾讯自主研发的混元大模型,加入DeepSeek后,用户的选择空间得以扩展。

海斌访谈:DeepSeek如何重塑中国大模型产业生态

“融资变得困难”

DeepSeek的出现对大模型公司的融资造成压制。

两家知名投资机构的工作人员均向《第一财经》表示,在DeepSeek发布后,他们就其对国内AI产业和投资的影响进行了广泛讨论。

这些投资机构可能会考虑调整投资策略。

大模型的开发是一项人才密集、算力密集和数据密集的业务。以往,一家新启动的大模型企业如未能获得1亿美元融资,便很难成功转型。

OpenAI和Anthropic等企业都有意向向产业客户、投资者和政府传达一样的信息:大模型的发展只能依靠巨额资金投入。例如,提升十倍的算力才有可能实现下一个智能阶段的突破。而且,人工智能的发展历程,大致遵循着缩放定律的曲线。

中国与美国的大模型企业和投资者曾对此深信不疑,然而DeepSeek的出现动摇了这种投资逻辑。

“我认为DeepSeek在国内初创公司中具备最强的创新能力,甚至与阿里、字节这样的行业巨头相比,其创新能力也不遑多让。但这并不意味着其技术实力是无与伦比的,大家无法追赶。”王晟表示,其带来的震动并不是因为技术上的显著领先,而是使投资者开始重新审视现实。“过去大家不计成本,而如今投入产出比的考量愈发重要。”

能是现阶段唯一一家没有融资压力的大模型初创企业。如今,各机构虽然手握资金,却难以投资于DeepSeek。与此同时,其他大模型初创公司此时不仅需要重新评估其技术和商业化路径的可行性,还必须继续努力进行融资。

然而,投资者的心态似乎已经发生了变化。

王晟表达道:“即便无法投资于DeepSeek,投资者对其他项目的兴趣也减弱了。DeepSeek对融资环境的影响不可小觑,现在融资变得更加困难。”他指出:“若贸然降估值显然不理性,早先的投资者也将难以接受。在当前情形下,投资者也难以抽身。这是初创企业与市场之间展开的博弈,最终的结果尚难以预见。”

当今,显著的资源浪费似乎是不可避免的。

随着低成本且优异性能的开源模型的推出,若其他大模型企业无法提供更具竞争力的产品,开发者与用户可能迅速转向开源模型。这意味着,一些企业之前在研发、预训练及计算基础设施上的巨额投资,可能会变得毫无意义。

马越评论道:“中国本土的沉没成本极为庞大。”他举例说,某公司可能投入了数百亿,而最终成就的却是像DeepSeek这样的企业。此外,马越也强调:“当前最主要的问题是,与美国相比,我国在人工智能领域的投资差距多个数量级。”

尽管面临诸多挑战,但投资与创新的进程仍将持续。

到2025年,投资者可能会将重点转向基于大模型的应用创新。免费的大模型加上低廉的云计算,将为应用开发企业提供新的机遇。

文章中提到的AI工具

文心大模型
文心大模型

产业级知识增强大模型

DeepSeek
DeepSeek

深度求索:引领未来人工智能技术的探索与创新

文心一言
文心一言

智能AI助手,助你高效工作与学习

OpenAI
OpenAI

致力于创造对全人类有益的安全 AGI

ChatGPT
ChatGPT

OpenAI开发的一款先进AI聊天机器人

豆包
豆包

字节跳动旗下AI智能助手

© 版权声明

相关AI热点

暂无评论

none
暂无评论...