人形机器人发展应重拾“常识”,构建“共识”

无可否认,人形机器人已经成为当今最热门的产业与技术话题。公众普遍期待这些机器人能够迅速走进千家万户,为人类承担各种危险或重复性工作,满足家政服务、养老陪伴等多方面的需求。与此相应,各地政府和产业界对人形机器人企业给予了极大的关注,相关产业政策层出不穷,资本市场也随之波动,产业链的各个环节都积极响应,整个行业迎来了前所未有的发展契机。作为在机器人行业深耕近十年的从业者,我不得不表达一些个人的忧虑与见解,供读者参考。

尽管人形机器人热度不减,但我们必须承认,其在国内的发展周期也仅有两三年。这一高新技术产业几乎是“一夜成名”,尽管某些AI或机器人技术可以得以复用与融合,但要实现对人类文明的颠覆性变革,似乎并不符合事物发展的客观规律。无论是DS还是GPT,其智能水平虽亮眼,但本质上仍然停留在大语言模型(LLM)的阶段,距离对物理世界的完全理解还有很长的路要走。无论马斯克如何激进地推动人形机器人的量产,Optimus在近几次的公开演示中仍依赖于远程操作,而技术的不确定性亦导致特斯拉股价的波动。因此,在我看来,人形机器人的技术与产业发展仍需依赖常识,并建立广泛的共识。这并非对行业的悲观论调或技术上的保守,反而是希望行业能够实现健康而持久的快速发展。

人形机器人发展应重拾“常识”,构建“共识”

AGI的物理终极形态或许并非足式人形,泛人形更具价值

国内领先的人形机器人企业所发布的产品大致可归为两类:一类是模仿Optimus的双足式机器人,代表企业有宇树、云深处、众擎等。这些公司大多由原先的四足机器人企业转型而来,因而在技术积累和开发体系上都有较为成熟的基础,其下肢运动控制能力的提升尤为显著。另一类则是以轮式结构为基础,专注于强化上半身软硬件能力的企业,技术团队主要为院校及海归团队,如银河通用、星海图(智元机器人则涵盖足式与轮式)。显而易见,第一类企业因其卓越的运动控制能力而获得了更加显著的市场关注,这种让人兴奋的“能跑能跳”的表现尤为引人注目。

人形机器人发展背后的核心逻辑在于其是实现AGI(通用人工智能)的最佳载体,这一概念的提出使得整个机器人行业看到了硬件主导的可能性。但值得讨论的是,足式下肢结构是否真的是最优解?实现AGI究竟是更依赖于上半身能力还是下半身能力?当前在行业内对此尚未形成共识。

在稳定性、能效、行走速度及静音性能等方面,轮式结构的优势显而易见。尽管人类在进化过程中没有形成轮式结构,但就走路的几何合理性来看,轮式显然优于足式,这一点使其成为实现AGI的物理最优解决方案。在当前需求的应用场景分析中,轮式、轮足式及履带式的泛人形机器人显示出了更强的通用性。相较之下,纯足式行走仅适用于某些特定场景,且这些场景对连续作业及静音性要求较低,比如在没有电梯或坡道的条件下需要低成本上下楼梯或跨越台阶的场景。

人形机器人发展应重拾“常识”,构建“共识”

位姿运动控制至关重要,但更为核心的是空间智能与决策智能

现今人形机器人在跑步、跳舞、打拳等动作上的流畅性令人印象深刻,机器人的运动能力在迅速进化。然而我们也需理性对待,机器人的位姿协调控制与其决策、执行人类工作任务的能力是两个不同层面的智能要求。从简单的角度看,双腿的运动控制与双臂的作业控制分别代表了小脑能力和大脑能力的区分,即低等生物与高等智能生物的差异。猎豹虽然可以快速奔跑,却无法被训练完成复杂的人工工作;马戏团中虽然动物能够表演,但目前在工厂及家政服务中的工作,依然需要人类来承担。

大模型的未来能力寄予期待,以帮助人形机器人实现具身智能,但现阶段仅处于起步阶段。而且,基于规模法则(scaling law)开发的LLM大模型是否是实现AI智能体的最终技术路径,仍是一个未知数。人类的智能水平作为一种生物智能,拥有当前算力智能无法比拟的高效端侧处理能力、多模态感知与实时建模能力、以及自学习推理和直观决策能力。然而目前的语言大模型在不可解释性、幻觉问题、以及对物理空间的弱理解和高能耗、高算力需求等方面,均缺乏支撑人形机器人作业多样化能力的基础。

空间智能应成为人形机器人广泛应用的基石。在未能理解物理世界的前提下,人形机器人几乎不可能准确把握人类意图并完成相关工作任务。

厂家需具备AI公司的特质**

从底层硬件架构的角度来看,人形机器人并未迎来根本性的突破,其核心制造仍依赖于驱动控制、电机、传感器、电池及算力等模块的匹配与组合。尽管一些制造商自研底层电机、驱动控制器和传感器,但人形机器人本质上仍是一种集成的复杂系统,无法由单一企业独立完成,正如中国新能源汽车市场的迅速发展得益于完善的供应链一样。目前,人形机器人市场的火爆显然吸引了产业链上下游企业的关注及续航研发的投入,这不仅是行业蓬勃发展的标志,更是未来能否持续领先全球市场的基石。

在未来的产业分工中,整机制造商应定位为以AI和场景为驱动力的公司。随着供应链的逐渐同质化,企业的强大AI能力将成为精准定位及未来竞争的核心竞争力。

人形机器人发展应重拾“常识”,构建“共识”

虽然To C市场似乎易于实施,但实际技术泛化能力却面临更高要求

人形机器人在规模化落地场景的布局上,To C市场的成熟通常晚于To B市场。就如新材料的应用,往往是在航天与军工等特定领域得到成熟应用后才逐渐向民用领域拓展。若从机器人的AI能力训练和适配的角度来看,B端的一些应用场景相对C端更容易实现。根据控制理论来分析,C端场景如同一个完全无约束的系统,存在大量干扰因素及未知变量,同时被控对象的重复性与一致性较差,这无疑构成了巨大的挑战。尽管目前的AI大模型实现了端到端的黑箱化训练,且可在一定程度上忽略传统控制理论的约束,但其与机器人物理结构的结合所产生的执行结果,则变得更加不可预测。

相比之下,工业场景下的物理空间和被操作对象较为标准化,任务执行也有系统的流程支撑(如标准程序文件与作业指导书等),这为人形机器人的任务决策能力提出了降维要求。这种类似于交通法规为无人驾驶提供的规则基础的支撑,便是工业场景的重要保障。因此,若当前的人形机器人研发目标直接锁定在家政服务和养老护理等C端市场,其短期落实的可能性极低。如果仅仅定位为片段化作业能力的需求,例如扫地作业,虽然当前机器人已能基本实现,但若如斯定义,作为通用形态的人形机器人的存在意义又何在?

人形机器人发展应重拾“常识”,构建“共识”

目前的竞争焦点应集中于场景功能的实现而非成本控制

当前并非人形机器人的成本控制不重要,但依仗国内完善的供应链优势,试图在全球市场依赖低价获得人形机器人产业的未来成功,实则违背了产业发展的基本规律。现阶段,人形机器人市场的竞争仍处于高技术层次,显然,大规模量产的阶段尚未到来,仍有多项核心技术门槛亟待克服。

因此,与其当前急于追求成本压缩,不如全力以赴拓展人形机器人的实际应用场景。这意味着,应用最先进的材料、高性能芯片、顶尖驱动控制与电机、最前沿的传感器以及卓越的算法进行技术验证。应当采取加法策略,待技术场景的可行性得到证实后,再逐步进行减法,将成本控制留待实际规模化生产后再行考虑。依据中国的硬件制造能力,未来高阶的通用人形机器人(例如宇树H1售价为65万元)将不会比一辆普通家用轿车的价格高。只要机器人的作业能力达到拐点,其进入千家万户便是水到渠成之事。

人形机器人发展应重拾“常识”,构建“共识”

规模量产的标准应是成功交付,而非单纯生产数量

当前人形机器人厂家频频宣称实现千台级别的量产,这样的论调不禁令人莞尔。这种带有节奏性的表述虽然激励了产业链上下游及资本市场的积极性,但究竟有多少产品真正交付到用户应用现场,只有那些厂商心知肚明。近期流传的项目分级与落地阶段的判断,以及高盛发布的行业研究,显然为行业内鲑鱼逆流而上提供了一剂清醒剂。形机器人的制造商仍处于本体开发和应用场景验证的早期阶段。尽管科研教育和娱乐表演市场的需求足以让个别领先的人形机器人企业受益匪浅,然而与目前国内逾百家人形机器人企业的研发和融资规模相比,这样的市场需求实属微不足道。当前谈论“量产”拐点似乎依然为时尚早,整个行业需要更加耐心、理性,以更加扎实的脚步探索应用场景和规模化生产之路。

人形机器人发展应重拾“常识”,构建“共识”

结束语

人形机器人的发展道路绝不会如当前人们所期待的那样一帆风顺,未来可能面临技术瓶颈和发展瓶颈。人形机器人亟需以长期主义的视角来推动,其中包括资本、生态、人才等多种发展要素的协同作用,甚至需要某些天才引领的技术变革。然而,过于急切地透支人形机器人的发展预期,已造成行业资源的大量浪费。在现今技术基础尚未完善的情况下,令人担忧的是,这或许会形成一种空中楼阁式的局面,让大量低水平、同质化的人形机器人企业兴起,甚至出现一些集成创新而缺乏底层研发或产业化能力的企业,导致整个行业的反噬。

期待人形机器人行业的日益繁荣,使其能够尽快造福人类,并再次释放生产力。此类集结当代技术大成的智慧产业,理应成为科学家和技术极客们长久努力的领域,而非如当前现状般被过度娱乐化和情绪化。

© 版权声明

相关AI热点

暂无评论

none
暂无评论...