文章

人形机器人是为人心设计的,不是为物理世界设计

人形几乎在每个工程指标上都能被超越,我们却执着于把智能塞进一具人的身体。也许,它从来就不是为物理世界设计的,而是为人心设计的。

我看着发布会上,人形机器人迈着略显僵硬的步子走上舞台,台下掌声雷动。心里却有了疑问——人的形状,真的是自然界里最合理、最高效的方案吗?还是说,我们只是希望机器能更顺滑地融入这个为人类量身打造的世界,才刻意让它长成了这副模样?

如果是后者,那我们的眼光会不会太局限了?为什么非得死死盯着“人类社会”这一小块地方不放?

我们既然已经造出了智能,为什么还非得把它塞进一具“人”的身体里?

这问题值得仔细想一想。


人形其实不是效率最优。 从纯工程角度看,人的形态在几乎每个单项上都能被超越:轮子在平地上比双腿省能一个数量级,四足在复杂地形上比双足稳定得多,机械臂固定在轨道上比装在会晃的躯干上精度高得多。人形是演化的产物,而演化不是优化器,它是“够用就行”的修补匠——我们的脊椎、膝盖、直立行走的能耗,全是妥协的遗迹。刻意去复制一个妥协方案,本身确实值得怀疑。

但人形派的真正论据不是效率,而是“接口兼容性”。 这个世界的物理层是围绕人体规格建造的:门把手的高度、楼梯的踏步、工具的握柄、汽车的踏板、货架的深度。一个通用机器人如果想不改造环境就接管人类劳动,人形是唯一“即插即用”的形态。这本质上是个经济学论证——改造全世界的基础设施去适应机器人,比造一个适应现有基础设施的机器人贵得多。工厂可以为专用机器人重新设计产线,但你没法为机器人重新设计一亿套住宅。

还有一个常被忽略的论据:数据。人形机器人可以直接从人类视频、动作捕捉、遥操作中学习,因为形态同构,动作可以近乎直接迁移。一个八条腿的机器人就得从零学起。在深度学习时代,这是一个巨大的结构性优势。

我不看好“人形一统天下”,我看好的是:人形占据一个特定生态位(人类环境中的通用劳动),而更广阔的世界属于非人形。海底勘探不需要腿,仓库物流已经被轮式和机械臂统治,农业机器人长得像拖拉机,太空建造可能是一群协作的模块化单元。真正激进的想象是:机器人根本不必是“一个身体”——它可以是可重构的、分布式的、按任务临时组装的。智能一旦与特定躯体解耦,“形态”就从身份变成了工具,像换衣服一样换身体。这才是具身智能比人形机器人大得多的命题。

我觉得,人形机器人当下的火热,很大程度上是叙事驱动而非工程驱动的。人形能激发投资人和公众的想象力,能上发布会的舞台,这是它融资能力的来源。但商业上最先大规模落地的具身智能,几乎都不是人形——是那些长得毫无魅力的、专用的、无聊的机器。


我看了一些数据和报告,我对这个行业的判断是,短期(5年)内,真正的赢家还是那些“无聊的机器”:轮式底盘加机械臂的混合形态会悄悄吃掉大部分实际工作量,因为它砍掉了双足这个最贵、最不稳定、最没必要的部分;“人形机器人进家庭”仍然不是现实——因为家庭是地球上最非结构化的环境。

十年后回头看,上半身像人(因为工具和操作界面是为人手设计的)、下半身是轮子或全向底盘(因为地板是平的)的形态,可能会成为事实上的行业标准——它拿走了人形的接口兼容性,扔掉了人形的力学包袱。家庭机器人在这个阶段可能会真正出现,但它长得更像“会走的家电”而非管家——单一功能、绝对可靠、几千块钱。

到2046年,智能是云端的、连续的、共享的,身体是本地的、可更换的、按任务租用的——就像今天你不会问“这段代码住在哪台服务器”。机器人不再是“一台机器”,而是智能临时栖身的躯壳,工厂里的一百个身体可能共用一个不断学习的心智。

而且,环境会反过来适应机器。就像我们为汽车重修了道路,2046年的新建仓库、医院、甚至住宅,会在设计阶段就内置机器人基础设施——标准化接口、机器可读的空间标记、专用通道。那时人形的“兼容旧环境”优势将大幅贬值,人形最终会退守到一个意想不到的生态位:不是干活,而是社交——陪伴、接待、教育、护理中需要情感界面的部分。人形的终极价值可能不在于它的手能拧螺丝,而在于人类天生愿意对一张脸说话。换句话说,人形是为人心设计的,不是为物理世界设计的——这或许才是它二十年后真正的立足点。

本文由作者按照 CC BY 4.0 进行授权