在2025世界人工智能大会(WAIC)期间,由智元机器人主办的“智启具身论坛”成为具身智能领域的技术交流标杆。论坛汇聚全球顶尖学者和产业领袖,围绕技术突破、生态构建与场景落地展开深度对话,为行业发展提供前瞻性指引。

论坛中,Intrinsic(Alphabet) 科学与AI事务负责人Stefan Schaal从物理约束出发,揭示机器人技术的核心本质。他强调,与纯软件系统不同,机器人需在感知、行动与物理世界间构建闭环,同时实现硬件、软件、环境深度协同。“物理世界不会听从违背其法则的软件指令”,这一观点直指行业误区——过度依赖算法突破而忽视机械结构、传感器精度等物理层约束。Stefan指出,高性能机器人的关键正在于对物理约束的精准把控,而非简单将机器人视为API接口。
Stefan引入技术就绪水平(TRL)概念,揭示机器人技术落地的核心障碍。他以工业场景为例,指出汽车制造等领域要求机器人操作成功率达99.9%以上,远高于AI在医疗诊断等领域的容错率。“人形机器人若每 10 次行动就摔倒 1 次,将彻底失去实用价值”,这一数据凸显TRL概念阶段到成熟应用的跨越难度。
数据层面,Stefan指出机器人领域面临“小而精”到“大而优”的转型挑战。全球机器人存量仅1000-1500万台,远低于互联网设备规模,导致数据积累缓慢。他主张通过部署ASI系统在实际场景中生成高质量数据,包含失败案例与边缘场景,而非单纯追求数据量。模拟数据与远程操作数据可作为补充,但无法替代真实物理交互的价值。
针对通用人工智能(AGI)与人工专门智能(ASI)的争议,Stefan明确支持ASI的实践价值。他以NIST电子制造挑战板为例,指出看似简单的连接器插入、拧螺丝等任务,至今仍无机器人能在复杂场景中完美完成,凸显ASI在窄域内实现高性能的攻坚意义。ASI模型体积小、可本地运行,适配工业“气隙计算”需求,并支持多速率系统控制——语义推理(<10Hz)、运动规划(1-100Hz)与实时控制(100Hz-1kHz)的协同,远超单一AGI模型的能力边界。

鉴于多速率系统的重要性,Stefan以人体脊髓反射和大脑决策的分层协作为机器人控制的生物原型,指出力扭矩传感器需以1kHz频率运行,若控制系统仅以10Hz采样,将丢失99%的关键数据。他直言:“真正的机器人控制从500Hz开始,甚至达到1kHz”,这一严苛的实时性要求,决定了软件架构必须与硬件特性深度耦合。
此外,Stefan还主张机器人技术应遵循“性能优先”的演进逻辑:先通过ASI在特定领域实现99%以上成功率,再依托实际部署数据逐步扩展能力边界。他认为,物理AGI的实现需跨越操作复杂度、场景泛化与多具身适配三大维度,而起点是对物理世界规律的敬畏和精准把控。
通过此次论坛,智元机器人搭建了一个全球对话的平台,为具身智能的落地提供了兼具理想性和可行性的路径,推动了行业从概念探讨向务实创新的转型。