2025年12月13日 星期六
Comment
Next Step for Humanoids: From Puppets to Partners
By LI Gangyang, WANG Xinlong & LUO Shaqi

 

    The last few years have seen a dazzling spectacle of robotic achievements. We have seen humanoid robots execute flawless backflips and intricate dance routines. These demonstrations, by established industry pioneers as well as ambitious new entrants, are remarkable feats of engineering, proving that we can build machines with the kinematic complexity to mimic human movement.

    But what will it take to transition them to the real world?

    Today's most impressive humanoid demonstrations are triumphs of dynamic locomotion and trajectory tracking. But when faced with strong resistance, these systems often fail. A robot may over-torque its joints, overheat, or lose balance entirely. It was trained to move, not to struggle. Closing this gap demands "whole-body intelligence," the ability to coordinate every limb and joint to generate and withstand force while remaining stable.

    Two challenges stand out. First, robots lack a human-like reaction mechanism. When we push a heavy object, we automatically adjust posture, shift weight, and engage core muscles — subtle biomechanical strategies missing from most control frameworks.

    Second is the notorious "curse of high-dimensionality": with dozens of joints and hundreds of sensory inputs, effective whole-body coordination is an immense learning problem. Reinforcement learning must navigate vast state and action spaces, often leading to unstable or inefficient behaviors.

    A new paradigm is emerging to overcome these limits. Rather than scripting responses, researchers are enabling robots to learn the fundamental principles of physical interaction from the ground up.

    A prime example of this trend is the Thor framework developed at the Beijing Academy of Artificial Intelligence (BAAI). When a 35 kg Thor robot pulled a 1,400 kg vehicle, it was not executing a rigid plan; it had learned to use its entire body to manage force, much like a trained athlete.

    This new solution is characterized by two key insights: reward learning that encourages human-like biomechanics, and control architectures that break whole-body coordination into manageable components. The result is generalizable physical intelligence.

    A robot capable of understanding force interaction can apply the same principles across tasks — from opening heavy doors to stabilizing loads or maintaining controlled pressure on a surface. The robot is no longer just a collection of moving parts — it becomes a holistic physical agent, demonstrably stronger, more stable, and vastly more capable in the real world.

    Across the industry, a consensus is emerging: Mastering physical interaction is the next milestone. In this sense, work on frameworks like BAAI's Thor is not an isolated effort, but part of a broader transition toward "whole-body, force-aware" humanoids. We are finally moving away from simply programming robots to do tasks, toward teaching them to understand the physics of the work itself.

    The ultimate goal is not just to build smarter machines, but to build a future where humans and robots can work side-by-side to solve humanity's grand challenges.

    Achieving this vision will require an open, global and collaborative ecosystem, where foundational research is shared to accelerate progress for all. We are proud to contribute our research to this collective endeavor toward a future where humanoid robots can finally, and reliably, stand their ground in the real world.

 

    The authors are from BAAI.


京ICP备06005116