职责描述
岗位职责:
1. 参与具身机器人下肢模块的运动控制系统研发,以强化学习为核心技术路线,从仿真训练到真机落地全链路负责,同时深度参与机电系统联调与硬件迭代;
2.基于深度强化学习(PPO、SAC 等)在 Isaac Gym / Isaac Lab / MuJoCo 等并行仿真环境中训练双足机器人行走策略,覆盖平地行走、启停、转向、抗扰动等基础运动能力,并持续提升运动自然度与鲁棒性;
3.参与 sim-to-real 迁移工作,通过 Domain Randomization、系统辨识、Teacher-Student(Privileged Learning)等方法缩小仿真与真机动力学差距,确保策略在真实硬件上稳定部署;
4. 设计奖励函数、课程学习方案与训练框架,具备从零搭建完整 RL 训练流水线的能力,对策略的样本效率、泛化性与运动质量负责;
5. 参与机电联调,能独立分析关节执行器的力矩-速度特性、驱动器 FOC 参数对控制效果的影响,从控制视角提出硬件改进建议,推动结构与电气方案迭代;
6. 参与构建高保真仿真模型,完成关节摩擦、电机动力学、接触刚度等参数的标定,缩短仿真与实机的差距;将训练好的策略部署至机载计算平台,完成推理加速与实时控制接口对接,保障策略稳定运行;
岗位要求:
1. 机器人学、自动化、计算机、力学或相关专业硕士及以上学历;
2. 对机电系统有浓厚兴趣,能看懂电机选型参数表、驱动器手册与机械装配图,愿意动手参与联调,不满足于只在仿真层面工作;
3. 理解深度强化学习核心算法(PPO、SAC、TD3 等),能独立实现训练框架并针对 locomotion 任务进行系统性调优,对训练不稳定、策略退化、sim-to-real gap 等工程问题有丰富的排查经验;
4. 有 Isaac Gym / Isaac Lab、MuJoCo 或类似并行仿真平台的深度使用经验,能独立完成 URDF/MJCF 建模、仿真环境搭建与大规模并行训练;
5. 熟悉 sim-to-real 迁移主流方法,包括 Domain Randomization、RMA、Privileged Learning 等,有在真实硬件上完整跑通 RL 策略的经验;
6. 熟练使用 Python 进行算法开发,具备 PyTorch 或 JAX 实战能力;具备扎实的机器人学基础,理解正逆运动学、雅可比矩阵、刚体动力学,能读懂并复现主流 locomotion 论文;
7.具备主动学习与探索AI新工具、新方法的意识,能持续将AI能力融入实际工作场景并独立落地;