基于HJB方程的稳定流形结构,借助深度神经网络的学习能力得到反馈式最优控制器,实现对两轮自平衡车欠驱动系统的稳定平衡控制。通过数值仿真结果验证该最优控制器的控制效果,尤其在系统参数不确定及存在外部扰动的情况下表现出了良好的鲁棒性。该方法避免了传统数值求解HJB方程方法中遇到的“维数诅咒”问题,为非线性系统最优控制的实现提供了一种可行的方法。