本发明公开了一种基于强化学习的大视场摄像机标定方法,其方法步骤为:首先,建立标定图像采集过程的马尔科夫决策模型,并利用先验知识初始化马尔科夫决策模型;然后,建立大视场摄像机成像系统仿真模型,用于模拟标定系统并计算标定误差;再结合标定精度要求以及马尔科夫决策模型的状态空间约束,设计奖励模型,将标定误差增量等信息转换为状态-动作对对应的奖励;最后,基于值函数逼近的Q-learning方法结合约束条件进行训练,求解马尔科夫决策模型的标定操作最优策略。该发明操作简单,精度高,稳定性好。