针对目前旅游行程生成方法自动化程度较低、操作复杂的问题,提出了一种基于游记语义分析和自然语言处理的行程生成算法。该方法以常见的非结构化游记文本作为数据源,采用关键词遍历、行程时序提取、兴趣点名称提取的方法,获取游客在旅行目的地的游览轨迹,生成结构化旅游行程。最后通过多篇同类行程的横向比较,降低处理结果的冗余度,自动制定具有实用性的旅游行程计划。