摘要
针对航行通告中出现的Q代码和E项正文部分不规范的问题,通过自然语言处理中的文本相似度计算方法可识别出不规范航行通告。首先,基于统计机器翻译方法将航行通告E项正文部分翻译成中文并建立数据库,将Q代码翻译成中文;然后,利用Word2vec模型计算两者之间的相似度,并制定不规范航行通告识别标准。通过对收集的500条航行通告中的Q代码和E项正文进行相似度计算,设定0.7作为不规范航行通告的识别标准,经数据测试可得不规范航行通告识别准确率为96.2%,验证了基于自然语言处理的不规范航行通告识别方法的可行性。
- 单位