摘要
为了达到节省船舶领域对比工作消耗的时间与人力资源成本,文中对常用的文本分类算法进行分析比较,有针对性地对分类算法做出在船舶领域的创新。改进传统特征提取算法(TF-IDF算法),使得权重提取更加合理,改进fasttext分类算法,解决输入层参数的输入问题,提出改进后的C-fasttext算法。通过实验,将C-fasttext算法模型分类效果和朴素贝叶斯算法、支持向量机算法和传统fasttext模型进行对比。结果表明,改进C-fasttext算法准确率最高,为91.59%;传统的fasttext分类算法的准确率为88.27%;支持向量机算法处在较低水平,准确率只有59.98%;朴素贝叶斯方法在准确率上为76.19%。改进算法的匹配准确率超过90%,语料覆盖率超过95%,满足实验需求。
-
单位武汉邮电科学研究院