基于fastText的股票咨询案例中文短文本分类技术

作者:林国祥; 詹先银*; 薛醒思; 林涵; 吕宏昱; 林培辉; 方铭波
来源:宝鸡文理学院学报(自然科学版), 2020, 40(03): 48-52.
DOI:10.13467/j.cnki.jbuns.2020.03.008

摘要

目的利用词向量与文本分类模型fastText来提高股票咨询短文本的分类质量。方法首先在输入层上通过fastText将输入的词序列转化为词向量进行输入,然后在隐藏层上通过单层神经网络学习,最后在输出层上使用层次softmax对标签进行编码,计算词序列与每个标签的对应概率,输出词序列属于不同标签的概率值。结果实验结果表明,基于fastText的股票咨询案例的短文本分类准确率高于传统的基于朴素贝叶斯(Naive Bayesian)的短文本分类技术。结论将fastText用于股票咨询案例中文短文本分类可以有效地提高案例短文本分类结果的质量。

  • 单位
    福建工程学院