基于word2vec的程序编译错误信息特征提取方法

何烨辛; 谷林; 孙晨

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于word2vec的程序编译错误信息特征提取方法

作者：何烨辛; 谷林; 孙晨

来源：计算机与数字工程, 2022, 50(06): 1317-1322.

摘要

输入表示为固定长度的特征向量是机器学习算法要求之一。针对编程中的编译错误信息特征,论文提出了基于word2vec模型对编译错误信息进行特征提取。利用滑动窗口取词的方式,建立one-hot字典,结合word2vec中的Skip-gram模型,构建Huffman树,从可变长度的文本中学习固定长度的特征表示。最后使用SVM分类算法进行实验结果的验证。结果表明,该特征提取方法在编译错误信息中有显著的效果。

单位
西安科技大学; 西安工程大学

收藏分享被引浏览

更新时间：2024-03-19 16:34

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号