摘要
为了解决现有的代码补全方法因数据集有限而不能有效地提高模型的泛化能力和特征向量间语义不紧密的问题,本文设计了基于RoBERTa模型,结合数据增强和代码文本Embedding技术(代码词嵌入技术)的RoBFill代码补全模型。本文通过在6个安卓数据集上进行三组比较实验,三组实验基于RoBERTa模型,分别使用数据增强技术、代码词嵌入技术、数据增强技术,结合代码词嵌入技术这三个角度来验证本模型的有效性,本文实验在RoBERTa模型的基础上增加了技术层面的创新。通过实验结果可以得知,基于RoBERTa的数据增强与代码词嵌入代码补全模型能够提高代码补全的性能,使预测的准确性提高。
-
单位大连外国语大学