基于注意力机制的Tree2Seq代码注释自动生成

赵乐乐; 张丽萍<sup>*</sup>; 赵凤荣

摘要

代码注释可以帮助开发人员快速理解代码，降低代码维护成本。为了保留代码的结构信息，针对经典的Seq2Seq模型将代码的结构信息压缩为序列，导致结构信息丢失的问题，提出使用Tree-LSTM编码器直接将代码转化成抽象语法树进行编码，使注释生成模型能有效获取代码的结构信息，提升注释生成效果。采用基于注意力机制的Tree2Seq模型实现代码注释生成任务，避免了编码器端将所有输入信息压缩为固定向量，导致部分信息丢失的情况。通过在Java和Python 2种编程语言的数据集上进行实验，使用3种机器翻译常用的自动评测指标进行评估验证，并选取一部分测试数据进行了人工评估。实验结果表明，基于注意力机制的Tree2Seq模型能为解码器提供更全面且丰富的语义结构信息，为后续实验分析和改进提供指导。

单位
内蒙古师范大学

收藏分享被引浏览

更新时间：2024-03-19 05:48

基于注意力机制的Tree2Seq代码注释自动生成

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友