针对基于词嵌入模型不能准确表征低频化学术语嵌入的问题,提出了基于子词的化学术语嵌入表示方法,以提高低频化学术语嵌入表示的准确性。首先,引入化学术语词典,利用字节对编码方法,自动生成子词词表;其次,根据生成的子词词表,对化学术语进行编码,使用子词表示化学术语;最后,利用改进的词嵌入模型训练相关文本语料,根据子词嵌入计算化学术语嵌入,最终得到化学术语嵌入表示。实验结果表明,与已有的方法相比,方法能够有效地提高化学术语嵌入表示的准确性,特别是低频化学术语嵌入表示的准确性。