摘要
关键词:在实际应用中,国际疾病分类(ICD)编码的频率分布呈现出长尾的情况,针对少样本编码分类中训练数据不足的问题,提出了一种基于元网络的自动ICD编码模型——MNIC。首先,使用元网络学习元知识,然后将学习到的元知识从数据丰富的频繁编码转移到数据贫乏的少样本编码。其中元知识是通过将特征空间中的实例和语义空间中的特征拟合到同一个空间进行映射,将频繁编码的特征表示映射到其分类器权重得到的。最后,为元知识的可转移性和通用性提供了合理的解释。在MIMIC-III数据集上的实验结果表明,与次优的AGM-HT模型相比,MNIC模型将少样本编码的F1分数提高了3.77个百分点,并将AUC分数提高了3.82个百分点,显著提高了少样本编码分类的性能。
- 单位