摘要

痤疮作为一种常见的皮肤病,发病率逐年增加。尝试使用机器学习方法分析痤疮宏基因组测序数据。使用主成分分析(Principal Component Analysis,PCA)和核主成分分析(Kernel Principal Component Analysis,KPCA)方法分别分析痤疮患者的患病皮肤(Diseased Skin,DS)样本集和健康皮肤(Healthy Skin,HS)样本集,以及正常对照(Normal Control,NC)样本集,获得对各自样本集具有显著影响的脂质。实验结果表明,KPCA方法可以得到比PCA更丰富的信息,并且得到仅对某一样本集有显著影响的脂质可以作为判别皮肤状态的指标。