摘要

目前医学资源信息聚类方法由于没有对特定信息进行去噪,使细节信息流失,无法保留有效信息,导致Jaccard系数与F1系数偏低,特定信息聚类效果较差的问题。为解决上述问题,提出基于VSM的海量医学资源特定信息优化聚类模型,采用有标记医学信息与无标记医学信息样本中所包含的信息,设置降维目标函数的参数值,通过建立降维矩阵实现医学资源特定信息降维处理;利用小波变换模极大值对医学资源特定信息去噪处理,在去噪过程中设定阈值,保留细节信息;在VSM的基础上建立医学资源特定信息优化聚类模型,实现海量医学资源特定信息的聚类。实验结果表明,所提方法Jaccard系数与F1系数较高,表明聚类结果与原有的类别系统更接近,即聚类效果的质量更好。