摘要
案例检索过程中案例集存在特征冗余,使得检索效率和准确度较低。传统的基于贝叶斯网络案例检索特征选择模型(BN-CBR)对先验知识利用效率不高,且不能有效选择消除冗余性的特征子集。构建基于互信息的贝叶斯-案例检索特征选择模型(MI-BNCBR),采用特征冗余度和互信息计算案例特征的综合权重,改善BN-CBR模型对先验知识利用效率不高的问题,其采用互信息方法可消除案例集中的冗余特征并得到最优特征子集,采用基于远端最近距离计算的K-D树方法进一步改善基于互信息的贝叶斯-案例检索的效率,并利用医学基准数据进行实验,结果表明所引入的方法有效地提高了案例检索的准确度和检索效率。