基于互信息的贝叶斯-案例检索特征选择模型

作者:徐曼; 甘丹; 沈江*
来源:工业工程与管理, 2018, 23(05): 176-182.
DOI:10.19495/j.cnki.1007-5429.2018.05.024

摘要

案例检索过程中案例集存在特征冗余,使得检索效率和准确度较低。传统的基于贝叶斯网络案例检索特征选择模型(BN-CBR)对先验知识利用效率不高,且不能有效选择消除冗余性的特征子集。构建基于互信息的贝叶斯-案例检索特征选择模型(MI-BNCBR),采用特征冗余度和互信息计算案例特征的综合权重,改善BN-CBR模型对先验知识利用效率不高的问题,其采用互信息方法可消除案例集中的冗余特征并得到最优特征子集,采用基于远端最近距离计算的K-D树方法进一步改善基于互信息的贝叶斯-案例检索的效率,并利用医学基准数据进行实验,结果表明所引入的方法有效地提高了案例检索的准确度和检索效率。

全文