作者:徐曼,甘丹,沈江
摘要:案例檢索過程中案例集存在特征冗余,使得檢索效率和準確度較低。傳統的基于貝葉斯網絡案例檢索特征選擇模型(BN-CBR)對先驗知識利用效率不高,且不能有效選擇消除冗余性的特征子集。構建基于互信息的貝葉斯-案例檢索特征選擇模型(MI-BNCBR),采用特征冗余度和互信息計算案例特征的綜合權重,改善BN-CBR模型對先驗知識利用效率不高的問題,其采用互信息方法可消除案例集中的冗余特征并得到最優特征子集,采用基于遠端最近距離計算的K-D樹方法進一步改善基于互信息的貝葉斯-案例檢索的效率,并利用醫學基準數據進行實驗,結果表明所引入的方法有效地提高了案例檢索的準確度和檢索效率。
發文機構:南開大學商學院 天津大學管理與經濟學部
關鍵詞:互信息案例檢索貝葉斯網絡K-D樹mutual informationcase based retrievalBayesian networkK-D tree
分類號: F224[經濟管理—國民經濟]