• 管理科學 · 2017年第1期95-106,共12頁

    改進隨機森林的集成分類方法預測結直腸癌存活性

    作者:王宇燕,王杜娟,王延章,Yaochu Jin

    摘要:癌癥是人類死亡的主要原因之一,許多國家在癌癥方面的支出占醫療總支出的很大比例。癌癥存活性預測作為癌癥預后的一項重要工作,可以輔助醫生做出更精準的診療決策,進而降低癌癥治療成本。近年來,基于數據驅動的癌癥存活性預測方法逐漸得到應用,而預測的準確性是評價預測方法性能的主要指標,因此提高癌癥存活性預測方法的準確性一直是一個活躍的研究領域。結直腸癌是一種具有高發病率和高死亡率的癌癥,為了提高結直腸癌存活性預測的準確性,利用遺傳算法對隨機森林進行改進,提出基于GA-RF的集成分類方法。該方法通過遺傳算法對隨機森林中的決策樹實行進化搜索,以提高集成分類準確率為目標選出決策樹的滿意集成。實驗分別使用基于GA-RF的集成分類方法、決策樹和參數優化的隨機森林訓練預測模型預測結直腸癌患者的存活性,利用SEER數據庫的結直腸癌數據集對3種方法分別進行10折交叉驗證,然后用準確性、敏感性和特異性3個指標對它們進行評價。實驗結果顯示,基于GA-RF的集成分類方法的預測精度最高(88.2%),參數優化的隨機森林的預測精度次之(86.4%),但集成復雜度遠高于基于GA-RF的集成分類方法,決策樹的預測精度最差(74.2%),而基于GA-RF的集成分類方法還表現出了最好的泛化性能。該集成分類方法對隨機森林進行了有效的改進,能以更高的運算效率和更好的準確性預測結直腸癌存活性,可以為結直腸癌的預后提供決策參考,彌補經驗預測的不足,該方法的提出對節約醫療資源、降低醫療成本、提高患者滿意度具有實際意義。

    發文機構:大連理工大學管理與經濟學部 英國薩里大學計算機系

    關鍵詞:隨機森林遺傳算法集成分類存活性預測結直腸癌random forestgenetic algorithmensemble classificationsurvivability predictioncolorectal cancer

    分類號: TP181[自動化與計算機技術—控制科學與工程][自動化與計算機技術—控制理論與控制工程]

    來源期刊
    管理科學

    管理科學

    Journal of Management Science
    • CSSCI
    • 北大核心
    注:學術社僅提供期刊論文索引,查看正文請前往相應的收錄平臺查閱
    相關文章
    性视频