作者:劉競,郭忠文,孫中衛,劉石勇,王續澎
摘要:在大規模多標簽分類中,繁重的計算復雜度已嚴重限制了非線性核支持向量機的使用。因此,本文提出了采用分而治之策略的快速多標簽支持向量機分類算法。首先,采用二元關聯問題轉換策略將多標簽分類問題轉換為多個二元分類問題。然后,每個二元分類問題都可以被改進的采用分而治之策略的支持向量機分類算法解決,其改進體現在采用DEC(Different Error Cost)方法來克服標簽數據不平衡問題。最后,通過集成每個二元分類問題解決方案來實現快速多標簽分類。它在訓練和測試速度、測試性能等方面優于其它快速多標簽分類算法。在兩組大規模多標簽數據集上的實驗結果表明:該算法的訓練和測試速度是最快的,測試性能接近ML-LIBSVM分類算法,優于其它快速多標簽分類算法。
發文機構:中國海洋大學信息科學與工程學院
關鍵詞:多標簽分類支持向量機非線性核分而治之策略標簽數據不平衡不同錯誤成本方法multi-label classificationsupport vector machinenon-linear kerneldivide-and-conquer strategylabel data imbalance issuedifferent error cost method
分類號: TP391[自動化與計算機技術—計算機應用技術]