作者:謝玲,陳文婷,曹瀚文,肖進
摘要:客戶分類一直是企業客戶關系管理(CRM)中最重要的問題之一,而選擇出客戶的關鍵特征更是其中的重中之重。在大數據時代,客戶數據類別分布不平衡、高維以及大量的無類別標簽樣本等特征讓這一問題變得更為復雜,成為一個復雜的系統性決策問題。為解決這一問題,本文提出基于綜合集成研討廳的半監督客戶關鍵特征選擇模型(semi-supervised key feature se-lection of customers based on hall for workshop of meta-synthetic engineering,SFS-HWME)。該模型邀請5位相關領域的專家確定研究難點并通過定性分析尋找備選方案,然后通過綜合集成得到整體解決方案,進一步進行定量分析建模。在定量分析模型中,使用半監督學習(semi-supervised learning,SSL)技術,首先使用初始有類別標簽的數據集L訓練Adaboost集成模型來預測無類別標簽數據集U中樣本的類別;接著,使用自組織映射(self-organization map,SOM)算法對數據集U進行聚類并對其中的樣本進行選擇性標記;然后將這些樣本連同標記的類別標簽一起添加到數據集L中;最后,使用重抽樣技術平衡新的訓練集L的類別分布,再訓練數據分組處理(group method of data handling,GMDH)深度學習網絡選擇最優特征子集,并邀請專家從特征子集中選出最合理的。在4個客戶分類數據集上進行實證分析,結果表明,和已有的一些模型相比,本文提出的SFS-HWME模型具有更好的關鍵特征選擇性能。
發文機構:遵義醫科大學醫學信息工程學院 西南財經大學科研處 華為技術有限公司集團財經 四川大學商學院
關鍵詞:綜合集成研討廳客戶分類特征選擇半監督學習GMDH重抽樣hall for workshop of meta-synthetic engineeringcustomer classificationfeature selectionsemi-supervised learningGMDHre-sampling
分類號: TP3[自動化與計算機技術—計算機科學與技術]