作者:石勇,孟凡,齊志泉
摘要:大數據時代,在實際應用中所面臨的數據體量大幅增長,由于對數據進行詳細標記的難度很大而且成本極高,弱標簽數據已經成為了大數據時代所面臨的主要數據。比例標簽數據作為弱標簽數據中的一個重要類型,有著廣闊的應用場景,但目前仍未受到廣泛關注。已有的比例標簽學習模型在處理大規模問題時,計算速度往往較慢。為了提高學習速度,本文提出Lap-Inv Cal模型,利用LapESVR進行比例標簽學習。大量實驗表明,該模型在保證較高精度的同時,大幅提升了訓練速度,能夠廣泛應用于大規模比例標簽學習問題中。
發文機構:中國科學院大學經濟與管理學院 中國科學院虛擬經濟與數據科學研究中心 中國科學院大數據挖掘與知識管理重點實驗室 中央財經大學管理科學與工程學院
關鍵詞:比例標簽學習LLP流形學習Lap-InvCalLapESVRLeaning with Label ProportionsManifold LearningLap-InvCalLapE
分類號: C37[社會學]