• 武漢大學學報:信息科學版 · 2021年第1期65-70,共6頁

    高維數據非參數密度估計的低維流形代表點法

    作者:王樹良,李英,耿晶

    摘要:非參數核方法由于采用統一的度量標準,在大數據中利用高維樣本數據學習時容易遭遇維數災難問題。挖掘高維空間中的低維幾何特性,有助于揭示數據分布的流形結構,進而利用有限樣本的高維數據在低維子空間逼近數據的真實分布。基于此,提出一種新的高維數據密度非參數估計的低維流形代表點法,通過從高維空間中挖掘數據分布的幾何結構來估計密度。首先,通過尋找局部區域內能夠代表流形結構主方向的點,計算局部協方差矩陣,描述局部的數據分布;然后,考慮流形結構中附近數據點不同的影響,根據每個樣本數據點對密度的貢獻進行加權。與傳統的核密度估計方法和流形核密度方法進行了對比實驗,結果表明,該方法能夠快速穩健地進行密度估計,反映數據的真實分布。

    發文機構:北京理工大學計算機學院 青島大學計算機科學技術學院

    關鍵詞:低維流形代表點法核密度估計非參數密度估計交叉似然驗證高維數據low-dimensional manifold representative point methodkernel density estimationnon-parametric density estimationcross-validated likelihoodhigh-dimensional data

    分類號: P208[天文地球—地圖制圖學與地理信息工程]

    注:學術社僅提供期刊論文索引,查看正文請前往相應的收錄平臺查閱
    相關文章
    性视频