作者:馬明清,袁武,葛全勝,袁文,楊林生,李漢青,李萌
摘要:"一帶一路"倡議已成為中國的基本國際政策,及時掌握沿線國家的社會發展態勢,對確保該倡議的穩步推進與順利實施至關重要。為此,論文將GDELT數據庫作為數據來源,獲取了"一帶一路"沿線25個國家近5 a的英文新聞全文數據,引入主題模型,結合無監督方法(LDA)與監督方法(Labeled LDA)挖掘新聞數據中蘊含的主題,構建社會穩定度模型,分析各國社會發展態勢。研究發現:①沿線國家社會發展態勢不均衡,可劃分為4類,即穩定型,如阿曼、越南等;較穩定型,如烏茲別克斯坦、伊朗等;較高風險型,如科威特、約旦、巴基斯坦、緬甸;高風險型,如敘利亞、阿富汗等。②通過新聞主題時空挖掘,可有效發現熱點區域,例如論文發現安集延對中亞地區社會發展與穩定具有重要影響。③利用監督主題模型,能夠發現烏茲別克斯坦經濟產業結構,識別出重大社會事件,發現其社會安全風險及變化趨勢。采用論文方法可有效挖掘新聞事件時空變化規律,發現各國潛在風險,支撐對沿線國家社會發展態勢的實時動態監控,為"一帶一路"倡議的實施提供輔助決策支持,具有重要的應用價值。
發文機構:中國科學院地理科學與資源研究所 中國科學院大學 北京理工大學計算機學院 中國公安部第一研究所
關鍵詞:一帶一路時空數據挖掘主題模型社會發展態勢社會穩定度大數據the Belt and Road Initiativespatiotemporal data miningtheme modalsocial situationsocial stabilitybig data
分類號: TP311.13[自動化與計算機技術—計算機軟件與理論][自動化與計算機技術—計算機科學與技術]