作者:張國永,龔建華,孫麇,周潔萍,李文航,張利輝,汪東川,李文寧,胡衛東,樊鴻奎
摘要:針對當前新型冠狀病毒肺炎(coronavirus disease 2019,COVID-19)病例個體時空軌跡描述文本高度非結構化的特點,提出了一種基于自然語言處理(natural language processing,NLP)輔助的交互式軌跡提取方法,用于提高軌跡提取的效率和質量。設計了交互式軌跡提取和質量評估流程,研究并實現了地址分割與組合算法、軌跡質量評估算法等關鍵技術。以黑龍江本土COVID-19聚集病例為例,通過軌跡提取效率和質量對比實驗,驗證了該方法的有效性和實用性。實驗結果表明,與無NLP輔助的提取方法相比,該方法的軌跡提取效率得到了顯著提升;同時,依據軌跡定量可信度評價結果,人機交互式的提取方法還可有效解決算法軌跡自動提取中存在的軌跡點遺漏、位置錯誤等問題。
發文機構:中國科學院空天信息創新研究院 中國科學院大學 天津城建大學 浙江中科院應用技術研究院空間信息技術應用研發中心
關鍵詞:COVID-19時空軌跡軌跡提取自然語言處理軌跡質量評估COVID-19spatiotemporal trajectorytrajectory extractionnatural language processing(NLP)trajectory quality evaluation
分類號: P208[天文地球—地圖制圖學與地理信息工程]