作者:衡萍,李明星,董沛武,陳健
摘要:用戶瀏覽模式識別是現階段Web日志挖掘的主要目標之一,研究Web日志挖掘中的序列模式識別問題,針對傳統關聯規則算法中閾值固定不變、大序列的數目與序列長度成反向增長的問題,對傳統的關聯規則算法進行改進,提出IAx算法,使長序列只需較小的支持度計數就能達到閾值,從而發現更多有意義的序列模式,同時運用理論證明該方法的正確性.
發文機構:哈爾濱工業大學
關鍵詞:WEB日志挖掘閾值序列模式識別IA^x算法Web log miningThresholdThe recognition of sequence patternsI A* algorithm
分類號: TP18[自動化與計算機技術—控制科學與工程][自動化與計算機技術—控制理論與控制工程]