基于增強學習的半導體測試調度研究-工業工程與管理

基于增強學習的半導體測試調度研究

作者：張智聰,鄭力,翁小華

摘要：采用Sarsa（λ,k）學習算法求解、產品、測試機、測試工具包、使能器部件對應關系非常復雜的半導體測試調度問題。針對測試調度,通過定義系統狀態的表示方式、構造行為和報酬函數把調度問題轉化為增強學習問題,并把Sarsa（λ,k）算法和梯度下降徑向基神經網絡函數泛化器結合使用。實驗驗證了Sarsa（λ,k）算法解決半導體測試調度問題的有效性。Sarsa（λ,k）算法通過反復解決調度問題來調整調度策略,能克服單個行為策略短視的缺點,綜合利用各個行為策略的優點,從而找到較優的調度方案。

發文機構：廣東東莞理工學院工業工程系清華大學工業工程系南佛羅里達大學工業與管理系統工程系

關鍵詞：調度半導體測試增強學習多資源約束schedulingsemiconductor testreinforcement learningresource constraint

分類號： TP311.52[自動化與計算機技術—計算機軟件與理論][自動化與計算機技術—計算機科學與技術]