作者:張智聰,鄭力,翁小華
摘要:采用Sarsa(λ,k)學習算法求解、產品、測試機、測試工具包、使能器部件對應關系非常復雜的半導體測試調度問題。針對測試調度,通過定義系統狀態的表示方式、構造行為和報酬函數把調度問題轉化為增強學習問題,并把Sarsa(λ,k)算法和梯度下降徑向基神經網絡函數泛化器結合使用。實驗驗證了Sarsa(λ,k)算法解決半導體測試調度問題的有效性。Sarsa(λ,k)算法通過反復解決調度問題來調整調度策略,能克服單個行為策略短視的缺點,綜合利用各個行為策略的優點,從而找到較優的調度方案。
發文機構:廣東東莞理工學院工業工程系 清華大學工業工程系 南佛羅里達大學工業與管理系統工程系
關鍵詞:調度半導體測試增強學習多資源約束schedulingsemiconductor testreinforcement learningresource constraint
分類號: TP311.52[自動化與計算機技術—計算機軟件與理論][自動化與計算機技術—計算機科學與技術]