• 工業工程與管理 · 2009年第4期 38-44,59,共8頁

    基于增強學習的半導體測試調度研究

    作者:張智聰,鄭力,翁小華

    摘要:采用Sarsa(λ,k)學習算法求解、產品、測試機、測試工具包、使能器部件對應關系非常復雜的半導體測試調度問題。針對測試調度,通過定義系統狀態的表示方式、構造行為和報酬函數把調度問題轉化為增強學習問題,并把Sarsa(λ,k)算法和梯度下降徑向基神經網絡函數泛化器結合使用。實驗驗證了Sarsa(λ,k)算法解決半導體測試調度問題的有效性。Sarsa(λ,k)算法通過反復解決調度問題來調整調度策略,能克服單個行為策略短視的缺點,綜合利用各個行為策略的優點,從而找到較優的調度方案。

    發文機構:廣東東莞理工學院工業工程系 清華大學工業工程系 南佛羅里達大學工業與管理系統工程系

    關鍵詞:調度半導體測試增強學習多資源約束schedulingsemiconductor testreinforcement learningresource constraint

    分類號: TP311.52[自動化與計算機技術—計算機軟件與理論][自動化與計算機技術—計算機科學與技術]

    注:學術社僅提供期刊論文索引,查看正文請前往相應的收錄平臺查閱
    相關文章
    性视频