馬可夫決策過程

出自維基百科,自由嘅百科全書
Jump to navigation Jump to search

馬可夫決策過程Markov decision process)係一種離散時間隨機過程