馬可夫決策過程

出自維基百科,自由嘅百科全書

馬可夫決策過程Markov decision process)係一種離散時間隨機過程