Zobrazuji výsledky 1 - 1 z 1 pro vyhledávání 'Gosavi, Abhijit', doba hledání: 0,01 s.
Upřesnit hledání
-
1
A Reinforcement Learning Algorithm Based on Policy Iteration for Average Reward Empirical Results with Yield Management and Convergence Analysis. Autor Gosavi, Abhijit
Vydáno v Machine learning.Signatura: loading...
Umístění: loading...Článek loading...