Näytetään 1 - 1 yhteensä 1 tuloksesta haulle 'Gosavi, Abhijit', hakuaika: 0,01s
Tarkenna hakua
-
1
A Reinforcement Learning Algorithm Based on Policy Iteration for Average Reward Empirical Results with Yield Management and Convergence Analysis. Tekijä Gosavi, Abhijit
Julkaisussa Machine learning.Hyllypaikka: loading...
Sijainti: loading...Artikkeli loading...