लेखक खोज परिणाम

परिणाम संख्या का चयन करें 1.
1

A Reinforcement Learning Algorithm Based on Policy Iteration for Average Reward Empirical Results with Yield Management and Convergence Analysis. द्वारा Gosavi, Abhijit

में प्रकाशित Machine learning.

बोधानक: loading...
स्थित: loading...

लेख loading...

बुक बैग में शामिल करें बुक बैग से निकालें

TUKLAS: UP Libraries' Resource Discovery Tool
Copyright © 2020-2021. The University Library, University of the Philippines Diliman