Výsledky hledání pro autora

Vybrat výsledek číslo 1
1

A Reinforcement Learning Algorithm Based on Policy Iteration for Average Reward Empirical Results with Yield Management and Convergence Analysis. Autor Gosavi, Abhijit

Vydáno v Machine learning.

Signatura: loading...
Umístění: loading...

Článek loading...

Přidat do košíku Vyjmout z košíku

TUKLAS: UP Libraries' Resource Discovery Tool
Copyright © 2020-2021. The University Library, University of the Philippines Diliman