লেখক অনুসন্ধানের ফলাফল

প্রদর্শিত প্রলেখ সংখ্যা 1
1

A Reinforcement Learning Algorithm Based on Policy Iteration for Average Reward Empirical Results with Yield Management and Convergence Analysis. অনুযায়ী Gosavi, Abhijit

প্রকাশিত Machine learning.

ডাক সংখ্যা: loading...
অবস্থিত: loading...

প্রবন্ধ loading...

গ্রন্থসম্ভারে রাখুন গ্রন্থসম্ভার থেকে মুছুন

TUKLAS: UP Libraries' Resource Discovery Tool
Copyright © 2020-2021. The University Library, University of the Philippines Diliman