
クールノー競争におけるマルチエージェント強化学習に関する研究
クールノー競争におけるマルチエージェント強化学習に関する研究
Anytime Capacity Expansion in Medical Residency Match by Monte Carlo Tree Search
Computing Strategies of American Football via Counterfactual Regret Minimization
Off-Policy Exploitability-Evaluation in Two-Player Zero-Sum Markov Games
Mean Variance Efficient Reinforcement Learning
見間違えのある繰り返しゲームのためのActor-Critic型強化学習
反実仮想後悔最小化によるアメリカンフットボールにおけるオフェンス戦略の均衡推定
見間違えのある繰り返し囚人のジレンマにおける方策勾配法に関する研究
見間違えのある繰り返しゲームのためのActor-Critic型強化学習
強化学習
二人零和マルコフゲームにおけるオフ方策評価のためのQ学習
Online Learning for Bidding Agent in First Price Auction
Online Learning for Bidding Agent in First Price Auction
Contact