
クールノー競争におけるマルチエージェント強化学習に関する研究
クールノー競争におけるマルチエージェント強化学習に関する研究
Computing Strategies of American Football via Counterfactual Regret Minimization
見間違えのある繰り返しゲームのためのActor-Critic型強化学習
反実仮想後悔最小化によるアメリカンフットボールにおけるオフェンス戦略の均衡推定
見間違えのある繰り返し囚人のジレンマにおける方策勾配法に関する研究
見間違えのある繰り返しゲームのためのActor-Critic型強化学習
Online Learning for Bidding Agent in First Price Auction
Online Learning for Bidding Agent in First Price Auction
Contact