強化学習 - CyberAgent AI Lab

2022.6.26

クールノー競争におけるマルチエージェント強化学習に関する研究

2022.5.17

Anytime Capacity Expansion in Medical Residency Match by Monte Carlo Tree Search

2022.5.17

Computing Strategies of American Football via Counterfactual Regret Minimization

2021.12.21

Off-Policy Exploitability-Evaluation in Two-Player Zero-Sum Markov Games

2021.12.1

見間違えのある繰り返しゲームのためのActor-Critic型強化学習

2021.12.1

反実仮想後悔最小化によるアメリカンフットボールにおけるオフェンス戦略の均衡推定

2021.12.1

見間違えのある繰り返し囚人のジレンマにおける方策勾配法に関する研究

2021.10.17

見間違えのある繰り返しゲームのためのActor-Critic型強化学習

2021.8.27

強化学習

2020.12.11

二人零和マルコフゲームにおけるオフ方策評価のためのQ学習

2020.1.28

Online Learning for Bidding Agent in First Price Auction

2020.1.12

Online Learning for Bidding Agent in First Price Auction