
Learning in Multi-Memory Games Triggers Complex Dynamics Diverging from Nash Equilibrium
Learning in Multi-Memory Games Triggers Complex Dynamics Diverging from Nash Equilibrium
Zero-Variance Perturbation Utiity for Extensive-Form Games
A Slingshot Approach to Learning in Monotone Games
オンライン環境において公平な資源配分を実現するアルゴリズムに関する研究
研修医配属における地域間格差を調整する制約のモンテカルロ木探索
Rate-Optimal Bayesian Simple Regret in Best Arm Identification
An Optimal Clustering Algorithm for the Labeled Stochastic Block Model
Learning in Multi-Memory Games Triggers Complex Dynamics Diverging from Nash Equilibrium
オンライン環境において公平な資源配分を実現するアルゴリズムに関する研究
二人零和展開型ゲームにおける突然変異付き乗算型重み更新に関する研究
Last-Iterate Convergence with Full and Noisy Feedback in Two-Player Zero-Sum Games
タスク指向対話システムのPolicy学習へのDecision Transformerの適用
タスク指向対話における強化学習を用いた対話方策学習への敵対的学習の役割の解明
研修医配属における地域間格差を調整するための制約のモンテカルロ木探索
オンライン環境において公平な資源配分を実現するアルゴリズムに関する研究
Thresholded Lasso Bandit
ビームサーチ推論のための強化学習
Last-Iterate Convergence with Full- and Noisy-Information Feedback in Two-Player Zero-Sum Games
強化学習一般
Mutation-Driven Follow the Regularized Leader for Last-Iterate Convergence in Zero-Sum Games
二人零和ゲームにおける突然変異付きレプリケータダイナミクスを用いた学習アルゴリズムに関する研究
Contact