People
阿部 拳之
Kenshi Abe
発表論文
-
Policy Gradient Algorithms with Monte-Carlo Tree Learning for Non-Markov Decision Processes
論文誌・国際会議
Reinforcement Learning Conference (RLC) 2024
-
Model-based minimum bayes risk decoding
論文誌・国際会議
ICML 2024
-
Adaptively Perturbed Mirror Descent for Learning in Games
論文誌・国際会議
ICML 2024
-
研修医配属における地域間格差を調整する制約のモンテカルロ木探索
国内学会/セミナー
情報処理学会 第86回全国大会
-
二人零和マルコフゲームにおける状態抽象化法に関する研究
国内学会/セミナー
情報処理学会 第86回全国大会
-
Scalable and Provably Fair Exposure Control for Large-Scale Recommender Systems
論文誌・国際会議
WWW 2024
-
Learning Fair Division from Bandit Feedback
論文誌・国際会議
AISTATS 2024
-
Memory Asymmetry Creates Heteroclinic Orbits to Nash Equilibrium in Learning in Zero-Sum Games
論文誌・国際会議
AAAI 2024
-
オンライン環境において公平な資源配分を実現するアルゴリズムに関する研究
国内学会/セミナー
IBIS 2023
-
Learning in Multi-Memory Games Triggers Complex Dynamics Diverging from Nash Equilibrium
国内学会/セミナー
IBIS 2023
-
Zero-Variance Perturbation Utiity for Extensive-Form Games
国内学会/セミナー
IBIS 2023
-
A Slingshot Approach to Learning in Monotone Games
国内学会/セミナー
IBIS 2023
-
オンライン環境において公平な資源配分を実現するアルゴリズムに関する研究
国内学会/セミナー
FIT 2023
-
研修医配属における地域間格差を調整する制約のモンテカルロ木探索
国内学会/セミナー
FIT 2023
-
Exploration of Unranked Items in Safe Online Learning to Re-Rank
論文誌・国際会議
SIGIR2023
-
Learning in Multi-Memory Games Triggers Complex Dynamics Diverging from Nash Equilibrium
論文誌・国際会議
IJCAI 2023
-
オンライン環境において公平な資源配分を実現するアルゴリズムに関する研究
国内学会/セミナー
JSAI 2023
-
二人零和展開型ゲームにおける突然変異付き乗算型重み更新に関する研究
国内学会/セミナー
JSAI 2023
-
Last-Iterate Convergence with Full and Noisy Feedback in Two-Player Zero-Sum Games
論文誌・国際会議
AISTATS 2023
-
タスク指向対話システムのPolicy学習へのDecision Transformerの適用
国内学会/セミナー
NLP 2023
-
タスク指向対話における強化学習を用いた対話方策学習への敵対的学習の役割の解明
国内学会/セミナー
NLP 2023