阿部拳之 - CyberAgent AI Lab

People

阿部拳之

Kenshi Abe

2017年に東京工業大学大学院総合理工学研究科を修了後、株式会社ハル研究所でゲーム開発に携わる。2018年にサイバーエージェントに入社し、AI Labではマルチエージェント強化学習，不完全情報ゲームに関する研究に従事。

発表論文

Policy Gradient Algorithms with Monte-Carlo Tree Learning for Non-Markov Decision Processes

論文誌・国際会議

Reinforcement Learning Conference (RLC) 2024
Model-based minimum bayes risk decoding

論文誌・国際会議

ICML 2024
Adaptively Perturbed Mirror Descent for Learning in Games

論文誌・国際会議

ICML 2024
研修医配属における地域間格差を調整する制約のモンテカルロ木探索

国内学会/セミナー

情報処理学会第86回全国大会
二人零和マルコフゲームにおける状態抽象化法に関する研究

国内学会/セミナー

情報処理学会第86回全国大会
Scalable and Provably Fair Exposure Control for Large-Scale Recommender Systems

論文誌・国際会議

WWW 2024
Learning Fair Division from Bandit Feedback

論文誌・国際会議

AISTATS 2024
Memory Asymmetry Creates Heteroclinic Orbits to Nash Equilibrium in Learning in Zero-Sum Games

論文誌・国際会議

AAAI 2024
オンライン環境において公平な資源配分を実現するアルゴリズムに関する研究

国内学会/セミナー

IBIS 2023
Learning in Multi-Memory Games Triggers Complex Dynamics Diverging from Nash Equilibrium

国内学会/セミナー

IBIS 2023
Zero-Variance Perturbation Utiity for Extensive-Form Games

国内学会/セミナー

IBIS 2023
A Slingshot Approach to Learning in Monotone Games

国内学会/セミナー

IBIS 2023
オンライン環境において公平な資源配分を実現するアルゴリズムに関する研究

国内学会/セミナー

FIT 2023
研修医配属における地域間格差を調整する制約のモンテカルロ木探索

国内学会/セミナー

FIT 2023
Exploration of Unranked Items in Safe Online Learning to Re-Rank

論文誌・国際会議

SIGIR2023
Learning in Multi-Memory Games Triggers Complex Dynamics Diverging from Nash Equilibrium

論文誌・国際会議

IJCAI 2023
オンライン環境において公平な資源配分を実現するアルゴリズムに関する研究

国内学会/セミナー

JSAI 2023
二人零和展開型ゲームにおける突然変異付き乗算型重み更新に関する研究

国内学会/セミナー

JSAI 2023
Last-Iterate Convergence with Full and Noisy Feedback in Two-Player Zero-Sum Games

論文誌・国際会議

AISTATS 2023
タスク指向対話システムのPolicy学習へのDecision Transformerの適用

国内学会/セミナー

NLP 2023
タスク指向対話における強化学習を用いた対話方策学習への敵対的学習の役割の解明

国内学会/セミナー

NLP 2023