坂本充生 - CyberAgent AI Lab

People

坂本充生

Mitsuki Sakamoto

2022年に電気通信大学大学院修士課程を修了。

2023年にリサーチエンジニアとしてサイバーエージェントに中途入社。強化学習に関する研究開発に従事。

発表論文

Adaptively Perturbed Mirror Descent for Learning in Games

論文誌・国際会議

ICML 2024
Zero-Variance Perturbation Utiity for Extensive-Form Games

国内学会/セミナー

IBIS 2023
A Slingshot Approach to Learning in Monotone Games

国内学会/セミナー

IBIS 2023
二人零和展開型ゲームにおける突然変異付き乗算型重み更新に関する研究

国内学会/セミナー

JSAI 2023
Last-Iterate Convergence with Full and Noisy Feedback in Two-Player Zero-Sum Games

論文誌・国際会議

AISTATS 2023
Last-Iterate Convergence with Full- and Noisy-Information Feedback in Two-Player Zero-Sum Games

国内学会/セミナー

IBIS 2022
二人零和ゲームにおける突然変異駆動型Follow-The-Regularized-Leaderの終極反復収束

国内学会/セミナー

FIT 2022
二人零和ゲームにおける突然変異付きレプリケータダイナミクスを用いた学習アルゴリズムに関する研究

国内学会/セミナー

JSAI 2022
Mutation-Driven Follow the Regularized Leader for Last-Iterate Convergence in Zero-Sum Games

論文誌・国際会議

UAI 2022
二人零和ゲームにおける突然変異付きレプリケータダイナミクスを用いた学習アルゴリズムに関する研究

国内学会/セミナー

情報処理学会第84回全国大会
クールノー競争におけるマルチエージェント強化学習に関する研究

国内学会/セミナー

情報処理学会第84回全国大会
見間違えのある繰り返しゲームのためのActor-Critic型強化学習

国内学会/セミナー

IBIS 2021
見間違えのある繰り返し囚人のジレンマにおける方策勾配法に関する研究

国内学会/セミナー

FIT 2021
見間違えのある繰り返しゲームのためのActor-Critic型強化学習

国内学会/セミナー

日本オペレーションズ・リサーチ学会 2021年秋季研究発表会