Soft Actor-Critic 強化学習を用いた系列推薦フレームワーク
雑誌・プロシーディングス名: 情報処理学会第 86 回全国大会講演論文集
開催地(都道府県): 横浜
国名(英語): Japan
言語: Japanese
Vol.: 第1分冊
ページ: 437--438
出版年: 2024
出版月: 3
出版日: 2024-03-15
受賞: 学生奨励賞
概要
近年の推薦システムでは,ユーザの次の行動を予測する系列推薦に強化学習を利用することで推薦性能が向上することが知られている.系列推薦システムにおける強化学習は,ユーザの嗜好の変化を把握することが重要であリ,その行動パターンを効率的に学習できるSoft Actor-Critic (SAC) が注目されている.しかし,SAC を系列推薦に適用すると,推薦項目の選択に対応する価値が過大評価される可能性がある.そこで,本研究ではSAC を系列推薦に適用するために,推薦項目を選択する環境とその選択に対応する価値を共有する系列推薦フレームワークを提案する.
引用情報
洪 惠珍, 木村 優介, 波多野 賢治, Soft Actor-Critic 強化学習を用いた系列推薦フレームワーク, 情報処理学会第 86 回全国大会講演論文集, Vol.第1分冊, pp.437--438, 2024-03-15.