Q学習とは？

きゅーがくしゅう

IT・テクノロジー #機械学習

状態と行動の価値関数を反復更新する強化学習アルゴリズム。

各状態-行動ペアの期待累積報酬をQ値として表で管理しベルマン方程式に基づく更新式で繰り返し最適化する強化学習のモデルフリーアルゴリズム。

使い方・例文

迷路ゲームのエージェントがQ学習で最短経路を自動的に学習する。

この用語をシェア

𝕏 でポスト LINE

最終更新: 2026年6月30日

関連用語