辛辞苑
ホーム
タグ
カテゴリー
このページについて
ja
#報酬設計
強化学習 - きょうかがくしゅう
強化学習とは、獲得できる報酬だけを頼りに行動する電子の迷える子羊。期待する報酬が得られぬ時にはひたすら試行錯誤を繰り返し、その様はまるで答えも知らぬまま永遠の迷路をさまよう哲学者のよう。些細な報酬で大喜びし、失敗には無関心というメンタリティは、人間のやる気と絶望を切り取った怪物とも言える。実装者たちは最適解を夢見つつ、いつしか報酬設計という名の呪縛に囚われる。時折披露される奇妙な行動は、観察者を困惑させるお約束の儀式である。