ERR_MNG
漫画(まんが)・電子書籍ならコミックシーモア!
コミックシーモアをご利用の際はWebブラウザの設定でJavaScriptを有効にしてください。
→設定方法はこちら
コミックシーモアをご利用の際はWebブラウザの設定でCookieを有効にしてください。
シーモアを楽しもう!
KS情報科学専門書のオススメ作品
もっと見る
総合ランキング
全書籍から探す
2,800pt/3,080円(税込)
会員登録限定70%OFFクーポンで お得に読める!
会員登録して70%OFFで購入
お気に入りに追加
小説・実用書
ランキング
最新刊を見る
新刊自動購入
「Pythonで強化学習が実装できる!」と好評を得た入門書の改訂版。読者からの要望・指摘を反映させた。主に、Policy GradientとA2Cの記述・実装を見直した。・Pythonプログラミングとともに、ゼロからていねいに解説。・コードが公開されているから、すぐ実践できる。・実用でのネックとなる強化学習の弱点と、その克服方法まで紹介。【おもな内容】Day1 強化学習の位置づけを知る 強化学習とさまざまなキーワードの関係 強化学習のメリット・デメリット 強化学習における問題設定:Markov Decision Process Day2 強化学習の解法(1): 環境から計画を立てる 価値の定義と算出: Bellman Equation 動的計画法による状態評価の学習: Value Iteration 動的計画法による戦略の学習: Policy Iteration モデルベースとモデルフリーとの違いDay3 強化学習の解法(2): 経験から計画を立てる 経験の蓄積と活用のバランス: Epsilon-Greedy法 計画の修正を実績から行うか、予測で行うか: Monte Carlo vs Temporal Difference 経験を価値評価、戦略どちらの更新に利用するか:Valueベース vs PolicyベースDay4 強化学習に対するニューラルネットワークの適用 強化学習にニューラルネットワークを適用する 価値評価を、パラメーターを持った関数で実装する:Value Function Approximation 価値評価に深層学習を適用する:Deep Q-Network 戦略を、パラメーターを持った関数で実装する:Policy Gradient 戦略に深層学習を適用する:Advantage Actor Critic (A2C) 価値評価か、戦略かDay5 強化学習の弱点 サンプル効率が悪い 局所最適な行動に陥る、過学習をすることが多い 再現性が低い 弱点を前提とした対応策Day6 強化学習の弱点を克服するための手法 サンプル効率の悪さへの対応: モデルベースとの併用/表現学習 再現性の低さへの対応: 進化戦略 局所最適な行動/過学習への対応: 模倣学習/逆強化学習Day7 強化学習の活用領域 行動の最適化 学習の最適化
9784065172513
レビュー募集中!
レビュー投稿で最大1000pt!
1位
私が見た未来 完全版
2位
だって望まれない番ですから
3位
拝啓見知らぬ旦那様、離婚していただきます
4位
皇帝の薬膳妃 紅き棗と再会の約束
5位
わたしの幸せな結婚
6位
法医学ミステリー「ヒポクラテス」
7位
光学機器大全
8位
刀剣乱舞絢爛図録
9位
アラベスク後宮の和国姫
10位
京都伏見のあやかし甘味帖
11位
新装版 三国志
12位
NO.6[ナンバーシックス]再会#1 【電子書籍特典ショートストーリー付】
13位
汝、星のごとく
14位
アニメ「オーバーロード」完全設定資料集
15位
彼女と彼の関係
16位
変な家2 ~11の間取り図~
17位
A3! Official Memorial Book
18位
都会のトム&ソーヤ
19位
ワイルドビースト
20位
フォース・ウィング
小説・実用書 > 小説・実用書
小説・実用書 > 久保隆宏
小説・実用書 > 講談社
小説・実用書 > KS情報科学専門書