ERR_MNG
漫画(まんが)・電子書籍ならコミックシーモア!
コミックシーモアをご利用の際はWebブラウザの設定でJavaScriptを有効にしてください。
→設定方法はこちら
コミックシーモアをご利用の際はWebブラウザの設定でCookieを有効にしてください。
シーモアを楽しもう!
KS情報科学専門書のオススメ作品
もっと見る
総合ランキング
全書籍から探す
2,800pt/3,080円(税込)
会員登録限定70%OFFクーポンで お得に読める!
会員登録して70%OFFで購入
お気に入りに追加
小説・実用書
ランキング
最新刊を見る
新刊自動購入
「Pythonで強化学習が実装できる!」と好評を得た入門書の改訂版。読者からの要望・指摘を反映させた。主に、Policy GradientとA2Cの記述・実装を見直した。・Pythonプログラミングとともに、ゼロからていねいに解説。・コードが公開されているから、すぐ実践できる。・実用でのネックとなる強化学習の弱点と、その克服方法まで紹介。【おもな内容】Day1 強化学習の位置づけを知る 強化学習とさまざまなキーワードの関係 強化学習のメリット・デメリット 強化学習における問題設定:Markov Decision Process Day2 強化学習の解法(1): 環境から計画を立てる 価値の定義と算出: Bellman Equation 動的計画法による状態評価の学習: Value Iteration 動的計画法による戦略の学習: Policy Iteration モデルベースとモデルフリーとの違いDay3 強化学習の解法(2): 経験から計画を立てる 経験の蓄積と活用のバランス: Epsilon-Greedy法 計画の修正を実績から行うか、予測で行うか: Monte Carlo vs Temporal Difference 経験を価値評価、戦略どちらの更新に利用するか:Valueベース vs PolicyベースDay4 強化学習に対するニューラルネットワークの適用 強化学習にニューラルネットワークを適用する 価値評価を、パラメーターを持った関数で実装する:Value Function Approximation 価値評価に深層学習を適用する:Deep Q-Network 戦略を、パラメーターを持った関数で実装する:Policy Gradient 戦略に深層学習を適用する:Advantage Actor Critic (A2C) 価値評価か、戦略かDay5 強化学習の弱点 サンプル効率が悪い 局所最適な行動に陥る、過学習をすることが多い 再現性が低い 弱点を前提とした対応策Day6 強化学習の弱点を克服するための手法 サンプル効率の悪さへの対応: モデルベースとの併用/表現学習 再現性の低さへの対応: 進化戦略 局所最適な行動/過学習への対応: 模倣学習/逆強化学習Day7 強化学習の活用領域 行動の最適化 学習の最適化
9784065172513
レビュー募集中!
レビュー投稿で最大1000pt!
1位
私が見た未来 完全版
2位
だって望まれない番ですから
3位
拝啓見知らぬ旦那様、離婚していただきます
4位
わたしの幸せな結婚
5位
薬屋のひとりごと画集
6位
国宝
7位
皇帝の薬膳妃 紅き棗と再会の約束
8位
【合本版】絶対城先輩の妖怪学講座
9位
5年で1億貯める株式投資
10位
龍に恋う
11位
異世界居酒屋「のぶ」
12位
NO.6[ナンバーシックス]再会#1 【電子書籍特典ショートストーリー付】
13位
博多豚骨ラーメンズ
14位
近畿地方のある場所について
15位
勝利の女神:NIKKE 公式アートブック
16位
【合本版】世界99
17位
結界師の一輪華
18位
後宮も二度目なら
19位
2025-2026年版 高圧ガス販売主任者試験 第二種販売 攻略問題集
20位
QuizKnock 僕たちの現在地(Quick Japan SPECIAL)
小説・実用書 > 小説・実用書
小説・実用書 > 久保隆宏
小説・実用書 > 講談社
小説・実用書 > KS情報科学専門書