<図書>
強化学習編
キョウカ ガクシュウ ヘン
責任表示 | 斎藤康毅著 |
---|---|
シリーズ | ゼロから作るdeep learning ; 4 |
データ種別 | 図書 |
出版情報 | 東京 : オライリー・ジャパン 東京 : オーム社 (発売) , 2022.4 |
本文言語 | 日本語 |
大きさ | xviii, 355p : 挿図 ; 21cm |
概要 | 人気シリーズの第4弾。今回のテーマは強化学習です。実際のコードを提示し動かしながら学ぶという本シリーズのスタイルを踏襲し、外部ライブラリに頼らず、強化学習を支える基本的な技術やアイデアをゼロから実装しながら学びます。本書では読者が強化学習独特の理論を確実にマスターできるように、強化学習という難解なテーマの構成要素の一つひとつを「理論」と「実践」の双方から丁寧に解説します。数式だけで説明する理論書と...異なり、読者はコードを通してハッとする気づきを数多く得られるでしょう。続きを見る |
目次 | 1章 バンディット問題 2章 マルコフ決定過程 3章 ベルマン方程式 4章 動的計画法 5章 モンテカルロ法 6章 TD法 7章 ニューラルネットワークとQ学習 8章 DQN 9章 方策勾配法 10章 さらに先へ 付録続きを見る |
所蔵情報
状態 | 巻次 | 所蔵場所 | 請求記号 | 刷年 | 文庫名称 | 資料番号 | コメント | 予約・取寄 | 複写申込 | 自動書庫 |
---|---|---|---|---|---|---|---|---|---|---|
|
|
中央図 4A | 007.13/Sa 25 | 2022 |
|
110012023004781 |
|
|||
|
|
理系図1F 開架 | 007.13/Sa 25 | 2022 |
|
130012022006511 |
|
|||
|
|
筑紫図 1B 000-399 | 007.13/Sa 25 | 2022 |
|
160012024000998 |
|