• OFF
  • ON
シークレットモード
つくりながら学ぶ!深層強化学習 PyTorchによる実践プログラミング

つくりながら学ぶ!深層強化学習 PyTorchによる実践プログラミング

作者: 株式会社電通国際情報サービス小川雄太郎

価格 3608(税込)
獲得dポイント 32 PT

※WebIDからdアカウントへ移行すると、dポイントをためる・つかうことができます。詳しくは こちら

作品内容

※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。

強化学習、さらにディープラーニングを組み合わせた深層強化学習DQN(Deep Q-Network)という用語を目にする機会が増えています。本書は関連の概念を分かりやすく解説しつつ、Python+PyTorchで「倒立振子課題」「迷路を解くプログラム」「ブロック崩しの攻略」を実装していきます。

第1章「強化学習の概要」では機械学習とその3分類(教師あり学習、教師なし学習、強化学習)について紹介します。

第2章「迷路課題に強化学習を実装しよう」では、簡単な強化学習(方策勾配法、Sarsa、Q学習)のコードをひとつずつ実装しながら、強化学習のアルゴリズムと実装方法を理解します。迷路を最短ルートでゴールするよう強化学習させます。

第3章「倒立振子課題に強化学習を実装しよう」では、2章で学んだ強化学習の基本をより複雑な課題へ適用します。倒立振子とは、“ほうきを手のひらの上に立てる”遊びと同じ内容でその制御ルールを強化学習させます。Anacondaを用いたセットアップ方法も解説します。

第4章「Pytorchでディープラーニングを実装しよう」では、ディープラーニングの内容を理解し、PyTorchで実装します。ニューラルネットワークとディープラーニング発展の歴史、学習フェイズと推論フェイズについて解説。最後に手書き数字の画像を分類するMNIST課題を実装解説します。

第5章「深層強化学習DQNを実装しよう」では、強化学習にディープラーニングを組み合わせた“深層強化学習”を理解し、DQNを実装できるようにします。第3章の倒立振子課題に対してDQNを実装します。

第6章「深層強化学習の発展版を実装しよう」では、新しい深層強化学習の手法、Double-DQN、Dueling Network、Prioritized Experience Replay、そしてA3C、A2Cを理解し、実装できるようにします。

第7章「AWSのGPU環境でブロック崩しを実装しよう」では、ブロック崩しゲームを対象に深層強化学習のA2Cを実装します。実行環境としてAmazonのクラウドサービスAWSのGPU環境を使用する方法も解説します。 + 続きを読む

作品情報

出版社
ジャンル ビジネス・実用等 > ビジネス・経済・IT
掲載雑誌
レーベル名
シリーズ
電子版発売日 2018/07/06
紙の本発売日 2018/06/28 ( 2010年代 )
ページ数: P240
対応端末
  • カートに入れる

  • ほしい物リストへ
  • ひかりTVブック BLレーベル『pirka2(ピリカピリカ)』

現在N巻まで配信中

表示切替 :

表示大 詳 細
全巻カートに入れる 未購入巻全てカートに入れる
全巻カートに入れる 未購入巻全てカートに入れる

作者の他作品

ビジネス・経済・ITのランキング

一覧 》
  • 週間
  • 月間