mathjax

2018年1月14日日曜日

機械学習・統計学を知るための参考書

深層学習を理解したいということで、関連する情報を調べ始めた。

 全くの専門外なので、色々な所でお勧めされている資料など、購入したり図書館で借りたりして目を通したりしている。
データサイエンティストもしくは機械学習エンジニアを目指すならお薦めの初級者向け6冊&中級者向け15冊(2017年春版) - 六本木で働くデータサイエンティストのブログ
主にこちら↑の方お勧めを参考とした。

■機械学習

Andrew Ng(アンドリュー・ング)先生が無料で公開しているスタンフォード大学の講義のビデオMachine Learning | Courseraも非常に参考になるのではないかと思う。日本語の字幕も出せる。(まだ1つしか見ていないけれど。)

はじめてのパターン認識
平井 有三
森北出版
しっかりとした教科書という印象で、非常に安心感がある。機械学習の入門としてまずこれを読むのが良いだろうと思われる。

「はじめてのパターン認識」を終えた後に読むと良いであろう資料。かなり初期の段階でこれを読もうと頑張ってしまい、かなりキツかった。5章までは目を通したが、今はまず深層学習を理解することを優先したいため、後回しとしている。(もちろん、機械学習に戻ってきたときには「はじめてのパターン認識」を先に読もうと考えている。)

これからの強化学習
牧野 貴樹 澁谷 長史 白川 真一 浅田 稔 麻生 英樹 荒井 幸代 飯間 等 伊藤 真 大倉 和博 黒江 康明 杉本 徳和 坪井 祐太 銅谷 賢治 前田 新一 松井 藤五郎 南 泰浩 宮崎 和光 目黒 豊美 森村 哲郎 森本 淳 保田 俊行 吉本 潤一郎
森北出版

深層学習の先には、さらに強化学習というものが待ち構えているらしい。推薦されていたので図書館で借りてみた。今の自分には全く分からない内容だけれども、なにか凄く楽しそうな内容に見える。深層学習や機械学習の基礎知識が身に着いた後に、読んでみたい本。

以前に「機械学習というのは何だろう?」と書店で目についた本を幾つか購入した際に入手した本。機械学習が何を目指しているのかの説明が曖昧なままに、各種手法が羅列してあるだけになっていて、初めて機械学習を学ぶ人がこれで理解できるとは到底考えられない。イラストも理解の助けには全く役に立っておらず、買わなければよかったと後悔している一冊。帯には「最小二乗法ナメんじゃないよォ!!!!!」とあり、目にするたびに不快感がつのる。

■統計学
  • 入門
完全独習 統計学入門
ダイヤモンド社
ネイマン・ピアソン統計学の入門書。

完全独習 ベイズ統計学入門
小島 寛之
ダイヤモンド社





 まずは入門としてこの2つ。「深層学習(岡谷孝之著)」を読んでいて、最初の方に‘事後確率’という言葉が出てきて、その意味するところを知るため読んだのが「完全独習 ベイズ統計学入門」。「データ解析のための統計モデリング入門」や「続・わかりやすい パターン認識」などを読んでいると自分がそもそも‘標準偏差’や‘母集団’など、一般常識に近い統計学のことも知らないことに気付き読んだのが「完全独習 統計学入門」。
 特にベイズ統計学は自分が持っている確率のイメージと異なる考え方を学ぶことになったので、それがどういうことなのかイメージで説明をしてくれるこの本は非常に参考になった。但し、数式をなるべく使わないことを目指している本なので、実際に数式が使われている応用の書籍を読む時に、今一度数式を学ぶこととなる。

 但し、これらの統計学の知識は「データ解析のための統計モデリング入門」や「続・わかりやすい パターン認識」を読む為に必要となるが、自分が今一番知りたいのは、深層学習の大枠であり、その後、機械学習を学ぶことになってから「データ解析のための統計モデリング入門」や「続・わかりやすい パターン認識」に進むので、今時点では後回しとすべきものだった。

統計学の入門書として、‘六本木で働くデータサイエンティストのブログ’で推薦されていた本だが、理論的なことをスパッと書かずに、ふんわりと説明してある形式が、自分には合わなかった。

Rによるやさしい統計学
山田 剛史 杉澤 武俊 村井 潤一郎
オーム社
こちらも‘六本木で働くデータサイエンティストのブログ’で推薦されていたが、統計学をRを使って実行してみようという感じの内容。統計学に関する説明もあるが、肝心の所で数式を示さず、Rの実行事例があるのみで、統計学をこれで学ぼうとすると、もどかしさを感じることになる。Rに関しても、実行をしているのみでデータ型や関数の説明などが丁寧にある訳では無く、自分には合わない本だった。


■ベイズ統計
ベイズ統計学の文献(追記あり) | Logics of Blue
こちら↑の方が推薦されている本を幾つか、図書館で借りた。





 ぱっと目を通しただけだが、ベイズ統計学を用いたデータ分析が丁寧に説明されているように見える。後でベイズ統計を深く知る必要が出来たときにはここから始めるのが良さそうだ。




 通称「みどり本」と呼ばれる大変有名な本だということだけれど、初めて読んだときに気になったのは表現の緩さだった。教科書に求められる厳密さというかキッチリとした感じがいささか欠けているような印象を受ける。それでも、最初の方を読んでみただけでも、内容に関しては各種評価が裏付けるように大変有益なものなのだろうと思われるので、後に参考としたい資料であることは間違いない。


 統計が分かったのち、それを使ってどのようにモデリングを行うかという所が学べる資料。図なども多く入っていて、非常に分かり易そうだ。但し、統計学の基礎知識はあることが前提となっていて、知識が不足している場合には「データ解析のための統計モデリング入門」を読んだ後に本書に取り掛かることが推奨されている。


パターン認識と機械学習 上
C.M. ビショップ
丸善出版

翻訳書であることや、本気の専門書であることから、そもそもこれを読むことを考えていなかったけれど、書店にこれがあるのを見つけて開いてみると、何かとても分かり易そうな内容のように見えた。機械学習とベイズ統計の基礎知識がついた後には非常に参考になる資料ではないかと思う。(もしくはそれらを理解するために本書を活用するか。)

また、広島大学の玉木先生が、Udemyに無料の講座を公開してくださっている。これらも非常に参考になるのではないかと思う。
ベイズ推定とグラフィカルモデル:コンピュータビジョン基礎1 | Udemy
画像処理と3次元幾何:コンピュータビジョン基礎2 | Udemy

0 件のコメント:

コメントを投稿