仕事と晩飯とその他

日記です。

読んですぐ理解というわけにはいかないのが当たり前だなあ

『ゼロから作る Deep Learning』、githubから落としてきたコードを読んだり実際に動かしてみたり、どうしてもわからない話や使い方がイマイチ不明なメソッドを検索したりなんだりを何度も繰り返してなんとか読み終えた。とはいえ、後半は実際に動かすというより読む→わからないことを検索してなんとなく把握→読む→よくわかっていないようなので検索→なんとなく把握→読むの繰り返しとどん詰まり。誤差逆伝播法のあたり、やっぱりよくわかってない。あとレイヤーの実装についても、一度読んだ程度では自分には無理っぽい。

ということで、通読して得られたのは「Deep Learningというのはこういうことをやっていたのか」というざっくりとした把握(理解とは言ってない)と、用語に戸惑わない程度の基礎知識、あと、Pythonの書き方については随分と勉強になった(とはいえ、これも自由に書けるほどのモノにはなっていない)。

事前にほんの少しだけかじっておいてよかったなあと思ったのは、数年前にやり直した数Ⅲの微積+教養課程程度の解析幾何の基礎と画像認識(Computer Vision)の畳み込みと微分≒差分とかそのあたり。勾配って傾きだから微分≒差分でOKなんだなあ。解析的な諸々をプログラムで表すっていうのはなかなか面白いなあ(とはいえ、そこのツボである誤差逆伝播法はイマイチわかっていないのだが)。

なんというか、一度通読した程度の「分かる!」とか「実装できる!」とか、そういう類の本ではないことはよくわかった。ので、ちょっと時間をおいてから再読する予定。

プログラミングの本でも人文科学でもなんでもそうだと思うが、「通読すれば分かる」ではない本というのはたくさんある。というか、エンタメでもなんでも、前提知識が必要な本であればだいたいそうだろう。なので、自戒を込めて思うのは、「すぐに分かる」とか、そういうのはやっぱりちょっとアレなのかも知れない。

などと、そんなことを思った連休も残り一日。明日は残った宿題のいくつかを片付ける予定。