aircolor memolog

Web制作・テクノロジー、たまに旅行記

書評:「Pythonクローリング&スクレイピング ―データ収集・解析のための実践開発ガイド」を読んだ

会社で参考書を購入した際に「読み終わったら書評書いてね」と言われたので、しばらくぶりに書評などを書いてみる。

2017年発行の書籍で購入したのは今年の9月。発行から1年経っているのだが、評判もよく、情報収集・解析にも興味があったので購入しました。

タイトルの通り「クローリング&スクレイピング」に特化した内容で、事前にある程度のPythonの基礎知識が必要。単純にクローリング&スクレイピングの道具として使うだけなら「Pythonの基礎知識」の部分だけでも事は足りるが、やはり別にPython入門本などで学習した上で見ることを推奨。

第1章から第2章あたりまでがスクレイピング・クローリングの基礎知識、Pythonの文法、基本的なスクレイピング手法の紹介。第3章から第6章はbeautifulsoup、scrapyなどの強力なライブラリやフレームワークを使った、実務にも使える実装手法を紹介している。

所感

Pythonを使うという手法に縛られず、スクレイピングとクローリングに標準を合わせた基礎知識と実践手法を知れるので、網羅的に知りたい人にオススメ。特に後半のScrapyについての説明は実用性が高く、いろいろな情報取得に使える!と思わせられる。コードサンプルも多く、手を動かしながら学習できるので読み応えありです。

推しポイント

習得したデータの活用方法もしっかり紹介している点が素晴らしいです。特に良いと思ったのはBigQueryの利用・地図データの可視化・OpenCVによる顔画像の抽出、AWSでの利用など。収集したデータで何ができるかを知れるので、そのあたりが曖昧にしか分からない人にとって、よいモチベーションを与えてくれると思います。

こんな方にオススメ

  • スクレイピングやクローリングに興味がある
  • 情報収集・解析をしたい
  • サービスを作るに当たって、必要なデータを収集したい
  • 収集したデータをどうやって使うか迷っている

データ収取・解析の際に手元に置いておきたい一冊です。