白黒つけようぜ!くまねこ(@kumanecoblog)です。
今日もPython捗っていますか?
Pythonの基礎学習を終えてから、
次はなにをしたらいいのだろう?
と思っていませんか?
そんなあなたに、PythonでWebスクレイピングをするときに役立つ本4選を紹介します。
スクレイピングとは、
簡単に言うと「Webサイトから自動で情報を収集する技術」のことです。
Pythonはデータの加工がやりやすい言語の一つです。
なのでスクレイピングにとても適しています。
基礎学習が終えた方にはもってこいな技術です!
もしくは「Pythonと言ったらスクレイピング!」と思って進んできている方もいるかもしれませんね。そんな方にもおすすめです!
スクレイピングができるようになると、
副業として案件が受けられるようになるよ!
という方の悩みを解決します。
PythonでWebスクレイピングおすすめ本【4選】
おすすめのスクレイピング技術書を4冊ご紹介します。
上から順番に難易度が徐々に上がっていきます。
なので初心者や少し自信がないなという方であれば①か②をおすすめします。
おすすめ①:Python2年生 スクレイピングのしくみ
挫折知らずの無敵なWebスクレイピングの技術書。
初心者には、最強におすすめする一冊です。
技術書は、ちょっとまだ難しくて読みにくいな・・・
と感じている方は、ぜひこの本を選んでください!
僕は初心者の頃に、この本を一冊目に選びました。
1.1 おすすめポイント
おそらく世に出ているWebスクレイピングの技術書の中で、
最も優しくわかりやすい一冊です。
まるで絵本のように豊富なイラストと登場するキャラクター達が会話をしながら進んでいくので
めちゃくちゃわかりやすい。
スクレイピングの基礎と仕組みがしっかりと身につきます。
これを基礎に色々な応用が使えます。
入門編にはこれ以上適した技術書はないと思います。
1.2 注意してほしいところ
とてつもなくわかりやすく書いてある反面、そのまま実務に使うことは少し難しいです。
あくまでスクレイピング入門編として、これを経て次の一冊などに進むのがおすすめです。
そして一番注意すべき点があります。
この本には、Yahooニュースの見出しを取得する項目があります。
しかし、Yahoo側のHTML構造が変更されているので書いてある通りにはできません。
書いてある知識を活用すれば突破できますが、やや高い壁ではあります。
ただ、この壁を乗り越えることができれば、あなたにはかなりのスキルがついている証明にもなります。
良書ではあります。そしてこの壁もいずれ越えなくてはならない壁なので
「その壁、越えてやるぜ!」と思う方はぜひ!
僕はこの本を1冊目に選んでよかったと思っています!
おすすめ②:Python最速データ収集術
今日学んで、明日から実践。
即実践がしたいなら、これしかない!
学んだは良いけれど、どう実践で使ったらいいのかわからない。
これは初心者のうちは誰しも悩むことです。
もしこのように悩んだことがある人はぜひ読んでみてださい。
2.1 おすすめポイント
実際にどんなビジネスシーンで使えるのかイメージしやすいように、
実例とともに書いてあるのがこの本の最大のポイントです。
「自分の仕事場ならここを変えたら使えそうだな」なんて想像しながら学べます。
書いてあることも、超基本的で必要なトピックに絞ってあるので必要以上の情報で混乱することなくスッキリしているので、とてもわかりやすいです。
そして、練習用のWebサイトまで用意されているという手厚いサービスまで付いてきます。
2.2 注意してほしいところ
サポートがやや不親切なので、悩んだときに自分で解決しないといけないことが多いです。
あと、英語キーボード特有の逆スラッシュなど知っていれば問題ないのですが、注釈がないため初心者にはミスリードにつながる可能性が大きいです。
「わからないところは調べて回避する」というスキルはプログラマーとしては必要なスキルです。
なので、「わかりづらいところが出てくるぞ!」ということを頭の片隅において読み進めてください!
良書であるのは間違いないです!
おすすめ③:Pythonクローリング&スクレイピング[増補改訂版]
本格的な技術書として選ぶならこの1冊。
分厚いけれど、それだけしっかり学べる一冊。
少しだけ難しくてもスクレイピングについて深く理解したい!
という方にはおすすめです。
3.1 おすすめポイント
スクレイピングはAPIを使ってスマートにデータを集める時もあれば、
ブラウザーと睨めっこしながら泥臭く作業する時もあります。
この本は、色んなWebサイトに合わせてベストなやり方を選べるようになるために
様々な実例が使われています。
スクレイピングについて基本的なことから実践的なことまで
これ一冊で丸っとスクレイピングのことは身につきます。
特におすすめポイントは、
APIを使ってTwitterやAmazon、YouTubeをスクレイピングして情報取得するが項目として載っているところです。
これは個人的には熱いです。
3.2 注意してほしいところ
目次を読んでみてピンとこない方は少し苦労するかもしれません。
Amazonでも無料サンプルで目次が読めますので一度目を通してみてください。
良書ではありますが、最低限自走できる程度の力がないと解決しきれないところも環境的に出てきます。
ただ、多くの実例が載っているので自分から見てレベルが高そうだと思っても持っていていい一冊です。
おすすめ④:PythonによるWebスクレイピング 第2版
泣く子も黙る、信頼・安心のオライリーです。
かなり発展した内容も載っているので、上の3冊でもまだ足りない!と言う方にオススメです。
4.1 おすすめポイント
ユニットテストや並行化、トラップ回避などかなり発展した内容まで網羅されています。
個人的にとても良いなと思ったポイントは
Webクローリングのフローチャートが載っているところです
スクレイピング関連の本で、その流れをフローチャートで掲載してある本はなかなか出会ったことがありません。
4.2 注意してほしいところ
素晴らしい内容なのですが、致命的な和訳ミスが多くてなかなか読むのが辛いです。
他のオイラリーの本はそんなことはないのいですが、この本だけが特別和訳がよくないようです。
その辺りが感覚的に何が書いてあるのか理解できるのであれば問題ありません。
僕はかなり厳しいなと感じました。
なので、上3冊の知識だけでは物足りない!と言う方のみ、この本を手にすることをオススメします。
ただ、天下のオイラリーなのでかなりの良書です。
まとめ
今回はスクレイピングのおすすめ本を4冊紹介しました。
個人的なおすすめは、初心者であれば
- おすすめ①でスクレイピングとはどんなことができるのかを
手を動かしながら学ぶ - おすすめ②か③の自分の合う方を使う
- 物足りなかったら2で選ばなかった方を使う
- なにか自分でスクレイピングプログラマを作る
です。
本だと最新版を買わないとバージョンの違いで参考にできないというデメリットもありますが、
その反面、出版されるために丁寧に書かれているという利点もあります。
基礎・基本的なことは滅多なことがない限り変わらないので、
基礎・基本を学ぶために本を選ぶのは良い選択だと言えます。
数多く本はありますので自分に合った本で学習を進めていってください!
この記事が少しでも役立ててもらえたらうれしいです。
今回も最後まで読んでいただき、本当にありがとうございました!
コメント