Pythonでスクレイピングすると403が返ってくる場合の打開策: Selenium



あるWebサービスをPythonでスクレイピングしようとしたら、403が返ってきました。どうやらWebサービス側でスクレイピングをブロックしているようです。他に方法がないか探してみたところ、PythonとSeleniumでできるようでした。これは、Webブラウザを自動で操作するという方法です。実際、この方法で問題なくスクレイピングできました。

過去に図書館のサイトのデータをスクレイピングして逮捕された人もいるので、サーバへの負荷には十分注意したいです。

スポンサードリンク

関連記事