こんにちは、しらすです。
「Amazonのスクレイピングは禁止」とよく見かけたのですが、よくよく調べると実は完全に禁止ではない様子。今回はこの部分を調査した結果をまとめておきたいと思います。
スクレイピングに関するAmazonの規定
スクレイピングに関してはAmazonの規約に記載されています。
オレンジ枠の部分が今回の該当部分となり「この利用許可には~中略~ロボットなどのデータ収集、抽出ツールの使用は、一切含まれません。」とあります。この規約により、Amazonのスクレイピングは禁止と言われています。
規約はログインしていないと適用されない?
この規約はAmazon側が出しているものであり、使用者側と合意(=ログインした状態)して初めて有効になる様子。そのため、ログインしていない状態ではこの規約に強制力がなくなってきます。
もちろん、サーバーアタックととられるような”大規模な攻撃”ととらえられた場合は法律的に罰則を受けますが、良識の範囲で個人の勉強利用程度(人間が出せるアクセス速度程度)なら問題はありません。
そもそも、Web上に公開されている情報を見る場合、人が直接目で見ようがロボットでスクレイピングしようが、アクセスされる側からすれば違いはあまりないわけです。
結論、ログイン不要な公開情報ならスクレイピングで取得してもいいが、アクセス速度/量は注意
上記を総合すると、ログインせずに入手できる公開情報はスクレイピングで取得してもよさそうです。ただし、攻撃ととらえられないようアクセス速度とアクセス量は十分に注意が必要です。基本的には個人の勉強などでの利用にとどめる方がよいと思われます。
参考
https://www.amazon.co.jp/gp/help/customer/display.html?nodeId=201909000
スクレイピング禁止のAmazonからレビューを抜き出す【Python】
「Amazonは利用規約でスクレイピングが禁止されている」このことを信じて、Amazonをスクレイピングするのをあきらめていませんか?私は堂々とAmazonのレビューをスクレイピングしています。この理由をこの記事では説明しています。
コメント