一般の人にはあまり馴染みのない単語かもしれません。
スクレイピングというのは、日本語で「削り取る」といった意味になります。
Webスクレイピング・・・WebサイトからWebページのHTMLデータを収集して、特定のデータを抽出、整形し直すことである。(weblio辞書より)
もし手作業で行おうとすると、
①Webブラウザを立ち上げる
②該当サイトのURLを入力する
③特定の文字や数字を入力する
④表示されている文字や数字を紙やエクセルに打ち込んでいく(反復)
といった流れになります。
この一連の作業をRPAで自動化できます。
さて、こういった作業に対して需要があるのでしょうか?
<Webスクレイピングの事例(その1)>
ECサイトを運営していると、競合他社の動きはとても重要です。
インターネット上で、何が売れていて、どの程度の価格なのかという情報をあると、販売戦略を考える上で、とても役に立ちます。
もちろん、Webスクレイピング無しで、手作業でも行えなくはないですが、商品数が多くなると、対応が難しくなってきますよね。
1日に3回行っていたのが、1日1回がやっとになったり。。
そこをRPAで自動化することにより、特定のサイト情報をエクセルシート等にまとめ、一目瞭然に状況を把握できるようになります。
特にECサイト運営の場合、市場の状況変化に対して瞬時に対応することで、売上はもちろん在庫管理にも良い影響を与えます。
また、なんとなくサイトを見ていた時には気づかなかった掘り出し物を見つけれるかもしれません。
他の人よりもいち早くブームに乗り、いち早く売り抜けるといったことにもデータは役立つでしょう。
<Webスクレイピングの事例(その2)>
某ホテルを経営している会社のスタッフは、毎日上司にメールにて報告を行っています。
それは、ホテルの某ランキングサイトにおいて、「自社が顧客満足度何位であるか?」はもちろん、「どの点が評価され、どの点が不満に思われているのか?」という情報です。
該当のサイトを開いて、文章や画像をコピペして、メールにペースト&添付して送信するのです。
毎日のルーチンワークで、今ではそれほど時間も掛からずまとめることが出来るようになっていますが、それでも年間で言えば、かなり時間を要しています。
そこで「RPA」の出番です。
RPAの「Webスクレイピング」機能を使い、指定のテキスト(文章)はもちろん、場合によってはグラフなどの図まで、抽出することができます。
更に、「RPA」はメールの送信まで自動化することができるのです!
なので、結果として、
①何時何分に
②誰宛に
③どういった内容の本文と
④添付ファイルをつけるか
といったところまで、自動化出来てしまいます。
つまりは、今まで手動で担当者が行っていたことを全て代行させることができるのです!
Attention!・・・Webスクレイピングは、簡単に出来る場合とそうでない場合があります。
該当のサイトの造りがシンプルなデータテーブルであれば、簡単に抽出設定できるのですが、複雑な造りになっている場合、HTMLやCSSといった専門知識が必要になってきます。
また、サイトによっては、Webスクレイピングはサーバに負荷がかかるため、禁止されている場合もあります。