ChatGPTの新バージョン、出ましたね!
推論機能がついたとのことで、今までよりも間違いが少なくなるそうです。
正直、ChatGPTの先行性優位が落ちてきていますから、有償版に関してはぶっちぎりの性能を発揮して欲しいものです。
そんなこんなで、AIバブルと言われるような様相を呈していて、世界中でAIの性能アップ、AIの用途を探っている状態です。
では、RPAにもその影響はあるのでしょうか?
RPA現場の最前線にいるものとして、それについて語ってみたいと思います。
■20年後、RPAは無くなっているのか?
結論から言えば、「RPAは無くならない」です。
ただ、「30年後くらいには、RPAという単語を使う人はいなくなる」と思っています。
理由としては、RPAの機能が完全にAIに取り込まれてしまうからです。
2024年の現在において、RPAツール(デスクトップ型)は、まだまだ難易度が高いです。
プログラミングの基礎知識も必要だし、自動化対象によってはUI要素やネットワークの知識も問われます。
実際の作業としても、複数のパーツを選んで組み上げていくという地味な作業の繰り返しで、案外自動化するにも時間が掛かるのです。
マイクロソフトのPowerAutomateDesktopにおいては、毎月バージョンアップされていますが、正直あまり使えると思える機能追加は無いですね。
個人的に一番欲しいと思うのは、「画像認識の精度アップ」でしょうか。
これは登場当時から変わっていないように思えるのですが、どうなのでしょう。
ここが人間の目視レベルで機能するようになれば、随分楽になるのに。
まあ、無償でそこまで望むのも欲張りすぎなのかもしれません。
20年後のRPAはどのようになっているのか?をもっと深堀してみましょう。
■20年後以降のRPAツールの方向性は?
もし今、私がRPAツールの開発チームにいたとして、目指すべき方向は?
ズバリ「手動作業時の動画を読み込ませることで、それを自動的にロボット(アクション)に変換する」と思います。
もちろん、そのために動画に映っている画像をAIで認識・識別して1つ1つのアクションに落とし込んでいく必要があるので、AIとの融合度合が桁違いです。
現在でも「レコーダー機能」がありますが、多くの場合において手直ししなくてはいけない箇所が多く、それならば普通に作った方が早いという状態です。
ただ、いくら動画で読み込んだものがそのまま再現されたとしても、1つの動画では1つのルートしか作成されません。
多くの場合、条件分岐もあればループもあります。
そこを再現させるための工夫も必要になってくるでしょう。
動画の中の音声(人間の声)も読み取って反映させるとか、複数のルート処理がされた動画を読み込ませて、それをRPA側で統一させるといった感じでしょうか。
■結局、何が残るのか?
うーん、そう考えるとどちらにしても、やはり最後の部分は人の手が介在しないと完璧にはなりそうにないですね。
「ちょっとの変更」といっても、作成されているものを読み取り理解し、適切な場所に適切なアクションを差し込むスキルが必要ですから、業務で問われるスキルレベルという意味ではそこまで劇的に誰にでも扱えるツールになるとは思えませんね。
他のケースでもそうですが、「生成AIが無くても時間を掛ければ手作業でも出来る人」にとって大きな時間短縮となるツールであり、一番恩恵があるのも熟練者であることには変わりないのかもしれません。
もちろん、単価は大きく下がるでしょうから、数こなす必要は出てくるでしょう。
生成AIが得意としているプログラミングも、同じような未来が予想されています。
上流と言われる「要件定義」などが正しく行えるスキルの高い人の需要は残り続けるでしょうが、コーディングといった下流の人の仕事は近い将来生成AIに代替されていくのでしょう。
ミュージシャンがCDを売っても儲からなくなり、ライブで稼ぐことにシフトせざるを得ないようになったように、ビジネスモデルの転換が必要になりそうです。