生成AIというと、一番気になるのは、その回答精度ではないでしょうか!?

実際、その精度が生成AIの発達度を示す一番の指標でしょう。

ChatGPTのようなテキスト生成AIの仕組みは、ご存知の通り、世の中にあるデータをかき集めて、それっぽく喋っているといっても過言ではありません。

2024年12月の段階では、OpenAIにおいてもう読み込ませるデータが枯渇し始めているのだとか。

つまり、単純に多くのデータを学習させてもこれ以上は精度が上がらないということです。

生成AIの新しいアプローチ手法とは?

そこで、「推論」という機能を持たせて、1つ1つの情報をAIにチェックさせながら話を進めていき、全体の精度を上げるという手法に変わりつつあります。

個人的には、そもそも精度が100%になることは、理論上あり得ないと思っています。

なぜなら、辞典ですら間違いが入っているのに、どうやって100%真実だけを集めることができるのでしょうか!

つまり、100年後になっても、人間はもちろん、AIが出す回答にも間違いは含まれるということです。

それはさておき。

現時点において、AIは人間の知能を分野によっては超えていると評されてます。

本当でしょうか?

色々な評価機関で継続的にその結果を発表していますが、確かにそう言えるようです。

もちろん、かなり間違いも混ざってくるので、最終的にはファクトチェックが必要です。

PC関係・IT関係において、生成AIの回答精度は?

さて、私が生成AIによく質問していることは、パソコン関係の内容が多いです。

特にPowerPlatformというマイクロソフトの「ローコード・ノーコード」ツールの使い方や、ExcelやChromeの使い方についても時折質問したりもします。

その感想について下記に記しておきたいと思います。

えーと、その精度ですが・・・

 

 

満足できる回答が返ってくる確率は、60%くらいですね(苦笑)

90%くらいの精度にしてほしいのですが、ChatGPTにしても、Copilotにしても、まだまだです。

具体的にどのような感じかというと、

 

(その1)「バージョンを区別出来ていない」

例えば、Excelのある機能について質問したとします。

そうすると、「設定の中にある「XX」という項目をクリックして・・・」といった現在のバージョンには無い項目を普通に案内されます。

そこを指摘すると代替案は示されるのですが、多くの場合、いろいろ試してみるものの未解決になることが多いです。

そして、ChatGPTとの長い問答の後、自分でググったらすぐに結果が出てきた!という悲しいオチになることも珍しくありません。

 

(その2)インターネットに情報の少ない分野には弱い

特にPowerPlatformのツールに関して質問しても、欲しい答えが返ってこず、見当違いの説明を繰り返されることが多いです。

PowerAppsの関数作成などお願いし、出来上がった式をそのままコピペしても、その時点でエラー表示されることが少なくありません。

PowerAutomateもしかり。

一般的に利用頻度の少ないアクションや機能の使い方を質問しても、頓珍漢な答えが返ってくるばかりで、結局解決しないケースが多いですね。

数時間もそんなやりとりを繰り返していると、思わずコンピューター相手に「君、さっきも同じこと言ったよね!何度同じこと言わせるんだよ!」と詰めたくなります(苦笑)

 

ちなみに英訳などをお願いした時も、「友人関係でこんな堅苦しい表現は使わない!」とネイティブの知り合いから言われました。

プロンプトを書く時に、もっとフレンドリーにという指示を入れれば良かったのですが、そういった細かい表現の機微ってかなり英語力が無いと判別が難しいですよね。

この点は、他のことでも言えると思います。

結局、現時点ではまだ「自分でも時間を掛ければできるけど、生成AIを使った方が時間短縮になる(部分が多い)」という人こそ、使いこなすことで大きな成果を得られる代物ですね。

 

他のビジネス用途ではどうなの?

一般的なアイデアを抜け目なく列挙するのは得意です。

ですので、考え事をする際に、一緒に考えるというのは良い使い方です。

しかし、生成AIが作成する意見を優先しすぎても、ダメですね。

なんというか尖ったアイデアではなく、無難なものに収まる場合が多いので、期待するほどの劇的で斬新なアイデアは出ずらいのです。

これも時間をかけてネットを探し回れば手に入るようなものばかりとも言えます。

例として、広告文作成をお願いすると、一般的な公式に則った見栄えの悪くないものを複数作ってくれます。

でもそれをそのまま使っても、お客様からの反響はあまりないのが現実です。

それよりは自分の頭で考えて、少し癖のある(ChatGPTに見せると修正されるような)ものの方が反響が出やすかったりします。

(まとめ)

生成AIの出してくれる回答は、本当に人間が答えているかのように綺麗な(文法的に正しい)文章で返してくれる場合が多いです。

しかし、その精度を言えば、分野によって大きく正答率が異なるというのが現状です。

私は有料版のChatGPTをメインで使っており、それでも満足のいく回答が返ってこなかった時に数回、Googleジェミニを使ってみましたが、回答は似ていましたね。

もちろん、片方がダメな時には、両方ダメ。

結局、上記のように、生成AIに相談するよりも、ググった方が早いというのも珍しくありません。

でもまあ、そういったことを繰り返しながら、生成AIの癖や使い方を習得していく必要性も感じています。

まだまだ生成AIは黎明期ですから、これからですね。

見方を変えれば、「まだまだ人間の専門家によるサポートの方が信頼できる分野がほとんど」ということも言えます。

弊社の方でも、PowerAutomateDesktopについての質問に答えるサポートサービスなども提供していますが、生成AIよりも精度の高いムダの無い回答を返せるというのは、自信を持って言えますね。