2021.10.21 トレンド企業・経営その他

AIが行う予測と判断、人間の意思決定
～企業はAIとどう向き合うべきか⑦

清水千弘

「AIが行う予測と判断、人間の意思決定<br>～企業はAIとどう向き合うべきか⑦」のアイキャッチ画像

決断とは？

「AIは、何をしてくれるものか？」とよく聞かれます。AIは、広義の意味で予測をしてくれるものです。そう理解した企業A社の社長は、次のように考えました。「AIが予測をしてくれることは分かった。人間が犯すミスをしないことも分かった。会社経営において最も大切な意思決定は人事である。人事にAIを使うようにDX事業部長の清水君に指示しよう。」

経営資源としてのHR（Human Resources, 人的資源）は、どの企業でも一般化できることから、最も研究が進んだ分野です。HRにAIを導入すると、「AIが予測した時の決断は正しいのか」「どれぐらい信じたらよいのか」という問題が出てきます。

「コンサルタントのB社が作ってきたAIが、X部長のパフォーマンスが悪いので交代させた方がよい、という決定をしてきました。いかがしますか。X部長が編成した営業チームは精鋭ぞろいですが、成績が下がる一方です。」

AIは、X部長の成績が下がっていることを学習したのでしょう。経営者は、このように判断したAIをどのように使うのかを考えなければなりません。

トロント大学のアジャイ・アグラワル教授らが書いた本『Prediction Machines（予測マシンの世紀）』では、AIにおける決断（Decision Making）に関する問題を扱っています。経営者がAIの予測を使ってどのように意思決定を行うのかは、極めて大きな問題です。

「経済学は選択の科学である」。これは2001年にノーベル経済学賞をとった米コロンビア大学のジョセフ･E･スティグリッツ氏の言葉です。米ハーバード大学のN・グレゴリー・マンキュー氏は「日常生活を科学する」と言っています。つまり、経済学は「日常の選択を科学する」学問なのです。

企業経営とAIの結合を考えるとき、これまでは経験や勘で行われてきた意思決定をモデル化することで、データ駆動型企業へと進化させることに価値があります。ビジネスにおいて、意思決定は中心的な要素で、経営者が最も大切にしなければいけないことです。

現在のところ経営者は、AIの予測に対する判断を下してから、決断し行動する必要があります。常に予測と判断を同時に行う人間のように、AIが判断してくれるわけではありません。しかし、AIでも予測と判断を同時に行える事例が出てきています。

タスクの構造

人間にとってもデータは重要ですが、AIが予測するためにはデータの学習が必要となります。決断の構造を整理すると、次のようになります。まず、AIは「入力（Input）データ」を用いて「予測（Prediction）」をします。人間は予測すると同時に「判断（Judgment）」をし、判断が「行動（Action）」に繋がり、その行動によって「結果（Outcome）」が出てきます。その結果をフィードバックし、もう一度繰り返します。トレーニングをして、予測の精度をより高めていきます。

人間に代わって予測マシンが登場する機会が増えると、人間による予測の価値は減少します。AIが、人間よりも精度高く予測できるようになると、人間による予測は必要がなくなっていきます。決断において、予測は中心的な要素ですが、それが唯一の要素ではありません。決断は、判断・データ・行動の総合的な理解によって構成されており、現時点では間違いなくAIよりも人間の方が得意です。

人間は、知識を得るために教育を受け、日々学習しています。教育とは、知識をつけ、技能を習得させ、よい方向へ向かうための行動変化に繋げることだと言われていますが、AIも知識を得るために人間以上のスピードで学習します。

ロンドンのタクシー運転手には、非常にステータスが高い「ノリッジ」という資格制度があります。ノリッジになるためには、ロンドン市内の複雑で入り組んだ道路網のすべてのルートをほぼ完璧に覚えなければなりません。ノリッジを持つことはステータスであり、誇りでもありましたが、そこに知識を持つテクノロジーが登場してきました。リアルタイムのルート検索です。

東京大学の空間情報科学研究センターでも、20年ほど前から、様々なルート検索・ポジショニング・最短経路検索などの技術を研究してきました。それらの研究はいまや実用化されて、スマートフォンを使えばリアルタイムで交通機関別にルート検索して、所要時間まで計算してくれます。

そのベースになる地図基盤も、自動運転の実現のための重要なインフラとして、日に日に精度がよくなってきています。現在では、衛星技術やセンサーも発達して、もっと細かい粒度で道路の状態が分かるようになり、リアルタイムの渋滞情報も反映してルート検索ができるようになってきました。

人間は道を知っていても、現在の情報を知ることはできません。経験から類推はできても、その精度は確かでありません。道路の状況や交通インフラが変われば、過去の情報も使えなくなります。ルート検索のようなテクノロジーの進化で、ロンドン道路網の知識の価値は大きく下がってしまいます。

これを「ノリッジの価値を下げた」と考えてよいでしょうか。高度な教育を受けて知識を持った専門家しかできなかった領域が、機械を使うことで知識を持たない人でも同じことができるようになる。「新規参入が増えた」ことで競争が激化して、今までの価値が下がっていくことは「競争の原理が働いた」または「競争条件が変わった」と言うべきでしょう。

それによって市場では高付加価値化と差別化が起こります。タクシーが非常につかまりにくい時間帯に高いお金を払ってでも乗りたい人が増えれば料金を上げ、逆に空いている状態なら料金を下げて需要を喚起しようとします。知識を持たない運転手の運賃は低価格、ノリッジ取得者は安心安全の分を上乗せした運賃にするなどの差別化戦略も考えられます。こうした人間の意思決定の構造を理解しなければ、AIの予測をどう使えばよいのかも分かりません。

報酬関数

意思決定をする伝統的なツールに、「決定木（Decision Tree）」があります。例えば、「傘を持っていくべきか」という人間の判断をAIにさせるとき、どのように開発をしていくのかをモデル化してみましょう。

「今日、傘を持っていくべきか？」を考えたとき、傘を持っていけば、雨が降ったときに濡れずに済みます。しかし、傘を持っていけば荷物になるので、荷物を持つのが嫌いな人は持っていきたくありません。このケースでは、どう判断したらよいのでしょうか。

前提として、雨が降る確率が分かっているとします。私たちが取るべき「行動（Action）」には、「傘を持っていく」と「傘を置いていく」という選択肢があります。「雨が降る」確率が4分の1とすると、「雨が降らない（晴れる）」確率は、足して1となる排反の原則で4分の3となり、それぞれの事象の確率が分かります。

傘を持っていけば、雨に降られても傘があるので濡れずに済みます。傘を持っていって晴れれば、もちろん雨には濡れません。傘を置いていって雨に降られるとずぶ濡れです。傘を置いていって晴れれば、雨に濡れずに済みますが、これが最もよい状態になります。最悪な状態は傘を置いていって濡れることです。

私たちが判断するとき、どのような基準で判断するかが重要になります。判断は「特定の環境のもとで、特定の行動によってもたらされる報酬」と考えられます。それをAIに学習させて判断させるには、人間が「報酬関数」を設定しなければなりません。特定の行動から特定の結果が生み出される場合の相対的な報酬とペナルティを設定し、それに応じて確率が与えられると「期待値」を算出できます。

特定環境は、人によって変わります。最初に「代表的な個人」を想定してみましょう。例えば、私は手荷物を持つのが嫌いですが、一方でリスク回避型の人間なので、普段からカバンの中にいつも小さな傘を入れています。私がカナダに住んでいたときに出会ったカナダ人の多くは、雨が降っても傘を差さずに歩いていました。英国人もあまり傘を差しません。そのことを言うと、「I’m Canadian」といって笑っていました。雨に濡れるということに神経質な私（多くの日本人がそうだと思いますが）に対して、カナダ人または英国人は、濡れることに抵抗が少ないようです。そうすると、この両者では報酬関数が異なると考えられます。

「雨に濡れる」ことに対する考え方は、人によって変わります。従来の確率や伝統的なモデルでは「代表的な個人」を想定して判断を行ってきました。しかし、今ではAIにパーソナライズできるデータを学習させることで、各人ごとに意思決定をカスタマイズできるようになってきました。

報酬関数では、最も良い状態と悪い状態を最初に考えて「報酬」を決めます。最も悪い状態は雨に濡れてしまうことなので、その報酬を0点とします。傘を置いていって雨が降らないのが最も良い状態なので10点と決めます。

次に、期待値を算出すると、「傘を持っていく」場合は、雨が降っても降らなくても濡れずに済みますが、「傘が手荷物になる」ことのペナルティ2点を加えると、両方とも8点で、期待値の平均は8点となります。「傘を置いていく」ほうは、「雨が降る」と0点、「晴れる」と10点となり、0×0.25＝0点、10×0.75＝7.5点となるので、このときの期待値の平均は7.5点です。

この点数を「判別関数」と考えれば、「傘を持っていく」という選択のほうが0.5点高いので、AIは「傘を持っていく」と指示できます。このモデルでは、判断したのはAIですが、報酬関数を設定したのは人間ということになります。

著者

清水千弘

一橋大学教授・麗澤大学国際総合研究機構副機構長

1967年岐阜県大垣市生まれ。東京工業大学大学院理工学研究科博士後期課程中退、東京大学大学院新領域創成科学研究科博士（環境学）。麗澤大学教授、日本大学教授、東京大学特任教授を経て現職。また、財団法人日本不動産研究所研究員、株式会社リクルート住宅総合研究所主任研究員、キャノングローバル戦略研究所主席研究員、金融庁金融研究センター特別研究官などの研究機関にも従事。専門は指数理論、ビッグデータ解析、不動産経済学。主な著書に『不動産市場分析』（単著）、『市場分析のための統計学入門』（単著）、『不動産市場の計量経済分析』（共著）、『不動産テック』（編著）、『Property Price Index』（共著）など。マサチューセッツ工科大学不動産研究センター研究員、総務省統計委員会臨時委員を務める。米国不動産カウンセラー協会メンバー。