2021.06.17 トレンド企業・経営その他

AIの発展と方法論～経営者はAIとどう向き合うべきか③

清水千弘

AI研究の歴史

1956年、米国のロックフェラー財団の資金援助によってAI研究の道筋を立てるための大型プロジェクトが立ち上がりました。そして、米国ニューハンプシャー州のダートマス大学で開催された「ダートマス会議」が、AI研究の最初の大きな会議です。

従来AIの研究者が考えていたのは、まずゲームをさせることでした。とくにチェスの研究が盛んで、機械が人間に勝てるのかが研究テーマでした。さらに、人間が解くことができない数学理論の定理や公理をAIで証明する研究にも挑戦していました。

この会議で、さまざまな論点が議論されました。「コンピューターに認知的思考能力を備えることができるか？」「コンピューターが物事を表現するためには、どのような言語や知識が必要か？」「選択権が与えられたコンピューターが最善の選択をするにはどうすべきか？」こうした疑問に対して、次のような声明が出されました。

「機械が言語を使用して抽象化や概念化を行い、現段階では、人間以外に不可能な問題を解決して自己改善できるような方法を見つけたいと考えています。精鋭ぞろいの科学者グループがひと夏この問題に取り組めば、これらの問題の1つあるいは2つ以上で大きな進歩が実現するでしょう。」

しかし、この声明の内容は実現できませんでした。

1980年代になるとエキスパートシステム*の研究が始まります。「医師の診断に対してAIがどれぐらい役に立つのか」などに加えて、不動産価格の予測が研究テーマになりました。国家資格である不動産鑑定士は不動産の価格を予測する仕事をしていますが、不動産鑑定士の予測の成否は、不動産市場の取引の結果で決まります。実際の市場価格と比較して、機械が不動産鑑定士というエキスパートに勝つことができるのかという研究が始まりました。
エキスパートシステム*：専門知識のない初心者でも、専門家と同じレベルの問題解決が可能となるように、その領域の専門知識をもとに動作するコンピューターシステム

経済学には「経済測定」という分野があり、不動産価格は「モノの価格の中でも最も測定が困難な対象」といわれてきました。その不動産価格を機械が測定できるようになれば、素晴らしい成果となります。さらに不動産は経済学における三大生産要素の1つですから、それを測定する意義は高いといえます。しかし、当時の技術では、AIが不動産鑑定士に勝つといったところまで到達させることはできませんでした。

そして、1980年代にはAIの領域はなかなか日の目を見ない状態で、「AI冬の時代」が続きました。

冬の時代はどうして終わりを告げたのか？

「AI冬の時代」に終わりを告げたのは、次の３つの分野での飛躍的な発達があったからだと考えます。

第一が、「ビッグデータ」の出現です。データの収集技術が向上し、クラウドが発達することで保存のコストが低下し、分析をしていくための「ビッグデータ」が得られるようになりました。AIまたは統計的な分析を使ってモデルを開発していくためには、データが必要です。十分な数のデータに加えて、多様なデータが登場したことで応用範囲が広がりました。さらに、ビジネスなど社会で利用するためには、リアルタイム性と迅速性が要求されます。データの量や多様性、そして迅速性をともなったデータが整備・蓄積されていくなかで、データが資源へと変質していったことは、もっとも大きな要因としてあげられるでしょう。

第二が、データを使って予測や判別、分類などをしていくための統計的手法の精度が急激に上昇したこと、第三が、コンピューターの演算処理の性能が向上したことです。ビッグデータが誕生し、アルゴリズムやモデルをつくる知識であるディープラーニング*が発達し、コンピューティングパワーが飛躍的に向上しました。この３つの要素が揃ったことで、AIはようやく社会で使われるようになったのです。
ディープラーニング*：人間が手を加えなくても、コンピューターが大量データからそのデータの特徴を自動的に発見する技術

トロント大学ロットマンビジネススクールの学部長であるアジャイ・アグラワル教授の著書である『Prediction Machines』でも「優れたプロセッサが発明されたおかげで、新たな機械学習モデルは、柔軟性と予測精度の向上の恩恵を受けることができた」と述べています。

統計学と機械学習の違い－統計学

従来の統計学における計量経済モデル*といわれるものと、最近注目されている機械学習**は、何が違うのでしょうか。理論的には、計算をするなかで大切にしている考えや、予測を生み出した背後にある数学的な理論がまったく異なります。AI予測の発展を支えるドライバーは、質の高いビックデータ、モデル、コンピューターのパワーとなります。
計量経済モデル*：経済データを統計的方法や数学的方法を応用して実証するためのモデル
機械学習**：コンピューターが、データから反復的に学習して、そこに潜むパターンを見つけ出す技術

不動産価格を予測するプロジェクトでも、数百という回帰モデル（目的変数を、説明変数で予測するモデル）が発明され、現在でも新しい回帰分析が提案されています。例えば、一般化加法モデル (Generalized Additive Model, GAM)といわれる、説明性と予測性を両立したモデルがあります。このようなモデルが開発されることで、価格と建築後年数の関係において、単純な線形関係（比例関係）としてモデル化されるのではなく、非線形（比例的でない形）としてモデルを作ることができるようになりました。

また、不動産価格は高低の幅が大きいので、とても高い価格の家を買う人と、中程度以下の価格の家を買う人では、大事にしている選択要素が異なり、そのウエイトも異なると考えられます。このような現象を説明するために、Quantile Regression（分位点回帰）という手法も開発されてきました。その他の方向性としては、地理空間情報が発達して位置情報が活用できるようになることで、空間計量経済学という分野も発達してきていました。

不動産価格を説明するためのさまざまなデータを説明変数といいます。技術の発展により、価格を予測するのに必要な「駅までの距離」や「大きさ」や「築後年数」だけでなく、「周辺の環境」さらに「気候がどうなっているか」や「そこから見える景観がどうなっているか」などの説明変数を増やせるようになってきました。回帰分析の手法では「説明変数を追加して、特定の状況下で平均に回帰させていく」という考え方が、前述の広い意味での統計分析の思想になります。

この回帰モデルの最もシンプルなものが、単回帰と呼ばれる分析方法です。米国の代表的な統計学の教科書『Statistics for Business and Economics』の単回帰の事例が、住宅価格を説明するものになっていて、そのなかの「Simple Linear Regression Example」では、住宅価格と住宅の大きさの関係を、次のような数式で表しています。実は、日本でも多くの教科書で、回帰分析の事例として住宅価格が使われているのです。

具体的には、「住宅の価格（Y＝a＋ｂX）」は、切片となる（a）と「住宅の大きさ（X）」にある係数（ｂ）をかけたものに等しいと考えます。（a）と（ｂ）のパラメーターの数字を計算することさえできていれば、予測したい「住宅の大きさ（X）」を代入することで「住宅の価格（Y）」を予測できます。これが統計学の回帰分析になります。ここに「住宅の大きさ」だけでなく「最寄り駅までの距離」「建物の年齢」「都心までの距離」または「公園が周りにあるか」「コンビニがあるのか」「病院や診療所などの医療施設は充実しているのか」「保育所や小学校など子育て環境の要因」といったもの（特徴量）を学習させていき、「住宅の価格」を予測しようとしているのです。

従来は、マーケットをセグメンテーションする「クラスタリング」をしたり、因子分析*や主成分分析**と呼ばれる方法を用いて特徴量（分析すべきデータの特徴や特性を、定量的に表した数値）を低次元化したりして、説明変数の数を減らしながらも精度が高い予測モデルを開発しようとしてきました。伝統的な統計学のモデルでは、「適合度を最大化させること」と「平均としての予測誤差を最小化すること」が大事とされてきました。実際のアルゴリズムで予測を行ったときに、誤差が一番小さくなるようによいモデルを選択しようとします。

因子分析*：観測変数（仮定上の変数でなく、直接的に測定された変数）に影響を与えている共通因子を抽出する手法
主成分分析**：多数の変数から、少数の主成分という合成変数を作り出す手法

もう1つ、伝統的な統計学のモデルに「最良不偏統計量（BLUE：Best Linear Unbiased Estimator）という手法があります。われわれが得られるのは標本データ（集団全体のうちの一部のデータ）なので、回帰分析を繰り返し、そこから生まれる計算結果（回帰係数）はブレない方がよいモデルになります。そこから出てくる予測は、平均を取れば理想的でも、ひとつずつの回帰による予測の結果が正確ではないことがあります。最良不偏統計量では平均を取ったときに、全体としては最もよいモデルを選びます。100件の予測誤差が一番小さければ選んでしまうので、ひとつずつの予測では許されないような誤差になる場合もあり、正確さは担保されません。

統計学と機械学習の違い－機械学習

では、機械学習ではどうなるのか。機械学習の予測結果は、平均としては正確ではないかもしれず、回帰モデルに負けてしまう可能性があります。しかし、機械学習は、ひとつひとつの予測誤差を大きくしないように設計されます。統計学の言葉として表現すると「分散を小さくすること」と引き換えに「偏りは許容する」ということになります。機械学習では、先に述べた「最良不偏統計量」を犠牲にすることを考えます。

米国ノースカロライナ州にあるデューク大学のテラデータセンターでは、AIのトーナメントが開催されています。同じデータを使ってどのチームが、ある顧客の解約を適切に予測できるかを競う、解約予測を教師データ*としたコンテストです。2004年時点では、回帰モデルを使ったチームが優勝しており、のちのディープラーニングのエンジンの基になるニューラルネットワーク**では、大きな成果を出すことができませんでした。それから12年後の2016年の優勝者は、ディープラーニングを使っていました。ほかのすべてのモデルの成績を上回る結果を出したのです。
教師データ*：機械学習モデルの予測を支援するために用いられるデータ
ニューラルネットワーク**：人間の脳の情報処理の働きをモデルにした人工知能システム

AIが人間の頭脳を上回ったといえるのか。データとコンピューターが一定水準に達した結果、それまで使うことのできなかったデータが使用可能となり、コンピューターに思いきり計算させることができるようになりました。演算能力の上昇によって、数字だけでなくテキストや映像も、大量のデータとして活用できるようになり、非常に大きな効果が生まれています。2010年代前半は最も優れた囲碁プログラムでもアマチュアの有段レベルでしたが、2015年に登場したニューラルネットワークを活用したAlphaGoは世界最強棋士でも勝つことができないレベルになりました。さらに、リアルタイムデータの活用も可能となり、ラグ（遅延時間）が消滅するというメリットも得られるようになりました。

著者

清水千弘

一橋大学教授・麗澤大学国際総合研究機構副機構長

1967年岐阜県大垣市生まれ。東京工業大学大学院理工学研究科博士後期課程中退、東京大学大学院新領域創成科学研究科博士（環境学）。麗澤大学教授、日本大学教授、東京大学特任教授を経て現職。また、財団法人日本不動産研究所研究員、株式会社リクルート住宅総合研究所主任研究員、キャノングローバル戦略研究所主席研究員、金融庁金融研究センター特別研究官などの研究機関にも従事。専門は指数理論、ビッグデータ解析、不動産経済学。主な著書に『不動産市場分析』（単著）、『市場分析のための統計学入門』（単著）、『不動産市場の計量経済分析』（共著）、『不動産テック』（編著）、『Property Price Index』（共著）など。マサチューセッツ工科大学不動産研究センター研究員、総務省統計委員会臨時委員を務める。米国不動産カウンセラー協会メンバー。