機械学習の発展と、不動産価格の予測
~経営者はAIとどう向き合うべきか④

「機械学習の発展と、不動産価格の予測<br>~経営者はAIとどう向き合うべきか④」のアイキャッチ画像

目次

【関連コラム】
データドリブンな企業への変容~経営者はAIとどう向き合うべきか①-1
データドリブンな企業への変容~経営者はAIとどう向き合うべきか①-2
AIと予測(AIで何ができるのか?)~経営者はAIとどう向き合うべきか②
AIの発展と方法論~経営者はAIとどう向き合うべきか③

機械学習の発達

機械学習(マシンラーニング)は、予測・分類・判別といった人間の意思決定に欠かせない行為を計算するためのアルゴリズムで、「データ」を「人々のインテリジェントな行動変化」に変換していきます。機械学習にはビッグデータが必要であり、「どのようなデータが使えるのか」「統計分析を行うに際して、どのような手法を適用していくのか」という判断が重要になってきます。

世の中のデータ量が爆発的に増加したことで高いコンピューターパワーが要求されることになりましたが、コンピューターがその要求に応えられるようになってきました。その一方で、機械学習のアルゴリズム開発は、ある意味において収束を迎えつつあります。これまでは、コンピューターのパワーとデータが足りなかったのです。

アルゴリズムには「分類をする(Classification)」「予測する(Numeric prediction)」の2つがあり、「分類」には「判別」も含まれます。それぞれの目的に応じて、適切なアルゴリズムを選択していくことになります。実際には、「どのようなデータであるのか」によって、利用するアルゴリズムが変わってくることもあります。

経済学者と統計学者の2つの顔を持つ私は、平均で見たときの「適合度の高さ」を考えることを大切にしています。これまでは「誤差を最小化する」ことを考えるモデルでしたが、今では発展して「1つ1つの予測の精度を最適化する」モデルに変わってきています。これらのモデルは独立に発達してきたのではなく、相互に補完し合いながら発達してきました。

「伝統的な統計モデルは、もう使い物にならない」という方も最近いますが、手法に優劣はありません。それぞれの手法ごとに大切にしているものが異なるためです。何を最適化するかによって、機械学習のディープラーニング(人間が手を加えなくても、コンピューターが大量データからそのデータの特徴を自動的に発見する技術)で対応する場合もあれば、伝統的な手法で対応する場合もあります。適切な手法の選択は、優秀なデータサイエンティストであれば判断することができます。その選択によって開発コストがかなり異なってきます。

機械学習は「人口知能」と呼べるに値するのか

機械学習が「人工知能」と呼べるに値する斬新な演算技術であるかどうかは、しっかりと見極めていかなければなりません。私が学生の頃は、人工知能は「if-thenルール(もしこうだったら、こうする)に基づくアルゴリズムである」と教えられてきました。しかし、そのような方法は、環境が複雑になると機能しません。

このif-thenルールを私が学んだのは1990年代初頭ですが、現在注目されているディープラーニングの主要なベース構造であるニューラルネットワーク(人間の脳の情報処理の働きをモデルにした人工知能システム)がその頃に登場しました。当時「人工知能はif-thenルールに基づいて思考していくもので、ニューラルネットワークはただ単に人間の脳を模倣した演算処理システムに過ぎない」と教わりました。

しかし、現在の教科書では、人工知能においてニューラルネットワークやディープラーニングが中心的な役割を果たしています。それらは、さまざまに応用されたり研究が進んだりしてきたことによって、複雑な環境でも適用できるように、従来の人工知能研究とは全く違う形で発達してきました。単純な環境であれば、データ量を少なくして計算コストを低下させて、通常の統計モデルに当てはめても問題はありません。その方が、都合が良い場合もあるでしょう。そのようなことも判断しながら手法を選ぶことが、重要になってきています。

不動産価格の予測はどのように発達したのか?

1990年代には、すでに実用化された不動産価格の予測システムがありました。米国のFederal Home Loan Mortgage Corporation(通称:Freddie Mac)という住宅ローンを証券化している公的機関による『Loan Prospector』という製品です。住宅価格を予測する仕組みで、米国のソフトウェア企業であるHNC社のニューラルネットワークを利用していました。

米国IBMでも同様の技術で、不動産評価を予測する研究が進んでいました。日本IBMも、住宅地図のゼンリンと、不動産鑑定事務所最大手の日本不動産研究所と、共同で研究を行っていました。私も日本不動産研究所の研究部で、IBM社の『AS/400』という大型コンピューターを使って研究に携わっていました。

このときに注目されていたのが、決定木学習(木構造を用いて分類や回帰を行う機械学習の手法の1つ)で、当時は「これが人工知能である」と教わりました。しかし、1978年に公表されたハリソン氏とルービンフェルド氏による著作で、ボストンの住宅価格データの分析に使われた教師データはたかだが数百程度です。これはビックデータでなく、そのモデルにニューラルネットワークを適用しようとすると、当時は何十時間、場合によっては何百時間という莫大な時間を要しました。

1980年代や1990年代には、不動産価格の予測システムに関する開発競争があり、「機械は人間を超えることができるのか?」が議論となりました。そのときの結論は「人間と機械は同じ点数で、アベレージは70点である」というものでした。つまり、当時は人間の専門家が予測しても、機械が予測しても、その出来が70点の時代だったのです。

人工知能が発達した背後には、ディープラーニングの特徴であるバックプロパゲーション(誤差逆伝播法)というアルゴリズムが発達したことが大きく寄与しています。これは、誤差を最小化することを繰り返し学習させるという技術です。バックプロパゲーションがどんどん発達してきたことで、人工知能の精度が高まってきました。すでに1980年代にはバックプロパゲーションが提案され、それを利用したアルゴリズムが提唱されていましたが、当時はコンピューターのコストが非常に高かったことから実装するまでに時間が掛かりました。アルゴリズムは、データと「確率」論に基づいて構築されたときに、最大の成果を発揮することができます。

ここで登場する「確率」は、重要なキーワードです。繰り返しの計算を行うのに限界があるときは「確率」の力が重要になってきます。1997年に私自身が行っていたのは、「建築後年数」「ロケーション(位置)」「大きさ」などのデータを入力して不動産価格を予測することでした。しかし、ここに誤差が生じますので、「AIの予測」と「実際に取引されている価格(=正解)」を比較して、その誤差をもう一度戻して学習し直すことを組み合わせました。こうした経緯を経て、不動産価格の予測精度が上がってきました。

著者

清水 千弘

一橋大学教授・麗澤大学国際総合研究機構副機構長

1967年岐阜県大垣市生まれ。東京工業大学大学院理工学研究科博士後期課程中退、東京大学大学院新領域創成科学研究科博士(環境学)。麗澤大学教授、日本大学教授、東京大学特任教授を経て現職。また、財団法人日本不動産研究所研究員、株式会社リクルート住宅総合研究所主任研究員、キャノングローバル戦略研究所主席研究員、金融庁金融研究センター特別研究官などの研究機関にも従事。専門は指数理論、ビッグデータ解析、不動産経済学。主な著書に『不動産市場分析』(単著)、『市場分析のための統計学入門』(単著)、『不動産市場の計量経済分析』(共著)、『不動産テック』(編著)、『Property Price Index』(共著)など。 マサチューセッツ工科大学不動産研究センター研究員、総務省統計委員会臨時委員を務める。米国不動産カウンセラー協会メンバー。

経営戦略から不動産マーケット展望まで 各分野の第一人者を招いたセミナーを開催中!

ボルテックス グループサイト

ボルテックス
東京オフィス検索
駐マップ
Vターンシップ
VRサポート
ボルテックス投資顧問
ボルテックスデジタル

登録料・年会費無料!経営に役立つ情報を配信
100年企業戦略
メンバーズ