人工知能を利用した信用リスク管理ソフト

信用リスク管理は人工知能で代換えできます

今までの信用リスク管理は、古典的な計算式を持つプログラムを用いるか、専門的な知識を持つ人間が行ってきました。しかし、古典的な計算式を持つプログラムは統計学的な根拠に乏しいために最後は人間の経験と勘によってパラメータを調整するといった曖昧さを持っていること、人間が考えた計算式であるため少ない変数しか扱うことができないという欠点がありました。

人工知能(ディープラーニング)に信用リスク管理を計算させることで、過去のデータを根拠とし、統計学的にはっきりとした予測精度を得ることができます。また、人工知能をトレーニングするデータはユーザーから頂いたものだけを用いるので、ユーザーの営業範囲だけを対象とした専用ソフトとなり、外部のデータが混入する恐れもありません。

融資業務のコストカットはもちろんですが、それだけに留まらず、
「ある変数がこの値を示したら、他の変数はどう変化するか」
「特定の変数のみ判明しており、他の変数が不明である場合にどうなるか」
といった柔軟な条件での予測も可能です。

なぜ人工知能には信用リスク管理の計算が可能なのか

人工知能とは、「人間の知性的な活動を全て機械に代替させる」という抽象的な概念を言うものですが、情報工学ではより厳格に、機械学習と呼ばれています。機械学習とは「既知の数値データ列から、未知の範囲となっている数値を予測する」技術を総称して呼びます。例として、図1のような数値データが与えられた場合を考えます。

図1.与えられた数値データ

これらの数値(点)の間の値を予測することを考えます。すると、最も簡単には図2.のようになります

図2.隣り合う数値を直線で結んで未知の値を予測したもの

図2.は折れ線グラフ(線形補間)と言われて最も親しまれている予測方法ですが、これでも立派に未知の範囲の予測としては成り立っています。これが機械学習です。実は、機械学習とは数学的に表現すると補間曲線を描くアルゴリズムの事を指しています。補間とは、未知の範囲の数値を予測することを指しますから、機械学習(人工知能)には、信用リスクを計算することが可能なのです。

なぜ人工知能は人間より性能が高いと言えるのか

人間の扱う数式では、近似精度を上げるためには独立変数を増やしていくしかないため古典的な統計モデルでは有意性が低下するという問題がありました。独立変数を増やすということは、全ての事象は独立である、すなわち「全ての事象は偶然発生した」と言い切ってしまうに等しく、因果関係の否定、意味は無いということになってしまうからです。一方、機械学習で最もよく用いられているニューラルネットには、従属変数を増やすことで近似精度を上げることできるという重要な性質があり、独立変数を増やすことがないため、有意性を損なう事がありません。この特殊な計算は、人間には不可能だったものです。
さらに、人間が計算を行う場合は人間が扱える範囲という制限があるため、少ない変数しか扱うことができませんでした。たしかに二次元のグラフなら人間が補間曲線を描くことは容易なことです。しかしこれが多変数、つまり高次元の補間曲線となった場合を考えます。
4次元、10次元、100次元、10000次元・・・これはもう人間では到底補間曲線を計算することは不可能です。このような、超高次元の計算は機械でしか行うことができません。

ユーザー独自の基準による信用リスクの計算ソフト

財務諸表、口座入出金履歴だけでなく、担保物権など、ユーザーの定義に合わせた信用リスク管理を実現します。基本的には数値になるものであれば、何でも計算に入れることができます。

人工知能による信用リスク管理を導入するために必要となるもの

信用リスク管理の計算を行うためには人工知能に変数の関係性を学習させる必要があります。学習のためには過去のデータが必要です。また、人工知能に学習させるために必要となるデータ量は、データの性質により異なります。ピークがただ一つしか無いような単純なデータの場合は、少数のデータで学習可能ですが、複数のピークを持つような複雑なデータである場合、より多くのデータが必要となります。また、基本的には変数の数が多くなるほど、より多量のデータが必要になります。データ量は多ければ多いほど高精度化していくため、運用と並行しつつ、さらに性能を上げていくことが可能です。

性能評価

人工知能は学習結果を人間の言葉で解説することはできません。
ニューラルネットは行列式であるので、数式を書き出すことは可能ですが、行列の要素数が非常に多く、どんな関数であるのか人間が直感的に理解することはほぼ不可能です。ここで重要なことは、何故か、という解説を人間の言葉で行うことではなく、学習結果として得られる「精度」になります。用意したデータをトレーニングデータとテストデータにランダムに分割し、トレーニングデータのみを使って学習させます。次に、学習させた人工知能にテストデータを入力することで結果を評価します。この時点で予測精度が算出されます。(交差検証