機械学習では、特徴量を人間が抽出しておりAIは何が特徴量かわかりませんが、 ディープ・ラーニングでは,圧縮,復元により特徴量を抽出できます。
AIの基礎 ディープラーニング
画像認識を競い合うILSVRCでは、それまで機械学習を利用していたAIに対してディープラーニングを利用したSuperVision圧倒的な差で勝利したという事実があります。
ディープラーニングでは、「入力」=「正解」=「出力」となるような正解データを利用して重みを調整します。
上記は、MNISTの文字列の例です。実際に入力するものはデータですから、各画像の各画素ごとに0から255までのデータが割り振られており、それぞれの画素に対応するデータが入力となります。
MNISTは文字列の例だけでなく、画像の例もあります。
AIの基礎 ディープラーニング 畳み込みニューラル・ネットワーク
畳み込みニューラル・ネットワーク(CNN: Convolutional Neural Network )は、画像を2次元の形態でそのまま入力できるモデルです。
入力データである画像が入力層に入力すると、畳み込み層においてカーネルと呼ばれるフィルタを用いて画像の特徴が抽出されます。
抽出された特徴データはプーリング層においてダウンサンプリングが行われます。プーリング層における処理によりロバスト性の影響を受けないようになります。
このような畳み込み層における特徴抽出、プーリング層におけるダウンサンプリングが繰り返されて全結合層において出力が1次元にされます。
たとえば、動物を表す複数の画像が入力されると、動物の種類を表すデータが出力されることとなります。
AIの基礎 ディープラーニング リカレント・ニューラル・ネットワーク
畳み込みニューラル・ネットワークでは時間に依存するデータを扱うことはできませんが、それを可能にしたのがリカレント・ニューラル・ネットワークです。
たとえば、時刻tにおいて「太郎君が」というデータを入力し、
時刻t+1に「学校に行くのは」というデータを入力し、
時刻t+2に「何時ですか?」というデータを入力すると、
「午前8時です。」という回答が得られます。
AIの基礎 ディープラーニング 敵対的生成ネットワーク
敵対的生成ネットワーク(GAN: Genera tive Adversarial Networks )は入力データから特徴を学習することで、実在しないデータを生成したりするモデルです。
GANにはジェネレータとディスクリミネータとが含まれており、ジェネレータが画像を生成し、生成した画像が本物か偽物かを判断します。画像生成と本物か偽物かの判断を繰り返し、画像生成の精度が上がると、偽物の画像を本物の画像とみなされてしまうことになります。たとえば、有名な画家の絵の特徴を学習していくとにより、その画家が描いたような絵が出来上がります。
AIの基礎 遺伝的アルゴリズム
遺伝的アルゴリズムは、でたらめに初期の解を生成し、その点数を評価し、点数に応じて淘汰するということを繰り返すことにより、残った最後の解が最終的な解とするものです。
遺伝的アルゴリズムは、自然界において残ったものが優秀であるはずという考えにもとづいています。
(弁理士 井上 正)