「ディープラーニング(Deep Learning)」は、日本語では「深層学習」と訳されます。人工知能の可能性を拡げた重要なテクノロジーのひとつです。
2017年、囲碁のチャンピオンとして人類最強と名高かった柯潔(カ・ケツ)氏を、人工知能が破りました。このときAlphaGoという人工知能に使われた技術が、ディープラーニングであり、卓越性について研究者以外の一般にも広く知られる機会となりました。その後、自動運転、生体認証、音声対話など、ディープラーニングの技術は幅広く活用されています。ディープラーニングに関する基礎知識、人工知能との関係について解説します。
ディープラーニングの概要と注目された背景
まず人工知能の分野におけるディープラーニングの位置付け、技術基盤のニューラルネットワークとは何か、注目されるようになった背景と理由を整理していきましょう。
ディープラーニング、ニューラルネットワーク、機械学習、人工知能の違い
ディープラーニングとともに使われる用語に機械学習、ニューラルネットワークがあります。ディープラーニング、ニューラルネットワーク、機械学習、人工知能それぞれの言葉に正式な定義はありませんが、関係性を簡潔に示すと次のようになります。
人工知能 > 機械学習 > ニューラルネットワーク > ディープラーニング
人工知能は、人間が勉強をするように学習して賢くなります。といっても、現状では機械に意識はありません。したがって、データから構造やパターンを抽出し、学習によってアルゴリズムやモデルを構築して認識の精度を高めます。それが機械学習です。
機械学習では、当初は膨大なデータからパターンを認識することによって精度を上げる手法が試みられました。機械学習の手法を研究する流れにおいて、人間のニューロンの仕組みに着想を得て、コンピュータ上のプログラムの人工ニューロンでデータを処理させようというニューラルネットワークの技術が生まれました。
ディープラーニングは、このニューラルネットワークのひとつです。機械学習の認識精度を高めています。
ディープラーニングの基盤となるニューラルネットワーク
それでは脳の働きを真似たニューラルネットワークとは、どのような手法でしょうか。
脳は多数の神経細胞によるネットワークで構成され、神経細胞の単位であるニューロンには入力と出力があります。入力は、樹状突起にある複数のシナプスが他の細胞からの信号を受け取ります。細胞体は処理を行いますが、信号が一定の量を超えた場合に次の神経細胞に信号を出力します。このような複数の神経細胞の連携によって、脳は処理を行っています。
ニューラルネットワークは、入力から細胞の処理を経由して出力する脳細胞の仕組みを模倣しています。ソフトウェア上に入力層、中間層(隠れ層)、出力層の3層を設けて、大量の情報から変換した情報を出力する仕組みがニューラルネットワークです。
さらに中間層の部分を何層にも深く多層構造にすることによって、認識の精度が高まります。これが深層学習つまりディープラーニングです。しかし、解析するコンピュータやプログラムには、高度な処理能力が求められます。
ディープラーニングが活用されるようになった背景
ディープラーニングが飛躍的に進化した理由には、以下のような技術的な進歩や社会的な背景がありました。
ディープラーニングが注目される大きな契機になったのは、画像認識の分野で競技形式の研究を開催する「ILSVRC(Imagenet Large Scale Visual Recognition Challenge)」において、2012年、ジェフリー・ヒントン教授が率いるカナダのトロント大学のチームが、ディープラーニングを用いた画像認識システムで驚異的な成果をあげたことでした。
トロント大学のチームは、2011年以前には25%以上だった誤認識率を16.4%まで引き下げて圧倒的な勝利を収めました。ニューラルネットワークのテクノロジー自体は1900年代からありましたが、トロント大学のチームが圧勝した理由は、ニューラルネットワークを進化させたディープラーニングを採用したことにあります。
この競技結果を機会に、研究者たちはディープラーニングに熱心に取り組むようになりました。
ディープラーニングは、特徴量をコンピュータ自身で獲得する
東京大学で人工知能を研究している松尾豊教授は、著書の『人工知能は人間を超えるか ディープラーニングの先にあるもの』で、ディープラーニングは「人工知能研究における50年来のブレークスルー」と述べています。
さらに、このテクノロジーがブレークスルーである理由として「特徴表現をコンピュータ自らが獲得する」ことを挙げています。
人工知能の認識においては、膨大なデータから特徴量と呼ばれる認識のための情報を抽出することが重要です。ディープラーニング以前には、人工知能の認識の精度を上げるために。最終的に研究者が職人ワザで特徴量のチューニングを行っていました。しかし、トロント大学のチームはディープラーニングを採用して、人間の能力が必要な領域をコンピュータ自身で学習可能にしたのです。
ディープラーニングのアルゴリズムによる分類
ディープラーニングでは、階層ごとに学習を行う点と、自己符号化器(オートエンコーダー)を用いる点で、それまでの機械学習とは異なります。
さらにアルゴリズムによって、得意な分野の手法があります。主なディープラーニングの手法の呼び名と概要を解説します。
DNN(Deep Neural Network)
当初は2~3のネットワークによる階層(隠れ層)で処理していたニューラルネットワークによる機械学習ですが、150もの深い階層で処理します。DNNはオートエンコーダーや、以下のCNN、RNNなどを含む広義の分類です。
CNN(Convolutional Neural Network)
画像に対する高精度のパターン認識を行います。日本語では「畳み込みニューラルネットワーク」といい、DNNを2次元のデータに適応させたアルゴリズムです。
RNN (Recurrent Neural Network)
音声、動画など時間で変化する可変長のデータに対応したアルゴリズム。「再帰型ニューラルネットワーク」と訳され、中間層に再帰呼び出し的な構造があり、連続したデータの処理に対応させています。再帰呼び出しとは、定義や記述にそれ自身が含まれる関数をいいます。
GAN (Generative Adversarial Network)
ディープフェイクと呼ばれる、画家を真似た絵画や写真に色彩をつける創造的な出力を行う手法です。日本語では「敵対的生成ネットワーク」といい、2つのニューラルネットワークを敵対および協働させて処理します。
ディープラーニングと人工知能の関係
ここで再度、ディープラーニングと人工知能の関係を整理します。
人工知能(AI)には、大きく分けて2つの概念があります。「強いAI」と「弱いAI」です。簡単に解説すると、人間と同等の意識を持って自律的に思考できる人工知能が強いAI、そのレベルに到達しない人工知能は弱いAIになります。現状では、まだ弱いAIのレベルしか実現していません。
弱いAIは、特化型AIと汎用型AIに分かれます。特化型AIは囲碁の対戦で人間を破ったAlfaGoのように、特定の専門領域の能力に限定した人工知能です。一方で、汎用型AIは、人間と同じように複数のタスクで仕事ができる人工知能になります。チャットボットを例に挙げると、問い合わせの内容を自然言語処理によって解析し、データベースから最適な回答をします。
ディープラーニングの技術は囲碁の対戦型や画像認識のような特化型AIからスタートし、RPA(Robotic Process Automation)など業務効率化の分野にも活用されるようになりました。自律的な学習ができるかどうかが汎用型AIでは重要になりますが、現状では自動化がメインであり、人間のような意識はありません。創造性を発揮する仕組みも登場しつつあるとはいえ、完全な強いAIの実現には至っていません。
まとめ
ディープラーニングによって人工知能は飛躍的な進化を遂げました。しかし、強いAIの実現を目標とした場合、可能性の入り口を開いた状態に過ぎません。将来、人工知能が意味や意識を獲得できるかどうかは、研究者によって見解が分かれます。一過性のブームに終わらせないことが、人工知能の可能性を開花させる鍵といえそうです。
参考:『人工知能は人間を超えるか ディープラーニングの先にあるもの』松尾豊著、KADOKAWA、2015年