SFの世界に登場する人工知能(AI)は万能です。人間と同じように自分の存在に疑問を感じたり悩んだりします。このような人工知能は、汎用型人工知能(AGI:Artificial General Intelligence)と呼ばれますが、まだ実現していません。現在のAIは、特定の領域で能力を発揮する特化型人工知能(Narrow AI)であり、できないことがたくさんあります。
AIに何ができて何ができないのか整理します。
AIブームと失望の歴史
AIにできること、できないことを列挙する前に、AIの歴史を振り返ります。現在を含めて3回の人工知能ブームがありました。この歴史から人工知能にできないことを探るヒントがあります。それぞれのブームの時代背景とAIに対する考え方を解説します。
第1次AIブームの失望:「AIはおもちゃでしかない」
1950年代後半から1960年代が第1次AIブームの時代です。この時代は「推論」と「探索」がAI研究の大きなテーマでした。ゲームやパズルを解いたり迷路を脱出したりするような問題のアルゴリズムが研究されました。
ところが、実際にAIが解いた問題は低レベルであり、「トイ・プロブレム(おもちゃの問題)」と呼ばれました。
第2次AIブームの失望:「AIは面倒くさい」
第2次AIブームが盛り上がったのは1980年代。「知識(ナレッジ)」というキーワードが注目されました。専門家の知識をデータベース化して、コンピュータに処理させる「エキスパートシステム」と呼ばれるAIが生まれました。たとえばスタンフォード大学で開発されたMYCIN(マイシン)は、感染症の専門医師の代わりに抗生物質を処方するように設計されています。
しかし、エキスパートシステムの問題は、まず知識を専門家から収集しなければならない点にありました。さらに知識を類型化するときに必ず例外があり、ルールの定義が必要になります。最終的に知識のデータベースが膨大になり、AIに知識を教えるという作業は非常に煩雑です。AIは面倒だということでブームは終焉しました。
第3次AIブームの失望:「AIは使えない?」
2000年から現在に至るのが、第3次AIブームです。機械学習とディープラーニングの登場が大きく貢献しました。2012年にGoogleのAIが猫の画像を認識し、2015年に囲碁でAlfaGoが人間のチャンピオンを破るなど、飛躍的に進歩しました。
一方でAIによってなくなる職業というセンセーショナルな話題が報じられ、AIをネガティブにとらえる傾向も生まれました。実際にAIを搭載したシステムを導入しても「使えると思っていたのに使えない」と批判的にとらえられてしまう場合さえあります。
しかし、ほんとうにAIは使えないのでしょうか。AIを正しく理解するために、現在の特化型人工知能のできることと、できないことをピックアップします。
結局AIって何ができるの?
AIができることの概要に加えて、具体的なソリューション、人間の業務に想定した場合の職種を挙げていきます。しかし、必ずしもその業務をすべて代替できるわけではないことに留意することが大切です。
○ 複雑な問題を解き、データから予測、機械を制御できる
AIは実質としてコンピュータであり、基本は高度な電子計算機です。したがってデータを高速処理することが可能であり、人間には時間のかかる問題をあっという間に解くことができます。ニューラルネットワークという人間の脳におけるニューロンの仕組みを利用したディープラーニング(深層学習)によって、データの分析や予測が可能です。
AIのソリューション
- 株価・販売数・天気予報などの予測
- 工場の予知保全、装置の障害や異常の発見
- サイバー攻撃などの検知 など
人間の職業でいえば?
- 証券アナリスト
- 職人的な検査技師
- セキュリティ専門の情報システム担当者 など
○ カメラから画像を識別できる、空間を認識できる
静止画像や動画から、物体、場所、人物などを識別できます。人物では顔認証によってセキュリティ分野に利用可能です。動画の空間認識はクルマの自動運転に活用されています。オフィスの業務ではOCR(光学文字読取装置)で手書き文字を読み取ってテキストに変換できます。
AIのソリューション
- スマートフォンなどの写真管理アプリ
- 顔認証システム
- 自動運転
- RPA(Robotic Process Automation) など
人間の職業でいえば?
- 雑誌社や新聞社の写真部
- 企業の受付、警備員
- バスやタクシーの運転手
- 事務員、アルバイトの業務 など
○ 音声で対話して、アクションができる
iPhoneのSiri、AmazonのEchoシリーズなどに搭載されたAlexa、Googleの音声認識システム、WindowsのCortanaなど、音声認識のAIは日常生活において馴染みの深いものになりました。人間の話し言葉を理解して情報を検索して回答したり、指示にしたがって音楽を流したり、部屋のエアコンや照明のスイッチを入れたりすることが可能になります。
また、リアルタイムでマイクから入力された音声や保存された音声ファイルを、文字起こしすることもできます。
AIのソリューション
- 音声リモコン
- 対話型人工知能による検索
- 文字起こし など
人間の職業でいえば?
- 家政婦
- 介護職員
- 事務員 など
○ 文章を読み取る、翻訳する、校閲する
自然言語処理によってテキストを読み取り、長文の要約、読み取った文章を瞬時に他の言語に翻訳します。校閲して間違いの指摘や、不適切な表現のフィルタリングをすることも可能です。また、FAQなどのデータベースと連動して、質疑応答のできるチャットボットを構築することにより、企業のコンタクトセンターなどで活用できます。
AIのソリューション
- ニュース記事の要約
- 多言語翻訳
- 自動処理による校閲
- チャットボット など
人間の職業でいえば?
- 新聞記者、編集者、ライター、校閲者
- 翻訳者
- コンタクトセンターのオペレーター など
○ 絵を描く、文章を書く、音楽を作曲する
GAN(敵対的生成ネットワーク)のアルゴリズムを使うと、AIはレンブラントのようなタッチで新しい絵を描くことができます。あるいは、自動記事作成ツールによる原稿作成や、音楽制作アプリで作曲やアレンジを自動的に何パターンも生成します。
AIのソリューション
- 絵画やイラストの自動生成、モデルを使わないストックフォト
- 記事の自動作成アプリケーション
- 自動的な作曲・編曲のアプリケーション など
人間の仕事でいえば?
- 画家、写真家
- 小説家、作家
- 作曲家、アレンジャー など
結局AIって何ができないの?
前提として、現在のAIが特化型人工知能である以上、人間の社員のように「社内報に掲載する写真を選んだら、広報の企画を立ててください」というような、複数の業務をこなすことは不可能です。さらに以下のようなできないことがあります。
× 自分で考えられない
AIは膨大なデータから学習してパターン認識のための特徴量を抽出し、学習モデルを構築して新たにインプットされた情報を認識します。クラウド上で学習済みのAPIが提供されていることもありますが、人間のようにアイディアを生み出すことは、いまのところ不可能です。
× 感情を持てない
写真や動画を機械学習して、被写体の人物の感情を推測することはAIには可能です。音声の読み上げでは、怒りや悲しみなど合成音声のデータセットで擬似的に感情を表現できます。しかし、コンピュータ自体に感情はありません。
× 五感や身体感覚がない
ディープラーニングで画像を認識することによって、AIは目を持ったといわれます。マイクで収集した音声を認識する上では耳もあるといえますが、嗅覚など他の五感の獲得は実現していません。当然のことながら、機械なので痛みは感じません。しかし一部の研究者は、AIが賢くなるためには身体が必要であることを指摘しています。
× 創造もしくは想像ができない
GANのアルゴリズムによる「ディープフェイク」の創作が注目を集めていますが、あくまでも学習から自動的に生成しただけで、創造的な動機から描いたわけではありません。また、音声や画像から相手の気分を推論もしくは分析は可能ですが、あくまでも機械的な処理であって想像とはいえないでしょう。
× 夢を見ない
夢には睡眠中に見る夢と、現実世界で描く理想像としての夢がありますが、現在のAIは、どちらも見ることはできません。そもそも機械は眠らず、シャットオフすれば機能が停止します。また、現状に対する不満や社会実現、幸福への希求といった感情がないことから、常にフラットな状態です。
まとめ
当然ですが、AIは魔法の杖ではないことが重要です。特に現在のAIは特化型人工知能であり、人間を支援するコグニティブ(認知)のソリューションとしてとらえると、ビジネスを拡充する頼もしいパートナーであり、強力なツールになります。