AI(人工知能)が機械学習をするためには膨大なデータと高速処理が必要になるため、柔軟に容量や機能を拡張できるクラウドのサービスは最適です。主要なPaaSではAIサービスを拡充し、学習済みのモデルを提供しています。
Microsoft Azure、AWS(Amazon Web Services)、GCP(Google Cloud Platform)で、AI関連のサービスを一覧できるように整理しました。
Azureで提供されるAIサービス
MicrosoftのAzureでは「Cognitive Services」として、AIに関するAPIとサービスを提供しています。企業向けに高度なカスタマイズが可能で、異常検知はAzureのセキュリティ機能に活用されています。
画像認識
■ Computer Vision
画像やビデオから、テキストの抽出、コンテンツのラベル付け、画像の説明、人物の移動など空間分析を自動処理します。
■ Custom Vision
小売、製造、食品など特定の業界にカスタマイズして、画像や動画の認識を行うAIのサービスです
■ Face
顔の認識に特化したサービスで、画像やビデオから顔認証、感情の検出を行います。
■ Form Recognizer
画像やスキャニングされた名刺やPDFファイルのようなドキュメントから、テキストと構造を抽出するサービスです。
■ Video Indexer
ビデオやオーディオのコンテンツから、テキスト、人物、感情などを自動的に抽出します。
■ Ink Recognizer(プレビュー版)
デジタルインクを使った63 の言語の手書き文字を認識して、テキスト化および検索を可能にします。
翻訳/テキスト分析
■ Translator
テキストを他言語に翻訳します。60以上の言語に対応し、ドメイン固有の用語を処理するカスタマイズが可能です。Microsoft 製品の翻訳に関してもサポートしています。音声をリアルタイムで他言語に翻訳する「Speech Translation」もあります。
■ Text Analytics
自然言語処理 (NLP)によって非構造化されたテキストを分析し、人物や地名や組織などのキーフレーズ、トピックや傾向、肯定的/否定的な感情などを検出します。
■ Language Understanding
自然言語処理のアプリケーションを構築できるサービスです。機械学習の経験がなくても、視覚的なインターフェースなどによって直感的な操作が可能です。
音声認識/対話
■ Text to Speech
テキストから自然な響きのある音声を合成します。110 種類以上の声と 45 以上の言語やバリエーションから選択可能。
■ Speech to Text
認識した音声をテキストに変換する文字起こしのサービスです。
■ Speaker Recognition(プレビュー版)
音声の特性から話者を認識します。グループ内の個々の話者の識別も可能になります。
機械学習/レコメンデーション
Azure Cognitive Servicesには入っていませんが、あらゆる種類の機械学習モデルを自動的に構築できるサービスです。
■ Personalizer
強化学習ベースでレコメンデーションのモデルを自動的に作成し、ユーザーの満足度を向上させます。
自動化/異常検知/その他
■ Content Moderator
不快感を与えるような画像、テキスト、ビデオを検出して、フィルタリングを行うためのAIです。
■ Anomaly Detector
推論エンジン、自動検出によって、あらゆる問題の早期発見を目的としたAIを構築します。
■ Bing Custom Search
広告表示のない検索ツールで、ニーズに合わせたカスタマイズが可能です。
AWSで提供されるAIサービス
対話型AIのAlexaを搭載したEchoシリーズのスマートスピーカー、スマートディスプレイの分野を開拓したAmazonは、AWSでクラウド市場のトップに君臨しています。AWSのAIサービスは、利用頻度の高いサービスを優先的に提供していることが特長です。
AIのサービスはインフラストラクチャー、機械学習のサービスを基盤としていますが、AI自体に焦点を当てると以下のようになります。
画像認識
■ Amazon Rekognition
画像や動画から、物体、人物、テキスト、シーンなどを認識します。人物の顔に関しては、高精度の認識と検索の機能を備えています。カスタマイズが可能で、正解ラベルによって認識を行い、手間のかかる機械学習が必要ありません。
■ Amazon Textract
スキャニングした文書からテキストやデータを自動的に抽出します。OCR(光学文字認識)レベルを超えて、フォームとテーブルなどを迅速かつ正確に識別できます。
翻訳/テキスト分析
■ Amazon Translate
翻訳のAIサービスで、深層学習モデルを用いて高速かつ高品質の翻訳を提供しています。独自の用語集でカスタマイズすることも可能です。
■ Amazon Comprehend
テキストから構文、キーフレーズ、肯定や否定の感情などを抽出する自然言語処理(NLP)のサービスで、カスタマイズが可能です。医療用語に特化した「Amazon Comprehend Medical」が用意され、構造化されていない臨床メモから投薬に関する情報を識別可能です。
音声認識/対話
■ Amazon Polly
テキストから人間のようなリアルな音声合成を行います。標準のテキスト読み上げ機能のほか、ニュースキャスターや電話の通話のような音声を合成します。組織のカスタム音声としてニューラルテキスト読み上げ機能も提供しています。
■ Amazon Transcribe
自動音声認識 (ASR)によって音声をテキストに変換する文字起こしの機能です。独自の用語集でカスタマイズすることが可能で、医療関連に特化したサービスもあります。
■ Amazon Lex
対話型チャットボットを作成する機能です。自動音声認識 (ASR)、自然言語理解 (NLU)による高度な深層学習機能が使ったチャットボットにより、コンタクトセンターなどの負荷軽減と、生産性向上を行います。
機械学習/レコメンデーション
■ Amazon Personalize
データに基づいて個人に最適化された推奨機能を構築できます。20年以上もAmazonのECサイトで培った実績が基盤であり、シンプルなAPIによって既存のサービスに統合できます。
■ Amazon Forecast
時系列データから未来の数値を予測します。機械学習によって、時系列データと製品や店舗の所在地などの変数の影響を自動的に解析し、予測精度を50%向上させることができます。製品の需要予測、物流の計画、財務管理、広告やマーケティングなど、あらゆる産業で活用可能です。
自動化/異常検知/その他
■ Amazon Fraud Detector
Amazon.comのノウハウに基づく不正検知サービスです。
■ Amazon Kendra
エンタープライズ検索サービスで、自然言語処理の機械学習をベースにしています。
GCPで提供されるAIサービス
GoogleのAIは画像認識の分野で大きな成果を上げていますが、AIエンジニア向けのサービスを一般にも提供していることが特徴です。次の3つに分類されています。
- AI HUB:ホステッド型リポジトリ
- AI ビルディングブロック:APIによるデベロッパーツール
- AI Platform:コードベースの開発環境
AIビルディングブロックとして提供されているサービスを中心にピックアップしました。カスタマイズ機能は、「AutoML」というブランド名で提供されています。
画像認識
■ Vision AI
Vision APIは、事前トレーニング済みの画像認識サービスです。AutoML Visionを使うと、カスタムモデルを構築できます。
■ Video AI
Video Intelligence API では事前トレーニング済みモデルを利用して、物体や人物などの抽出、テキストの識別、動画コンテンツにアノテーション(情報タグ)の追加などが行えます。カスタムモデルの構築にはAutoML Video Intelligenceがあります。
翻訳/テキスト分析
■ Translation
事前トレーニング済みのモデルを利用して翻訳を可能にするTranslation API、コンテンツとシステムにリアルタイムの翻訳を追加できるMedia Translation API、そして高品質のカスタム仕様による翻訳のAutoML Translationがあります。
■ Natural Language
機械学習によってテキストの構文解析を行い、コンテンツの分類、感情の分析などの情報を抽出します。クラウド上のストレージに格納したドキュメントと統合することも可能です。Natural Language APIは事前トレーニング済みモデルで、AutoML Natural Language はカスタマイズのためのサービスです。
音声認識/対話
■ Text-to-Speech API
40 以上の言語(方言を含む)と220 種類以上の音声によって、自然なイントネーションでテキストを読み上げます。
■ Speech-to-Text API
ニューラルネットワークによる音声認識で、125以上の言語と言語変種から音声コマンドや文字起こしを行うことが可能になります。ストリーミング音声の認識もできます。
■ Dialogflow
チャットボットを構築するためのサービスです。Webサイト、モバイルアプリやIoTなど、さまざまなシーンで活用できます。
機械学習/レコメンデーション
■ AutoML Tables
最先端の機械学習モデルを構築できます。販売や物流の管理、セキュリティにおける不正行為の検出、マーケティングなどビジネス上のシステムにAIを導入する際に役立ちます。
■ Recommendations AI(ベータ版)
検索エンジンや広告、YouTubeなどで培ったノウハウをベースに、AIによる推奨機能を提供します。
自動化/異常検知/その他
■ Cloud Inference API(アルファ版)
時系列のデータから、リアルタイムで大規模な相関分析を行います。
まとめ
IoTの利用が高まるにつれて、エッジAIも注目を浴びるようになりました。推論などの学習はエッジ(端末)で行い、学習全体のモデルの更新などはクラウド上で行う方式です。クラウドで提供されているAPIをうまく利用するとともに、必要な部分をカスタマイズするとよいでしょう。