企業活動で日々収集・蓄積するデータを有効活用するためにデータ分析を行うことは、企業経営の意思決定に欠かせません。Azure Synapse Analyticsはそれらの作業を1つに統合したプラットフォームです。Azure Synapse Analyticsの概要や導入するメリット、使い方、導入事例について紹介します。
Azure Synapse Analyticsとは?
「Azure Synapse Analytics」はデータ統合機能とデータウェアハウス(DWH)、ビッグデータ分析を1つにまとめた、Microsoft社が提供するエンタープライズ分析サービスです。カラム型ストレージを採用したリレーショナルデータベース管理システム、Azure SQL Data Warehouseの後継サービスとなります。データ活用はデータ収集、データ保管、データ分析と3つのプロセスがあります。例えば日常的にBIツールを利用してデータ収集・分析をし、データを保管するデータウェアハウスは別のサービスを利用していると、データ分析のために各サービスを連携させることは大きな障壁でした。
データ収集は抽出(Extract)、変換(Transform)、格納(Load)というETLの各プロセスを経てデータウェアハウスに格納されます。データ保管はスケール化や用途に応じた使い分けが求められ、高度なセキュリティも必要です。また、データ分析も単にデータ検索するだけでなく、複数のデータソース間の連携や機械学習(ML)、直近の1分以内に公開された未集計のライブデータのリアルタイム分析なども求められます。Azure Synapse Analyticsはこれらの課題を解決し、ビッグデータ処理に適したフレームワークや、ビックデータ分析専用の保管場所を提供するなど、全面的にデータ分析の機能を強化されているのが特徴です。
Azure Synapse Analyticsを導入するメリットとは?
Google CloudやAWSなど各社でデータ活用サービスは提供されています。その中でMicrosoft社のAzure Synapse Analyticsを導入するメリットを具体的に解説します。
無限のスケールを持っている
社内の部署単位で収集したデータだけでなく、ビッグデータまで含め、あらゆるデータを無制限のスケールで分析できます。一般的には各システムで動作が異なるデータウェアハウスと、分散しているビッグデータを1つに統合することは困難です。その点、Azure Synapse Analyticsは双方をシームレスに統合し、すべてのデータからの分析情報を超高速で配信できます。そのデータ容量はテラバイトより上のペタバイト規模です。リレーショナル、非リレーショナル両方のデータで巨大なデータクエリを発行できます。
使い慣れたプログラミング言語を使用できる
新しいビジネスツールを導入するときに、すでに利用している言語が使用できないと、新たに言語のチューニングが必要となります。その点、Azure Synapse AnalyticsはITエンジニアが使い慣れたプログラミング言語を使用することが可能です。例えばScala、Pyton、.Net、Java、R、SQL、T-SQL、Spark SQLなど幅広く多くのスクリプト言語に対応し、互換性があります。サーバレスでも専用リソースでもお好みの言語で問題ありません。多様な言語と互換性があるため、分析タスクやデータエンジニアリングを広く行う場合に最適です。
BIと機械学習を統合して分析ができる
BIツールと機械学習(ML)は別個のシステムですが、Azure Synapse AnalyticsはBIツールと機械学習の連携が可能です。AzureのMachine LearningやCognitive Services、Power BIを緊密に結合し、AIとBIを統合した分析ができます。データウェアハウスやビッグデータを統合した大規模データから、発見した分析情報からインサイトが得られます。また、BIや機械学習の開発時間を大幅に削減し、さらにMicrosoft365やOpen Data Initiative、Dynamics365などのSaaSツールと連携すれば、スムーズなデータ適用の実現が可能です。
最新のセキュリティを搭載している
Azure Synapse Analyticsは自動化された最新のセキュリティと、プライバシー機能を搭載しています。例えば接続方式で自動脅威検知機能やデータの常時暗号化機能を自動化。加えてAzure Active Directory認証やシングルサインオン認証もあります。リアルタイムデータマスキングやダイナミックデータマスキングにより、機密データへのアクセスを自動的に保護します。ユーザーの実行制御情報はカラムレベルと行レベルのセキュリティで、制御することが可能です。
Azure Synapse Analyticsの使い方
Azure Synapse Analyticsを構築し、分析する方法について、Microsoft社から提供された記事を参照して解説します。
Synapseワークスペースの作成方法
Azure portalを開き、検索ボックスに「Synapse」と入力。検索結果の「サービス」から「Azure Synapse Analytics」、「追加」を選択し、ワークスペースを作成します。「基本」タブの「プロジェクトの詳細」で、任意のサブスクリプションを選択、リソースグループを使用。「Managed Resource group」は空白のままです。「ワークスペースの詳細」で”myworkspace”など一意の任意の名前を選択します。データを含むストレージが配置されているリージョンを選び、「アカウント名」で「新規作成」。「File system name」の「新規作成」で“users”という名前のストレージコンテナーを作成します。「確認と作成」、「作成」を選択すると数分でワークスペースの準備は完了です。
Apache Sparkを使用した分析方法
Synapse Studioの管理メニューからApache Spark poolsを作成できます。Sparkを使用した分析エンジンで、タイプはサーバレスのみですが、データをメモリに読み込み、並列にクエリできる性能にすぐれます。Spark CoreやAnacondaなどデフォルトのコンポーネントの他、必要なライブラリを構成に追加することも可能です。簡単な分析であればSmallサイズのNodeを最大数3に設定すれば足ります。詳細な手順は下記サイトを参照してください。
専用SQLプールを使用した分析方法
SQLを使用した分析エンジンで、タイプはサーバレスと専用サーバの2つがあり、どちらもAzure Data Studioなどのツールに接続可能です。サーバレスSQLプールは容量を予約せず使用可能で、クエリを実行するために処理されたデータ量に基づいて課金されます。専用サーバSQLプールは従来のSQLデータウェアハウスと同様のサービスです。詳細な手順は下記サイトを参照してください。
Azure Synapse Analyticsの導入事例
最後にAzure Synapse Analyticsを導入した企業の事例を紹介します。
経営改革プランの分析基盤として採用
某大手物流企業は組織の改革プランを実行するにあたり、デジタル化とデータ活用を同時に推進することを検討していました。データ活用のために強固なデータ分析基盤構築の必要に迫られます。パフォーマンスや機能、コストなどを総合的に比較検証した結果、Azure Synapse Analyticsのパフォーマンスがトップクラスで、日本語処理も問題なく、料金プランも固定であることから採用されました。
ビジネスや社会の急激な変化に対応
某大手金融系企業は必要不可欠な基幹業務のデータを大量に扱うため、クラウド活用に慎重でしたが、ビジネスや社会の急激な変化に対応するため、クラウド移行のプロジェクトの検討が始まりました。パブリッククラウドにMicrosoft社のAzureが採用され、Azure Synapse Analyticsを導入し、クラウド上のデータ活用が始まりました。システム用途やセキュリティレベル、可用性などを基準とし、システムを順次クラウド化しています。
まとめ
Azure Synapse Analyticsはデータウェアハウス(DWH)とビッグデータ分析を1つに統合したプラットフォーム。異なるシステムを連携し、分析業務を効率化します。基幹システムのクラウド化と同時にAzure Synapse Analyticsを導入する事例があります。自社のケースに合わせ、導入の可否を検討してください。