近年、企業にとって、データの分析や活用を進める重要性がますます高まっています。本記事では、マイクロソフト社の各種分析ツールを統合したSaaSである「Microsoft Fabric」について、性能や互換性についての検証結果をまとめました。併せてライセンスの種類も紹介しているので、導入の検討材料としてお役立てください。
Microsoft Fabricとは?
「Microsoft Fabric」とは、マイクロソフト社が提供する、企業向けのSaaS型オールインワン分析サービスの名称です。「SaaS」は、「Software as a Service」の頭文字を取ったIT用語であり、インターネット経由で使用可能なソフトウェアを指します。
Microsoft Fabricは、クラウドコンピューティングサービスの「Azure」で提供されていた分析ツールをひとつに統合したサービスです。具体的には「Power BI」や「Azure Synapse」「Azure Data Factory」などのコンポーネントが含まれており、データの移動から変換、分析、可視化、共有まで、あらゆる領域を網羅できます。
使用する前には、あらかじめユーザーごとにひとつのライセンスを取得しましょう。
近年、企業活動において、データの分析や活用などの取り組みが重要視されるようになりました。しかし、データが複雑に管理されている状態では適切に活用できません。そこで、Microsoft Fabricを活用すれば、分散していたデータの取得から視覚化までの流れをワンストップで管理し、厄介なサイロ化を防げます。
サイロ化とはどのような状態?
「サイロ化」とは、組織や情報からの「孤立」を意味する言葉です。各部署間がそれぞれ孤立し、データを上手く共有できていない、あるいは十分に意思疎通を図れていない状態を指します。
サイロ化が進むと、データの分析や活用が困難になります。分散したデータをかき集めるのにコストがかかり、作業効率も低下してしまいます。
Microsoft Fabricの性能・互換性の検証内容
Microsoft Fabricの性能および互換性に関する検証内容の概要を解説します。
まず、データ取り込みやデータ参照における性能の検証では、100万件・1000万件・1億件ごとに、各CSVファイルのデータの取り込みにかかる時間や、Power BIでのデータの参照にかかる時間を測定しました。
データ取り込みの対象は、「Pipeline」「Dataflow」「COPY INTOコマンド」「Notebook(PySpark)」です。Power BIでは、「Lakehouse」および「Warehouse」のそれぞれに対応したPower BIと「Power BI Desktop」を使用し、レポートが表示されるまでの時間を測定しました。データは100万件・1000万件・1億件のテーブルから、3つのマスタを複合しています。
次に、「Azure Synapse Analytics」からMicrosoft Fabricへの移行について、互換性を検証しました。必要な修正の範囲やスケジュール実行などの、運用における共通性を保てる領域をチェックしています。
最後はデータを取り込む際に、ユーザーの氏名や住所、電話番号などを仮定し、ランダムに生成したダミーのCSVデータを使用しました。30個のカラム数には、文字列カラムが14個、数値カラムが14個、日付カラムが2個含まれています。
1ファイルあたり50万件のデータが複数ファイルで管理されていますが、Dataflowでの取り込みに関しては、データを1ファイルにまとめています。
Microsoft Fabricの性能・互換性の検証結果
ここでは、Microsoft Fabricにおける3つの検証から得られた結果を解説します。
データ取り込み性能の検証結果
Microsoft Fabricを使用して、CSVファイルのデータ取り込み処理時間を測定しました。対象はNotebook・Pipeline・Dataflow・COPY INTOコマンドの4方式で、件数は100万件・1000万件・1億件で、各3回行っています。
その結果、最も効率が良かったのはCOPY INTOコマンドであることが判明しました。一方、Dataflowでの取り込みには時間がかかっています。したがって、目的がデータ取り込みだけの場合、Dataflow以外の方法が効率的であると考えられます。
Power BIでのデータ参照性能の検証結果
LakehouseおよびWarehouseそれぞれに対応した、Power BIとPower BI Desktopでのデータ参照時間を測定しました。その結果、どのPower BIでもレスポンスはほぼ同様であることが判明しました。どれだけデータ件数が多くても、ストレスなく使用できます。
Azure Synapse Analyticsとの互換性の検証結果
Azure Synapse AnalyticsからMicrosoft Fabricへの移行において、運用の共通性をどこまで保てるかを検証しました。現段階では、Microsoft Fabric側にエクスポートやインポートなどの移行機能が備わっていないため、パイプラインは一から作る必要があると判明しました。その他にも、一部使用できない機能があることから、代替手段の検討が求められます。
Microsoft Fabricのライセンスの種類
Microsoft Fabricの導入にあたっては、ライセンスの取得が必須です。以下より3種類のライセンスを紹介します。
1. 無料
Power BI以外のコンテンツを作成して、他のユーザーに共有できます。Microsoft Fabric(プレビュー)試用版にサインアップすると、一時的に無料で使える点がメリットです。ただし、使用制限は多くなるため、不便さを感じるのであれば、有料ライセンスを検討しましょう。また、個人向けなので、複数人の共同作業には向いていません。
2. Pro
Microsoft Fabricでは、ユーザー単位でプレミアム機能のライセンスを付与できます。有料ライセンスの中で最も安価で、Power BIコンテンツを他のユーザーへ共有できる点が特長です。ただし、PPU(Premium Per User)ワークスペースの作成はできないため、注意が必要です。
関連記事:Power BIのライセンスによる違いは?一覧表で分かりやすく解説
3. Premium Per User
最上位のライセンスであり、Proよりもストレージ容量などの上限が大きく、組織全体にわたって共有容量を使用できます。他にも、テキスト分析や自動機械学習に対応した、高度なAI機能が搭載されています。組織に対してユーザーが250人未満の場合は、Proよりコスト効率が高くなるため、避けた方が無難です。
まとめ
Microsoft Fabricは、マイクロソフト社が提供している分析ツールをひとつにまとめ、データのサイロ化を防げるSaaSです。Dataflowによるデータの取り込みには時間がかかるほか、Azure Synapse Analyticsからの移行ではパイプラインを一から作る必要がありますが、代替手段を用いれば快適に使用できます。
無料のライセンスも用意されているため、気になった方はスモールスタートからでも、ぜひ導入を検討してみてください。