Microsoft社が提供しているAzure Purview。クラウドサービスでAzureは聞くけど、Azure Purviewはどう言ったものか気になっている方もいるのではないでしょうか。ここでは
- Azure Purviewとは?
- どのような機能があるのか?
- メリット
の3つに分け、詳しく説明していきます。
Azure Purviewとは?
Azure Purviewはオンプレミス、マルチクラウド、SaaSにあるデータを統合し、管理するデータガバナンスのサービスです。それぞれのデータを一つのサービスにまとめることで、データ検出が容易になり、有益な情報を引き出しやすくなりました。
サービス内に「Azure Purview Data Map」と「Azure Purview Data Catalog」「Azure Purview Data Insights」の3つが内蔵されており、データの管理、検出を簡易的に行えます。
今までは、一つ一つのデータを分析して比較するという面倒さがありました。しかしAzure Purviewは、データを自動的に抽出して分類し、データとそれらに関係するマップを作成するため、作業効率も上がります。またデータ資全体の分析情報をグラフで提示するため、全体でデータを管理しやすいのも魅力の一つではないでしょうか。
Azure Purviewはデータガバナンスに優れた機能とは?
それぞれのデータを1つのサービスにまとめることで、様々なことができるようになりました。具体的には、データガバナンスに優れた機能が3つあります。
- 資産を全体的にデータ管理できる
- 資産全域のデータを簡単に検出できる
- 機密データの俯瞰して把握できる
それぞれがどのような機能なのかを詳しく解説します。
資産全体をデータ管理できる
データの管理を行うAzure Purview Data Mapがあります。この機能を利用しデータ管理を行います。
主な内容は
- ハイブリッドソースのメタデータを自動的に抽出
- データを分類
- SQL Server、Azure 、Microsoft365、Power BI間でデータの一貫性を行い、ラベル付を行う
- Apache Atlasを使用し、データの統合
簡単にいうと、データを抽出し、ふるい分けを行う。振り分けられたデータにラベル付けを行う作業をAzure Purview Data Mapが行います。
従来、人の手によって行われていた作業を、Azure Purview Data Mapにより行われ作業効率も上がります。
データ管理を視覚化し、容易に管理しやすくなったと言えるでしょう。
資産全体のデータを簡単に検出できる
データの検出を行うのは、Azure Purview Data Catalogを使用して行います。主な検出内容は以下のものです。
- よく使う専門用語を使ってデータ検出が可能
- Excelデータの辞書はいらない
- 対話型でデータを保存していくためデータの変遷を確認できる
専門用語を内蔵されているため、必要なデータを入力することで、いとも簡単に検出することができるのもAzure Purviewの特徴といえます。
データ量は膨大に存在しているため、検出するのも一苦労でしたが、パソコンの扱いが難しい方でも手軽に扱えるサービスとなっています。
機密データの俯瞰図が把握できる
機密データの俯瞰図が把握は、Azure Purview内にある「Azure Purview Data Insights」を使用して行います。データの管理や簡単な検出ができるだけでなく、データの分析も容易に行えます。
具体的な機能として
- 各データを資産ディメンション別に表示
- スキャンの成功率、失敗率の更新情報を表示
- 用語集の追加を行うことで、検索結果の改善を常時行う
これらを駆使し、グラフや表で視覚化しやすくなっています。またグラフや表だけでなく、「Subscriptions」「Unique classfications found 」「Classfied sources」「Classified files」それぞれ項目の数値化を可視化しているため、容易に分析することが可能です。
Azure Purviewのメリット
Azure Purviewのメリットは3つあります。
- 既存のデータの情報を最大限に引き出す
- 必要なデータを検出し、容易に把握できる
- 追加するデータを統合し、ユーザーが理解しやすい
これらを容易に行うことができるのが魅力的です。それぞれについて詳しく解説します。
既存のデータの情報を最大限に引き出す
サービスの中に、データを登録できるクラウドサービスがあります。常に記述されるデータを追加されるデータをアップロードされ、Azure Purview Data Mapで集められたデータをAzure Purview Data Catalogで分析します。
分析し解析されたデータがモニターに表示され既存のデータと比較し、必要かつ最大限な情報を提示します。
必要なデータを検出し、容易に把握できる
業務上、開発やビジネスシーンにおいて、他のデータと比較や参照をしながら資料を作成します。そのときに必要なデータを探すのに手間取る方がいると思います。
Azure Purviewの中にある必要となるデータを簡単に見つけ出し、把握しやすいようになっています。
またデータのインデックスも作成されるので、検出で簡単にデータを見つけられやすくなっているため、把握しやすいと言えます。
追加するデータを統合し、ユーザーが理解しやすい
データは常に追加されていくものです。サービス内では、追加されたデータをタグ付やドキュメント作成ができるため、データ全体を充実させることができます。
追加されたデータを統合し、分析されるため、他の人でも容易に理解できるようになっています。
他の人でも理解しやすいということは、それらを扱っているユーザー自身も理解しやすいと言えるのではないでしょうか。
Azure Purviewの始め方
Azure Purviewの基本的な構成は以下の内容です。
- データソース
- コレクション
- データ資産
- 分類
- 洞察
- ビジネス用語集
これらを順番に行うことで基礎固めができ、データ分析を行えるようになります。上記の構成要素について簡単に説明します。
データソース
データカタログを作成する時に必要な情報を登録する対象のものを指します。
企業が保存しているデータをソースとして登録し、基盤づくりを行います。
コレクション
コレクションとはカテゴリー分けのことをいいます。データを分類別し、それらのデータを階層化することも可能です。
データを分けることで、整理整頓され理解しやすくなるのではないでしょうか。
データ資産
ソースにあるデータを読み取ることで、データの資産として自動的に登録されます。
登録されたデータは、Azure Purview内の「Brwse assets」から確認できます。Azure Purviewの中にある検索機能で絞り込みを行いながらデータの確認を行うと容易に行なえます。
分類
登録されたデータは、自動的にラベル付けされます。このときのラベル付も設定が可能で、「スキャンルールセット」により分類のルールを設定します。
手動での分類分けもできますが、量が膨大にある場合は、自動でのラベル付けで分けることをおすすめします。
洞察
取り込んだ情報をAzure Purview内で確認することができます。
この時点では、Azure Purviewが提供している形式やフォーマットで確認する形になりますが、どのような分類分けをされているのかをここで確認するといいでしょう。
ビジネス用語集
企業内での独自の用語があると思います。これらをAzure Purviewで登録しデータに付与することで、情報の拡張をすることができます。
ビジネス用語集を登録し、データ資産を活用しやすいようにしましょう。
まとめ
Azure Purview内に、「Azure Purview Data Map」と「Azure Purview Data Catalog」「Azure Purview Data Insights」の3つが内蔵されており、必要なデータを容易に検出できるだけでなく、分析を視覚化して情報を把握しやすいようになっています。
また企業により独自のビジネス用語があると思いますが、これらの用語を登録することでデータのタグ付を自動的に行い、情報を理解しやすくなっています。
資料作りのときにも、必要なデータを的確に得られるので、作業の効率化も図れるでしょう。
Azure Purviewで企業の中にあるデータを網羅して分析し、情報管理を容易にしてみませんか?