データフローという言葉をご存知でしょうか。データフローとは、システムやプロセスでのデータの流れや処理のことです。そして、データフローを可視化しやすいよう図で表したものがデータフロー図です。プロジェクト標準化を推進するうえでは、データフロー図の作成が欠かせません。本記事では、データフローの概要とメリット・デメリット、データフロー図作成のポイントや注意点、データフロー図の作成に役立つマイクロソフトのクラウドサービス「Azure Data Factory」について解説します。
データフローの概要、メリット・デメリット
まずデータフローの概要とメリット・デメリットについて解説します。
データフローとは
データフローとは、システムやプロセスでのデータの流れや処理のことです。そして、その流れをグラフィカルに表現したものをデータフロー図といい、略してDFDとも呼ばれます。システムを開発するうえで、データフローを整理してデータフロー図を作成することは、認識のずれや不具合の防止にもなるため重要です。
データフロー図作成のメリット
図でデータの流れを記述するため、視覚的にわかりやすくなります。その結果、業務効率化につながるほか、営業担当者が顧客にシステムの仕様を伝える際にも説明しやすくなるでしょう。システム開発において業務全体を一目で把握できる点は、データフロー図作成の最大のメリットです。
データフロー図作成のデメリット
データフロー図の作成は、システムを開発する前段階である仕様合わせの際に行われることが多いです。場合によってはデータフロー図のデータの流れとは違う流れでシステム開発を進めたほうがよいため、実際の動作とデータフロー図が一致しないケースがあります。
データフロー図の作成
データフロー図を作成するポイントと注意点を解説します。
ポイント
ポイント1.システム全体のデータの流れを確認しよう
データフロー図を作成する前に、システム全体のデータの流れをざっくりと把握するべきです。システム全体の流れやプロセスがイメージできていないままデータフロー図を作成することはできません。顧客への十分なヒアリングを行い、データの流れを整理しましょう。
ポイント2.データの発生場所と利用場所を整理しよう
データがどのプロセスで発生するのか、どのプロセスで利用されるのかを事前に整理しておくことで、データフロー図をスムーズに作成できるようになります。
ポイント3.データの蓄積について把握しよう
データはどこかのプロセスで蓄積されることがほとんどです。どのプロセスで常時または一時的に蓄積されているのかをまとめておくことも重要です。
ポイント4.処理を記述していこう
上記3つのポイントについて整理できたら、データフロー図として処理を記述していきましょう。処理は丸印で記述し、処理と処理は矢印でつなぐなど、データフロー図作成における一般的な決まりに沿って記述すると、見やすくわかりやすいデータフロー図になります。
注意点
注意点1.データには入力と出力がある
プロセスでのデータにはシステムに入力される入力データと、システムから出力される出力データの2種類があります。それらを区別しておかなければ、データフロー図として成り立たなくなってしまいます。
注意点2.データフロー図の粒度を意識
データフロー図の粒度が粗すぎると詳細なフローがわかりづらくなり、逆に粒度が細かすぎるとシステム全体を一目で把握しにくくなります。そのため、必要な情報は入れつつ、一目でシステム全体像を把握できる適度な粒度で作成することが重要です。
「Azure Data Factory」を導入してデータフロー図を作成
Azure Data Factoryの概要とできることについて解説します。
Azure Data Factoryの概要
マイクロソフトが提供するAzure Data Factoryは、さまざまなデータを収集し、収集したデータを連携できるデータ統合管理のクラウドサービスです。情報化社会が急速に進むなか、膨大なデータが取り扱われるようになり、データの形式もさまざまです。たとえ膨大なデータを収集することができても、データの管理や連携は困難でしょう。そこで、Azure Data Factoryのようなデータの統合管理サービスを利用することで、データの一元管理が可能となります。
Azure Data Factoryでできること
できること1.さまざまなシステムとの連携が可能
プロトコルを考えたり、プログラムを記述したりすることなく、オンプレミス・クラウド環境を問わずさまざまなシステムのログやデータベースなどの外部ソリューションと簡単に連携でき、データ連携基盤として利用できます。
できること2.データの収集
システムと連携後、システムのデータをクラウドのストレージに移行することで、容量を気にすることなくデータの収集が可能です。生データを収集した後、すぐに利用できるデータに変換されます。
できること3.データの変換や利用
Azureのストレージに格納したデータは、目的に応じてさまざまな形式に変換できます。また、データを利用してグラフを作成することも可能です。
できること4.データ監視
ストレージに格納したデータ状況や、データ統合が成功したかどうかなど、データをモニタリングできます。
マッピングデータフローの活用
Azure Data Factoryには、マッピングデータフローというGUIで視覚的に操作しながらデータフロー図を簡単に作成できる機能があります。マッピングデータフローにてデータ結合や集計処理などのデータフローを可視化することで、データフローの整理やノンプログラミングでのデータ変換ロジックの開発も可能です。
まとめ
企業の規模が大きくなればなるほどプロジェクトの標準化は重要です。プロジェクトを推進するうえで従業員が徹底すべきルールを定めていないと、方向性や作業方法に相違が生じ、後戻りや非効率につながるおそれがあります。プロジェクトの標準化を推進するためには、データフローの整理が欠かせません。データ連携や管理ができるクラウドサービス「Azure Data Factory」には、データフロー図を簡単に作成できる機能が備わっています。Azure Data Factoryを上手く活用してプロジェクト標準化を推進し、業務の効率化やコストの削減につなげていきましょう。