近年、データ活用に欠かせなくなりつつあるのが「データ活用プラットフォーム」です。本記事では、データ活用プラットフォームの基礎知識について解説します。また、一般的なデータ活用プラットフォームサービスの内容を整理し、課題やメリット、構築までの手順、おすすめの基盤サービスについても併せてご紹介します。
データプラットフォームとは
「データプラットフォーム」とは、組織が保有する膨大なデータを適切に処理し、活用するための基盤をいいます。DX時代を迎えた現代において、あらゆる企業がデータをビジネスに活用するために、なくてはならない存在です。
特に近年では5G技術の登場に伴い、「PaaS(Platform as a Service)」と呼ばれる、「IaaS(インフラとしてのクラウドサーバー)」にプラットフォームが追加されたクラウド型サービスを利用することが主流になっています。
データプラットフォームのメリット
では、データプラットフォームを利用すると、具体的にどのようなメリットがあるのでしょうか。
多くの企業では、取得したデータが社内のさまざまなシステムやツールに分散して保管されており、必要なときに必要なデータを取り出したり、タイムリーに活用したりできない課題を抱えています。しかし、中にはデータを適切に活用することで、従来のビジネスモデルを変革し、業績を飛躍的に伸ばしている企業もあります。
そこで、まずデータを扱う基盤づくりを行ったうえで、社内でのデジタルデータ活用を積極的に推進していくことが求められています。その基盤となるのがデータプラットフォームです。
データプラットフォームには基本的な機能として、たとえば以下のようなものが用意されています。
- データの収集・蓄積・連携
- 膨大なデータの管理
- データ分析
- データの可視化
これらの機能により、ユーザーのニーズに応じて一気通貫でデータ収集から活用、保守までスムーズに行えます。「Microsoft Azure」「AWS(Amazon Web Service)」「GCP(Google Cloud Platform)」など、主要なクラウドベンダーから選択してサービスを利用できるのもメリットといえるでしょう。
また、従来は必要とされていた「ミドルウェア(OSとハードウェアの中間に位置し、複雑な処理を行うためのソフトウェア)」の別途調達や保守、障害対応などが不要となるのも特長です。クラウド環境のため、インターネット回線さえあればどこからでもアクセスできる利便性についても評価されています。
データプラットフォーム導入の課題
一方、自社にデータプラットフォームを導入して活用する場合、いくつか課題もあります。
まず、デジタルデータを活用する際には、試行錯誤しながら進めることになるため、導入当初は投資の効果が見えにくいと思われるかもしれません。また、市場や組織の変化によって、ユーザーのニーズや扱うデータが変わってくる可能性もあります。その時々の状況を見極め、柔軟かつタイムリーに修正を施し続けていかなければ、失敗してしまうリスクに直面するでしょう。そのため、まずは本格的に導入する前に、スモールスタートでデータプラットフォーム構築を行うことがおすすめです。
しかし、パブリッククラウドやオープンソースでのプラットフォーム構築となると、セキュリティ面で一抹の不安が残ります。近年ではクラウドサービスのセキュリティも向上傾向にありますが、万全を期す意味でも、既存システムと同等に強固なセキュリティ対策を講じる必要があるでしょう。
このように、確実にセキュリティ対策を行い、スモールスタートで構築したあとは、活用の効果を検証し、トライアンドエラーを繰り返していきます。検証の営みによって、自社にとって理想的なデータプラットフォームとは何かを確認でき、将来的な拡張にも対応していけるでしょう。
データ活用プラットフォーム構築の手順
ここからは、データ活用のためにプラットフォームを構築する手順についてご紹介していきます。
自社に必要なデータ分析プロセスを把握する
まず、自社が掲げているビジネスにとって、必要なデータ分析のプロセスを把握することから始めます。それには「CRISP-DM」と呼ばれる標準プロセスを参考にするとよいでしょう。これは「ビジネスの理解」「データの理解」「データの準備」「モデリング」「評価」「展開」といった、データによって価値を生み出せるまでのライフサイクルが概念として含まれています。CRISP-DMを参考にしながら、データプラットフォームにどのようなプロセスが必要なのかを整理します。
扱うデータの種類や処理方式を検討する
次に、扱うデータの種類を検討します。データ構造には、大きく分けて「構造化データ(基幹システムに蓄積されるデータ)」と「非構造化データ(音声・画像・動画などのデータ)」の2パターンがあり、ビジネスで重要なビッグデータの8割程度は後者にあたるといわれています。そのため、ビッグデータを扱う場合は、非構造データを処理するのに適切なプラットフォーム構築を設計する必要があります。
さらに、デジタルデータの処理方式についても併せて検討します。これにも、一定期間データを蓄積したうえで処理する方法と、次々発生するデータを時系列で連続的に処理していく方法の2パターンがあります。たとえば、膨大なデータのリアルタイム分析が必要な作業では、後者を選択しなければなりません。
データプラットフォームの全体像を把握する
上記のことを検討できたら、用途に対するシステム構成と使用方法をまとめた「リファレンスアーキテクチャ」を作成し、データプラットフォームの全体像を把握しましょう。
リファレンスアーキテクチャを参考にして、データの収集・処理・分析・保管といった各プロセスで、それぞれどのような機能が必要なのかを定義し、必要な技術・機能を組み合わせて構築します。データ構造やデータの処理方式によって、それぞれに合った要素を選んでいくイメージです。また、データに対してより深い洞察を得るため、新たにデータ量などに応じて適切な分析プラットフォームを追加検討するのもよいでしょう。
このように段階を踏んで、活用範囲の拡大、そしてAIや機械学習などを用いたデータ活用の高度化へとステップアップしていくことが、理想の導入プロセスといえます。
データ活用プラットフォーム構築2種類の方法と特徴
では実際に、データプラットフォームをどのように構築していけばよいのでしょうか。以下では2つの方法を取り上げ、それぞれの特徴についてご紹介します。
一つのベンダーのツールを利用
1つ目は、ある特定のベンダーを決めて、そのツールを利用する方法です。
ベンダー提供のツールは多機能なものが多く、利便性の高さという点で魅力的です。しかし、それゆえに使わない機能まで整備してしまうリスクは否めません。あまり機能が多いと使いこなせない可能性もあり、機能を習得するまでにかかる時間や、ツールに精通した人材を確保・育成するための手間やコストの発生も懸念されます。
また、ツールの導入コストなども考慮すると、導入後のやり直しがしにくいというデメリットもあります。そのため導入に失敗しないよう、慎重に導入すべきツールを検討する必要があるでしょう。
複数のツールを組み合わせて整備
2つ目は、複数のツールを組み合わせて整備する方法です。
データプラットフォームをスモールスタートで導入する場合は、余分な初期コストがかからず、やり直しがききやすいオープンソースソフトウェアやパブリッククラウドを組み合わせて整備するほうが得策です。初期投資がほとんど不要で導入できるため、トライアル感覚で気軽に構築できます。
また、扱うデータはビジネスの変化などで変わる可能性があります。オープンソースソフトウェアやパブリッククラウドであれば、あとからでも柔軟に機能を拡張できるため、変化にも対応しやすいでしょう。
まとめ
データ活用には、データ収集・分析・活用までを一気通貫で行えるデータプラットフォームの構築が不可欠です。Microsoft Azureであれば、Microsoft 社製品との親和性が高く、高セキュアでオンプレミスとの連携も充実しています。データ活用基盤の導入をお考えの方は、ぜひ検討してみてはいかがでしょうか。