データ分析には複雑な計算が必要です。さまざまな手法を用いた分析は、一般的には専用のアプリケーションで行われます。ところが、基本的なデータ分析は、エクセルの機能のひとつである分析ツールを活用して行うこともできます。この記事では、t検定で相関を確認するなど、エクセルで行うデータ分析方法の使い方について解説しています。
データ分析にはエクセルの「分析ツール」を利用しよう
エクセルには、データ分析が行える「分析ツール」機能が搭載されています。分析ツールはエクセルのアドインのひとつで、統計学的分析、ヒストグラム、回帰分析など幅広い分析方法が手軽に行えるツールです。分析に必要な情報やパラメータを指定すると、提供されている統計学・工学用の計算式から適したマクロ関数が適用されます。分析によってテーブルやグラフなど、よりわかりやすく可視化された資料の出力も可能です。
「分析ツール」は標準的な機能ではないため、アドインを追加しなければ使えません。「エクセルのオプション」からアドインの追加を行うことで、ようやく分析ツールを使用できます。
エクセルの分析ツールを活用する3つのメリット
「分析ツール」では、関数などがわからない人でも問題なく使用でき、多くの分析が試せます。分析に役立つ指標・グラフといった資料の出力も可能で、いろいろな分析手法で処理し、営業活動やマーケティング活動まで幅広く役立てられます。
①特別な関数やコードが必要ない
エクセルで分析処理を行う際は、関数で処理する方法もあります。関数計算を使う場合、「AVERAGE、GEOMEAN、COVAR」などのいろいろな式を組み合わせて分析します。しかし、関数の計算は入力や範囲指定のミスに注意が必要で、それぞれの関数の内容や使い方をよく理解しておかなければなりません。
ところが分析ツールを使う際は、複雑な関数の知識が不要です。相関係数、回帰分析、t検定などそれぞれ調べるものに適した手法を選んでから、データの範囲など値を入力するとすぐに計算結果が表示されます。
②分析手法のほとんどは「分析ツール」でカバーできる
分析ツールには主な分析手法が登録されています。2つの変数の関係を表す「相関」、調べたいものの主要な傾向や変動を調べる「基本統計量」、過去の変数の平均値を元に将来の値を予測する「移動平均」、1つの従属変数が他の変数に与える影響を確かめる「回帰分析」、2標本の基になる母集団の平均を検定する「t検定」、さまざまな品目の分散分析が行える「分散分析法」など、基本的な分析手法が揃っています。企業が営業活動で収集した独自データを元にして、将来の値や傾向など営業活動に役立つ分析情報を算出する際に必要な分析手法のほとんどがカバーされています。
③データ分析だけでなく指標やグラフに出力できる
エクセルでは、調べたいデータを短時間での分析処理が可能です。分析によって算出された指標は、わかりやすいように一覧で表形式にまとめられ、グラフへの出力も可能です。通常であれば、指標やグラフは見やすいように形式を整えなければならず、作成に時間がかかります。分析ツールの場合は、処理までに長い時間が不要で、なおかつ自分で資料を整える負担が軽くなります。18種類の指標・グラフなどの出力が手軽にできるため、これまで手作業で作成していた場合は資料作成の作業時間が短縮、業務の効率化につながるでしょう。
エクセル標準搭載!分析ツール7つの機能と使い方
分析ツールでは、いろいろな分析手法を使用でき、分析結果はマーケティング活動などの営業戦略に貢献するでしょう。分析ツールでは、まず基本となる「相関・基本統計量・F検定・移動平均・回帰分析・t検定・分散分析法」の7つを押さえておきましょう。
また、実際にツールを使って分析をするときは、1度に1つのワークシートでのみ実行できます。グループ化されたワークシートのデータを分析する場合、結果は最初のワークシートに表示されて残りのワークシートには数値などが入っていない空のテーブルが表示される点には留意してください。
①最低限知っておきたい「相関」
「来客人数と売上額」「雨と売上高」など、2つの情報の関係性の強さを分析する機能です。店舗にたくさんの来客があった日には売上高が多かった、強い雨が降る日ほど売上高が落ち込むなど、片方のデータが変化したときにその変化に応じてもう片方のデータも変わる関係性を「相関」と呼びます。「相関」では、2つの変数がどれだけ強い関係にあるかをチェックできるため、相関関係を明確にすると売上向上につながる要素がわかります。
売上と天候の相関、時間帯との相関、曜日との相関を比較することでキャンペーンに適した時期を導き出すことができます。また、売れている商品の価格帯と客層の相関は、新商品の開発に役立つでしょう。
②データ全体の特徴を把握「基本統計量」
「基本統計量」とは、調べたいデータに対してよく利用される統計値を利用して自動的に値を計算する機能です。「基本統計量」を使用すると、平均、標準偏差、中央値、分散などの統計値から尖度、歪度などの値まで、さまざまな統計値が自動で計算されます。
ちなみに尖度とはデータの分布を表す数値で、グラフの形状の尖度が高いほどデータにまとまりがあります。歪度は分布時の左右の歪みを示す数値です。正規分布は歪度が0の状態を指し、左右対称で歪みがない形をしています。この歪度はグラフが左に偏っている場合はマイナスで右に偏っている場合数が大きくなります。
ビジネス上では、基本統計量を集計し、その推移から近未来を予想します。営業一人当たりの顧客数の平均値や売上の平均値、客単価の中央値などから、次期の目標値を設定する際などで使用されます。
③データの分布・ばらつきを確認「F検定」
「F検定」は2つの標本を使った分散(平均値からの距離)の状態を比較します。F検定を利用すると、2つの母集団のばらつきに差があるかどうかを確認できます。
まず、2つの母集団の分散が異なっていることを検定するために、母集団同士の比較によってわかった2つの標本の差を変数にして確率分布を算出します。次にすでに定められているF分布表のF値と比較して差があるかないかを判断します。営業活動に利用する場合、デザインが異なる商品を2種類掲載したWebサイトで、サイトの閲覧時間に違いがあるかどうかなどの確認が可能です。
④時間で変動するデータのトレンドを確認「移動平均」
「移動平均」では、時間の移動に伴う定期的な平均値の変化を記録していきます。移動平均からは、過去のデータ全ての平均値を出すだけではわからない平均値の推移が確認できます。売上高の推移を時系列で確認すると、休日など曜日による違い、季節による売上の変化がわかります。悪天候や急激な気温の変化など、時期を照らし合わせることで突発的な変化の要因まで確認が可能です。
ビジネスでは、売り上げの変化が社会的要因によるものか、季節的なものかを確認する際に役立ちます。著しく売上が高くなった/低くなった時期があれば、原因を究明して、今後に活かせます。
⑤変数の変動を予測・説明する「回帰分析」
「回帰分析」とは、1つの従属変数が関係する独立変数に与える影響を示す分析手法です。実用的な手法のひとつで、因果関係のあるデータに対して回帰分析を適用すると、特にビジネスで役立ちます。例えば、営業活動においては、広告費(原因)が売上高(結果)に影響を与えているかなどの仮定が可能です。
⑥データの効果や品質を評価する「t検定」
「t検定」は、平均値の検定とも呼ばれています。「t検定」を使った場合、2つの正規分布の標本の平均値が同じか異なるかを読み取って判断します。2つの平均値から算出された結果は0~1の値に収まり、この数値は「p値」と呼ばれています。p値があらかじめ定めておいた値より小さいとき(通常はt≦0.05)に「有意差がある」と判断できます。
例えば、去年と今年の社員満足度アンケートを行った場合、2回分のデータを比較して去年が増加したか(減少しているか)を確認するためにt検定を適用したとしましょう。p値が0.05よりも大きい場合は有意差があるとは言えず、誤差の範囲内です。p値が0.05以下なら有意差があると判断でき、間違いなく増加した(減少した)と判断できます。
⑦3つ以上のデータの効果や品質を評価する「分散分析」
「分散分析」は、それぞれ異なるものの平均値の違いを確認する手法です。標本が3つ以上あるときに役立ちます。ある特定の要素がデータに与える影響を及ぼすかどうかを検定するのが一元配置、同じく2つの要因についてチェックするときは二元配置を使います。
例えば、複数店舗における「曜日ごとの売上」と「商品の種類」を分散分析にかけると、どこに差があるかがわかります。店舗間で差があれば、立地やキャンペーンなどが影響したなど、原因を特定できるでしょう。
まとめ
エクセルには、データ分析が行える「分析ツール」機能があります。このツールでは、相関や基本統計量、移動平均など、分析で利用されるさまざまな統計手法を手軽に利用できます。分析のために関数を勉強して入力する必要がなく、データ分析とともに指標やグラフの出力までできるため、ビジネスにおいても活用したいツールのひとつです。