統計解析を活用したデータアナリティクスの基本 第2回(柳下亮平) デジタルマーケティングにおける基礎的な統計解析 1/3

20180611ec

データの情報化と価値化

ITの台頭により企業におけるデジタルマーケティングの果たす役割が高まっている。それに伴い、デジタル化されたデータも増加の一途を遂げている。そのため、蓄積されたデータを活用し、成果とすることは容易ではない。つまり、膨大なデータの中から「どのデータ」が目的に対して関連性があるのかを説明し、それを踏まえて「どのような経営判断を行えばよいか」を決定しなくてはならないからだ。それには事象に内在する概念を数学的に捉え、数学の理論を用いた数理的な解釈が有効となってくる。そこで、統計学を活用した統計解析によりデータを「解釈が可能な情報」に換え、「価値ある示唆」を導くことがデジタルマーケティングにも求められている。


分析と解析の観点

データを経営判断に活用するための、BIツールの導入に対する期待は大きい。その役割は企業に蓄積された大量のデータを集めて分析し、意思決定を助けることにある。BIツールは場合によっては有益なツールである一方、組織に浸透していかないケースも散見される。理由としては複数考えられるが、データに対して四則演算の結果をグラフや表で表現した情報では解釈が限られてしまうためではないだろうか。また、情報の粒度によっては解釈が多岐にわたり、共通見解を得がたい場合が想定される。そこで上記を解決するためにはデータアナリティクスの「分析」と「解析」の観点が必要であり、本項ではそれぞれの定義を以下の通りとする。

  • 分析の観点とは数理的な扱いは少なく、グラフや表でデータの要素や構成を表し、関係を明らかにすること。
  • 解析の観点とは数理的な扱いが多く、データの要素や構成を数学的な式として表し、定量的な数値から関係性を明らかにすること。

この2つは役割が異なる為、どちらが重要かといった比較はできない。目的を達成するためには場合や状況を考慮した適切な方法を選択することが重要となる。本項では特に解析の観点を中心として扱い、デジタルマーケティングに付随するデータアナリティクスについて基礎的な統計解析を用いて解説する。


デジタル広告を例題とした解析

本項では架空のアクセスログを用いて解説を行う。以下の図は自然検索とリスティング広告、ディスプレイ広告から自社サイトへの流入とコンバージョンまでの流れを示す。


コンバージョンはビジネスの目的により定義は異なるが、ここでは、注文数や問い合せ件数などの数値を想定している。また、アクセスログはユーザー単位のレコードであり、50件抽出したデータとする。明らかにしたい内容は、各経路からの流入数(以下、SS)とコンバージョン数(以下、CVs)の関連性や寄与度合いを評価することとする。


以上を実現するために、統計解析環境はR言語(統計解析用のプログラミング言語と開発実行環境)を使用する。また、具体的な手法の詳細などの解説は、ページの都合上、参考文献に委ねる。


①各経路とCVsとの関連性

まずは、各観測データの分布の状況をプロットすると、以下を得る。図のOrganic.SSは自然検索SSを示し、Paid.SSはリスティング広告SS、Display.SSはディスプレイ広告SSを示している。


赤点線枠の自然検索SSとCVs、また、リスティング広告SSとCVsの散布図から、流入数が増えるとCVsが増えるといった分布が確認できる。一方で、ディスプレイ広告SSとCVsには流入数が増えるとCVsが増えるといった分布は「目視では」確認できないかもしれない。
そこで、関連性を定量的に示すために、各経路SSとCVsの関連性をピアソンの積率相関係数(以下、相関係数)から評価する。以上から相関係数を求めると次の相関行列を得る[1]


CVsと自然検索SS、リスティング広告SSの相関係数から中程度以上の相関が確認できる。また、CVsとディスプレイ広告SSの相関は無相関に近い状況にある。以上から、次のように考察される。

  • 相関係数から判断すると、広告出稿を考えたとき、直接のCVs獲得に対してはリスティング広告が中心の可能性があり、ディスプレイ広告は直接のCVs獲得に対しては判断を保留とする。
  • ディスプレイ広告の性質上、直接のCVs獲得には機能として向いていないという側面を考えると、場合によっては妥当な結果とも考えられる。(但し、本データから導き出される結果であり、一般的なディスプレイ広告に共通する性質という訳ではない。)

お問い合わせ

当社のサービス・製品に関するご相談やご質問、お見積りのご依頼など、こちらからお問い合わせください。