統計解析を活用したデータアナリティクスの基本 第4回(柳下亮平) デジタルマーケティングの時系列データ解析 実践編

1031

Box-Jenkins法のARIMAモデルを用いたデジタル広告の時系列解析

本項では第3回のコラムに続き、架空のリスティング広告のアクセスログよりそのCVs獲得の寄与を評価して行く。以下に、前回のコラムにある架空のアクセスログとTVCM出稿の推移を再掲する。


本項の目的は、CVsに寄与を与えていると考えられる要因を、手元にあるデータから広告の寄与について説明することである。その際、購買決定プロセスで仮定した各指標がCVsに対してプラスの寄与を与えているか否かを評価する。例えば、クリック数はInterest(興味・関心)の喚起を役割として仮定した指標とする。そのため、クリック数がCVsに対してプラスの寄与があるとした場合、リスティング広告はInterest(興味・関心)を喚起している可能性がある。

まずは、CVsの自己相関を確認する。以下は対数変換をした対数系列のCVsの推移と、コレログラムの相関係数(ACF)と偏相関係数(PACF)となる。左下の相関係数のグラフからCVsは自己相関があることが確認できる。


続いて、Box-Jenkins法によるARIMAモデルを考える。その際、ARIMAモデルにはARIMA(p,d,q)の次数を決定するモデルの同定が必要となる。モデルの同定には単位根検定による階差の決定とAICによるモデル選択からの次数決定、モデルの評価が必要となる。そして、モデルの推定された係数から各指標のCVsに対する寄与を考える。しかし、実際は上記のステップを全て行い、階差や次数を求め、モデルを評価する作業は負担を要する場合がある。そこで、R言語の{forecast}パッケージのauto.arima関数を用いて自動的にモデル選択を行う。

2014/1から2018/6までのデータを訓練データとしてモデルを構築し、予測の検証には2018/7から2018/12までをテストデータとする。また、応答変数をCVsとし、説明変数をクリック数、平均セッション時間、ページ/セッション、TVCM出稿とする。このTVCMの外因性を含むモデルはARIMAXモデルと呼ばれる。更に、季節成分を含むことでSARIMAXモデルとなる。例えば、TVCMを行った際、CVsが同時期に数値として跳ね上がることがある。その跳ね上がった数値は異常値として扱われることがあり、場合によっては除外されるなどの対処を行うなどが必要とされてきた。しかし、現在では異常値に起因するであろうTVCMやその他のプロモーションなどを外因性として組み込み、変動の要因としてモデルに利用されることがある。本項ではTVCMの寄与も知るために外因性として組み込んでいる。また、外因性の変数である外生変数は『0と1』のダミー変数で代用しているが、データとしてTVCM出稿のコストや、実際に放送されたときのTVCMの視聴率であるアクチュアルなどを用いても興味深い示唆が得られる。そこで、auto.arima関数によって求めた推定結果は以下となる。


推定結果にある『clicks』はクリック数を示し、『avg_session_duration』は平均セッション時間、『pageviews_per_session』はページ/セッション、『tvcm』はTVCM出稿の説明変数となる。 この時、ARIMA(1,1,0)(1,0,0)[12]という季節成分が含まれたSARIMAモデルが自動的に推定された。そして、以下は予測のプロットとなる。


上記のプロットの黒色の点線と青色の実線は観測されたCVsの実数の推移となる。加えて、赤色の点線は推定したモデルに対してテストデータにより求めた予測のプロットになる。また、薄い青色の範囲は80%信頼区間を示し、薄い灰色の範囲は95%信頼区間を示している。以上から、モデルを用いた予測としても当てはまりは良さそうである。一方で予測については定性的な評価だけではなく、時系列モデルの予測精度や正しさについては残差項の自己相関と正規性を定量的に調べることが重要となる。そこで、残差について調べる。本来、時系列モデルの残差項には正規分布に従うホワイトノイズが仮定されており、正しいモデルが構築されているかについては残差の正規性を調べる必要がある。更に、ホワイトノイズになるということは残差が自己相関を持たないといったことになる。まずは、{forecast}パッケージのcheckresiduals関数より残差の自己相関を調べる。そこで、自己相関の有無はLjung-Box検定を用いることにし、帰無仮説と対立仮説は以下となる。

  • 帰無仮説:k時点で離れたデータとの自己相関が全て0である。
  • 対立仮説:いずれかの自己相関が0ではない。

つまり、Ljung-Box検定の場合、残差項に対する自己相関はp>0.05で帰仮説が棄却されなければよい。よって結果は以下となる。


以上から、p>0.05より、有意な自己相関は見られない。また、以下のグラフの上図は残差系列を示し、左図は残差の自己相関のグラフ、右図は残差のヒストグラムである。


Ljung-Box検定の結果である残差の自己相関についてはコレログラムからもk時点で離れたデータとの自己相関がないことが分かる。続いて、残差の正規性について検討する。残差のヒストグラムからは正規分布に従っているようにも見える。そこで、残差の正規性の検定はJarque-Bera検定とし、{tseries}パッケージのjarque.bera.test関数を用いる。

  • 帰無仮説:正規分布に従う。
  • 対立仮説:正規分布と異なる。

Jarque-Bera検定の結果、p>0.05より有意に正規分布とは異なっているとは言えないことが分かる。続いては、推定された係数から何が分かるのかについて説明をしていく。


推定された係数の評価

前提として、購買決定プロセスであるAIDAと各説明変数を仮定して広告の役割を考えることにした。Interest(興味・関心)とDesire(欲求)を仮定したクリック数と平均セッション時間、ページ/セッションがCVsに対してプラスの寄与がある可能性があるため、リスティング広告はInterest(興味・関心)の喚起とDesire(欲求)の醸成を促している可能性が考えられる。

Attention(注意・認知)の役割を仮定したTVCM出稿についてもリスティング広告のCVsに対してプラスの寄与が考えられる。つまり、TVCMによるAttention(注意・認知)の獲得を促せた可能性が考えられる。だとすれば、TVCM出稿のリスティング広告のCVsに対して、その程度についても知りたい。つまり、TVCM出稿の有無によるCVsの獲得はどの程度なのかについても関心が生まれる。そこで、状態空間モデルを用いてTVCM出稿の有無による寄与について考えたい。

※本項の例ではいずれもプラスの係数になったが、場合によってはいずれかの係数はマイナスということもある。その場合は、CVsを減らす要因になるので、場合によっては是正策を検討する必要がある。


状態空間モデルによるTVCM出稿の寄与

ここでは、TVCM出稿の有無におけるリスティング広告のCVsについて状態空間モデルを用いて考えていく。状態空間モデルの詳細については参考文献に委ねるとするが、状態空間モデルとは、目に見えない『状態』を仮定した時系列モデルである。例えば、本項で扱うリスティング広告の効果は本来では目に見えないものである。その目に見えない状態から、CVsという『観測値』が手に入ると考える。そこで、状態の変化を状態方程式として記述し、また、状態から観測値が得られる過程を観測方程式として定義する。以上が状態空間モデルの基本的な考え方であり、状態と観測値を切り離して理解することができる。本項ではTVCM出稿の外生変数を組み込むことで状態空間モデルを構築することにする。この場合、結果は以下のようになる。


赤色の実線がTVCM出稿の寄与を含むCVsの推移となり、緑色の実線はTVCM出稿の寄与を除外したCVsの推移となる。全体としてTVCM出稿におけるリスティング広告のCVsは大きく寄与していないことが考えられる。

昨今ではデジタル広告とマス広告ではその連動性を考慮した施策が一般化している。しかし、TVCMとデジタル広告の効果を定量的に評価することは難しいため、状態空間モデルなどを用いて説明することは今後、更に重要になってくると考える。


デジタルマーケティングにおける時系列解析の活用

これまで、実際のビジネスシーンも活用する時系列解析について、広告の効果を題材に評価を行ってきた。R言語の詳細なコードなどは参考文献に記載されているので、参照して頂きたい。デジタルマーケティングにおける時系列解析は実用面でも活用の場が多く、目的に対するデジタルマーケティングの寄与を定量化することが難しい対象には解析のための強力な武器となる。


参考文献
沖本竜義.(2010).経済・ファイナンスデータの計量時系列分析.朝倉書店.
馬場真哉.(2018).時系列解析と状態空間モデルの基礎:RとStanで学ぶ理論と実装.プレアデス出版.横内大介, 青木義充.(2014)現場ですぐ使える時系列データ分析~データサイエンティストのための基礎知識.技術評論社
萩原淳一郎, 瓜生真也, 牧山幸史.(2018)基礎からわかる時系列分析-Rで実践するカルマンフィルタ・MCMC・粒子フィルター.技術評論社

柳下亮平

執筆者 柳下亮平

データアナリティクスを中心とした、デジタルマーケティングのコンサルティングを専門に行っています。

お問い合わせ

当社のサービス・製品に関するご相談やご質問、お見積りのご依頼など、こちらからお問い合わせください。