統計解析を活用したデータアナリティクスの基本 第3回(柳下亮平) デジタルマーケティングにおける基礎的な時系列解析 概論編 1/2

1102

デジタルマーケティングにおける時系列データ

第2回のコラムでは架空のアクセスログデータを題材に、抽出したデータ(標本)から母集団について推測するといった基礎的な統計手法について触れてきた。統計手法の多くは同一の確率分布から得られた互いに独立である標本の集まりとした独立同一分布に従うデータを対象とすることが一般的な考え方にはある。そのため、独立同一分布に従う標本はデータに前後の関連性を認めないデータとなる。一方で、前後の関連性を認めるデータとして一定の間隔で観測をした一連のデータである時系列データがある。例えば気温や売上、株価などが時系列データとして扱われる場合が多い。時系列データは時間的な前後関係が存在するため、それに応じた統計手法を選択し、評価をする術が求められる。また、目的のデータに自己相関があるなどの時間的な関連性が考えられる場合は、統計モデルに組み込むことで現象を説明することに活用したい。

ビジネスでは時系列データを集計し、今後の意思決定に繋げることがある。例えば、売上の推移とそれに付随するデータ(来客数や販売数量など)の推移から関連性を考察し、意思決定をすることは一般的なアプローチである。そして、同様に企業のデジタルマーケティングにおいても広告出稿やサイトのアクセスログを時系列データとして扱い、今後の方向性について考えることが多い。例えば広告の場合、広告の対象とする商材にもよるため一概には言えないが、認知から購入までのプロセスには時間経過を考慮して、その寄与や役割を考える場合がある。つまり、広告は時間的な前後関係を仮定し、施策の検討やその結果を判断することがある。一方、広告出稿より得られるデータより、認知から購入のどのプロセスに広告の寄与を認めるかについては困難であり、各企業がその立証に力を注いでいる。本項では時系列解析の観点から広告の効果について可能な限り説明をし、広告の効果について評価していきたい。


時系列解析の手法について

一般的に時系列解析は統計的手法の工夫が必要となる。そのため、詳細は参考文献を参照されたい。本項では時系列解析の手法としてBox-Jenkins法による自己回帰和分移動平均モデル(ARIMAモデル)と状態空間モデルを扱うことで、広告効果の説明を行う。また、今回はBox-Jenkins法を中心に説明としたい。Box-Jenkins法は古典的ではあるが現在でも活用する機会が多い時系列解析のフレームワークと言える。また、予測精度も高いことや、R言語をはじめとして自動化が可能なことから汎用的な活用が期待できる。そこでまずは、時系列解析の基礎としてBox-Jenkins法によるARIMAモデルから説明する。

Box-Jenkins法による時系列解析にはデータの定常性(本項では弱定常性を意味とする)が前提条件となる。それは、Box-Jenkins法で扱う各時系列モデルは定常なデータに対して高い説明力をもつためである。時系列データの定常性と非定常性について説明をする。平易な表現をするならば、定常性に従う時系列データ(定常過程)は性質が一定であり、時間的に変化をしないものである。一方で、非定常に従う時系列データ(非定常過程)は性質が時間と共に変化するものである。



上記のプロットから分かるように、定常過程は一定の範囲内にデータの推移が収まっている。また、非定常過程はデータの推移は一定ではなく、データの推移はトレンドの存在や、推移の増減は不確かとなる。時系列データの表記として時点1から時点Tまでの観測されたデータをとして表し、簡略的にと表記する。そして、定常過程では任意のtとkに対して以下が成り立つ。

上記から期待値は時点によらず一定であり、自己共分散と自己相関は時間差のみに依存する。また、観測されたデータに対して一切手を加えていない状態を原系列と呼ぶ。そして、時系列データは一般的に原系列に対して自然対数の底をeとした対数変換をし、対数系列に変換することが多い。対数変換によるメリットは加法モデルと乗法モデルの切り替えや、データのばらつきを一定の範囲で表せるなどのことなどが挙げられる。また、対数系列に対して差分を取った対数差分系列は近似的に変化率とみなすことができる。

本項で扱うARIMAモデルなどの時系列モデルは定常過程でないと扱うことが出来ないため、非定常過程から定常過程へと変換する必要がある。そして、原系列が非定常過程であり、差分系列が定常過程であるとき、それを単位根過程と呼ぶ。また、1階差分を取ることにより定常過程となる場合は1次和分過程と呼び、拡張してd階差分ではd次和分過程と呼ばれI(d)と表す。重要なことは、単位根がないとみなせるまで差分を取る必要があるということである。原系列が非定常過程な時系列データの場合、定常過程に変換することがBox-Jenkins法の第一歩である。


お問い合わせ

当社のサービス・製品に関するご相談やご質問、お見積りのご依頼など、こちらからお問い合わせください。