データ活用はレシピと下ごしらえから
先日友人に「なぜ(男性は)、言えばすぐにあったかいご飯が食卓に並ぶと思うんだろうね(怒)」という愚痴を聞かされました。「冷蔵庫にある素材を見て、何を作るか決めて、調理に取り掛かることに慣れてない人は、想像できないんだろうねー」と答えたのですが、この話はデータ活用でもありがちだなと思いました。
「蓄積された情報があれば、欲しいレポートがすぐに出てくる(だろう)」と思っている人があまりにも多いのではないでしょうか。昨今データが身近になっているからこそ、そう感じる場面が増えているのかもしれません。
今回はデータ活用のためのレシピづくりと、下ごしらえの大事さについてご紹介したいと思います。
- 目次
知りたいことは何ですか?分析のレシピを考えましょう。
塊のお肉からハンバーグを作るには大変な手間がかかるように、データも素材のままではなかなか活きてきません。手間と暇をかけてデータを必要な形にしてこそ活用できるのです。
データを活用するにあたって、どう活用しようかのイメージはありますか?そもそも本当に欲しい情報が、欲しい形で蓄積されていますか?
データ分析にもレシピが必要です。作りたいもの(最終目的)と、材料(使用データ)、調理方法(分析軸)を意識して、分析の為のストーリーを作ることで何を使って何をすべきかを見極めることができます。
・そのデータを使って何をしたいのか目的を決めましょう
「流入を増やしたいのか」「コンバージョンを上げたいのか」「ターゲットユーザーを絞りたいのか」。
何を目的とするかによって、データの切り口は変わってきます。「どんな目的を達成するためのどんなデータが欲しいのか」きちんと作りたいものを意識しましょう。
・情報の中心を決めましょう
たとえばECサイトの場合、よく売れる商品の販売傾向が知りたいのか、購入頻度が高い顧客の購買傾向が知りたいのか。商品の話なのか、ユーザーの話なのかで主語が変わってきます。いうなれば、主菜次第で、必要な副菜が変わってくるのです。
・どんな軸で情報を知りたいのか、軸を決めましょう
作りたいもの(目的)と主菜(核となるデータ)が決まったら、どういう調理をすることで知りたい情報にたどり着くのか、分析の指針にする軸を決めましょう。
時間の経過とオーバーラップさせて時間軸で顧客の動きを知りたいのか、行動傾向から次の行動を予測する行動軸での動きが知りたいのか、どんな手法で分析をしていくかのイメージを持つことで、さらに必要な情報が絞り込まれていくはずです。
情報技術分野に「Garbage in, garbage out」という言葉があります。これは『無意味なデータ』をコンピュータに入力すると『無意味な結果』が返されるという意味ですが、データ活用においても目的のない『無意味』な数値を並べてみても、そこに意味を見出すのは難しいものです。闇雲にデータの分析を行うより、事前に目的を明確にして「意味を持った」分析を行いましょう。
データの下ごしらえ
データを何に使うのかが決まってもまだ焦ってはいけません。データの下ごしらえが大事です。お料理でもそうでしょう?丁寧な下ごしらえは料理のおいしさに跳ね返ってくるのです。
データの下ごしらえでは、材料(カラム)は揃っているか、加工(表記統一)がされているか、加工方法(グループ化のルール)は適切かの3点を確認するようにしましょう。
・材料はそろっている?~必要なデータ項目の確認~
どういうレシピで分析するかがイメージできたら、そのストーリーを実現できるか材料を確認しましょう。さてあなたの持っているデータにその必要なカラム(項目)は網羅されていますか?カラム(項目)があっても中身がないなんてことはありませんか?
・必要な加工はされている?~表記の統一~
材料があっても加工がされていないと加工の手間がかかります。ハンバーグが作りたいのに、塊肉しかないと、ひき肉にするところから始めないといけません。
データもカラム(項目)が網羅されていてもその中身が自由回答だらけで、そのままでは集計できない情報というケースがままあります。たとえば、同じ内容でも「はい」と「yes」では機械的に集計したときに別の回答内容として認識されます。これでは分析して活用する際にまずは同じ内容ごとの振り分け作業が発生してしまいます。
システムなどの導入時、または早い段階で極力カラム(項目)の中に格納される項目は可能な限りマスタ化して、選択して入力されるようになっていることが望ましいでしょう。
・加工方法は適切?~グループ化のルール~
データも解析していくにあたって、グループ化という加工を行います。このグループ化におけるルールはできているでしょうか?
どのグループに振り分けるかが、入力する人の判断にゆだねられていると、人によって振り分け先が違ってしまって傾向が見えてこないなんてこともあります。まぎらわしい分類をできる限り排除したグルーピングをしっかり検討しましょう。
欲しいデータがない場合は?
・作れるデータか、作れないデータか調べましょう
たとえばアパレルのECサイトがあったとして、インナーやアウターといった商品カテゴリごとの購買傾向を知りたいとします。それまでデータ活用を考えてこなかったので、「1商品ごとの登録はあってもカテゴリは項目として持っていない。」こんな場合は、
1.カテゴリマスタを作る
2.商品にカテゴリの紐づけ作業を行う
3.カテゴリ単位で、売上データを解析する
こうすることでカテゴリ単位の売り上げ傾向を知ることができるようになります。
このように分析したい直接の項目がない場合でも、既存のデータに新しい情報を組み合わせて作ることのできるデータや、既存の情報同士を組み合わせて作ることのできるデータがあるのです。
また、過去に何度か遭遇したことがあるのが、ユーザーを区別するためのユニークな(固有の)IDがないという状況です。この場合、何か「個別のユーザー」を分類できる情報をユーザーIDの代わりにするのですが、それが電話番号なのかメールアドレスなのか住所情報なのかという議論になります。
氏名では同姓同名の可能性があるし、電話番号もメールアドレスも住所も変わる可能性があるので「何をもって1ユーザーとするか」という定義をする必要があります。
この場合、氏名の他に「電話+住所」「電話+住所+生年月日」など使えるカラムを複合的に使うことで、より細かく選別ができます。こういった選別をもって分析用のユーザーIDとし、それ以降はユーザー登録時に附番するようにすれば下ごしらえは完了です。
この時に、「どう定義したのか」「後付けで附番したのはどこまでか」という基本的な情報は、定義書ないし引き継ぎ書のような形で明文化しておくことも大事なポイントです。
・もとになる情報が無かったら?
取得しておらず、作ることもできない情報は、「ないものは現段階では仕方がない」と諦めましょう。しかし、この先もずっと取得しないということではなく、足りないと思ったその時以降から取得するようにルールやシステムを変えていきましょう。
そうすれば今は諦めたことでも、この先できるようになります。足りないと思ったときに動くことがその後の向上の足掛かりになります。
ストーリーと下ごしらえで作るデータ活用
データはそこにあるだけではただのメモリ喰い虫です。データの価値は活用することで上がっていき、大切な資産となります。
活用の為にはレシピ作成と下ごしらえの各3点のポイントをしっかり押さえて実施しましょう。
・レシピ作成 ⇒ 最終目的と、使用データ、分析軸を意識したデータ活用設計
・下ごしらえ ⇒ カラム(項目)はそろっているか、表記統一されているか、グループ化のルールは適切か
データをどう活用していくかレシピを考え、そのレシピを実現するための下ごしらえを行うことがデータ活用の最初の一歩になります。
データの先にはユーザー、つまりお客様の行動が見えてきます。お客様の行動を知り、より適切な改善を行うことで結果につながるトライができ、そのトライを分析することで、何がエラーだったかを知ることができるのです。
お客様を知るデータ活用のための最初の一歩を踏み出しませんか。