Blog
ブログ
データ分析ってどうやるの?
どうも、畜産ペンギンです。
今回はデータ分析について書いていこうかと思います。
この業界に居ても、職業としてのデータサイエンティストって
今の所関わり無いしビッグデータを中小企業が活用出来るのももう少し
先になるのかな感がなんとなくありますが
余りに知らなすぎるので、気付いたら時代に取り残されていたみたいに
なったら悲しいなと思い少し調べてみました。
さて、データ分析のプロセスですが、以下のように進めたりするらしいです。
1.目的を定義する。
2.データを計測・収集する。
3.データをチェックする。
4.分析する。
5.発表する。
6.意思決定する。
状況によって途中戻ったりなんなりするけどややこしくなるので割愛。
まぁ流れとしてはそんなもんやろなって感じですよね。
では、個別にそれぞれ見ていきましょう。
1.目的を定義する。
殆どの仕事でそうだと思いますが、結局これが1番大事っぽいっですね。
データ分析でありがちな失敗なのが、分析した結果がでても
「言われてもそんなん出来ない」「もう知ってる」「で、それでどうするの?」
となってしまう事らしいです。うーん、なんとなく想像出来る。
こういった事を避ける為に、まずは「データから何を知りたいのか」を定義する
事により、どういったデータが必要なのかの指針を作る事が重要だと。
2.データを計測・収集する。
まぁこれはそのままですね、必要なデータを集める事です。
ただ、単純な売上やデジタル上の数値だけでなく最近は
「リアルデータ」という物に注目が集まっているようです。
その名の通り、デジタルではなく現実の世界での生活や仕事の中で
発生するデータですね。人であれば視線、顔、表情、行動、健康状態等
があてはまります。
とある大型スーパーでは、店舗に設置された小型カメラを使用して
顧客の導線を認識し、棚で商品を選ぶ時間等を収集・分析し
顧客毎に最適化された店内広告の表示等を行っているそうです。
3.データをチェックする。
ここもまぁそのまま。
誤り、欠落データが無いかどうかを確認し、
必要であれば再度データ計測・収集に戻ります。
4.分析する。
ここがデータ分析の腕の見せ所になるんですかね。
統計学や機械学習など、分析手法は多々あると。
一般的に手法自体は千種類あるとかなんとか、
ただ実際使われているのは数十種類だとかなんとか。
データ分析のアプローチとしては、以下の2つがあるようです。
・確証的データ分析
・探索的データ分析
確証的データ分析は、解決する為の仮設が既に立っており、それを検証する為に使用します。
例:ランチセットに味噌汁がついている物が他のセットより売り上げが良いのでは?
探索的データ分析は、課題や傾向を発見、気付く為に使用します。
例:膨大なデータを整理した所、特定の人に売上が偏っている事がわかった。
どちらが優れている訳ではなく、目的によって
使い分けていこうといった感じですかね。
また、手法としていくつか例を紹介します。
長くなるので、ざっくりと。
・要約
膨大なデータの特徴を代表する新たな値を作成する事。
「平均値」「中央値」「最頻値」等があたる。
・縮約
データの種類(DBで言うカラム)が多い場合
似たカラムを統合して扱う事。
・分類
データをグループ毎に分ける事。
・関係性
データの種類(DBで言うカラム)が互いに
どう作用しあっているかを確認する事。
意識はしてませんがなんとなく普段の生活でもやってる
部分はありそうですね。
5.発表する。
まぁ実際にデータサイエンティストにならなければそこまで気にする
事でも無いかもしれませんが、データの分析結果を話している時に
ありがちなのは「だから何?」と言われてしまう事らしいです。
ちゃんと当初に立てた目的に対してどういう結果が出たかを
話す事が大事と、また、専門的な分野ですのでなるだけ
わかりやすい言葉で伝える事が大事との事です。
6.意思決定する。
そして最後に意思決定。おしまい。
で、終わりにしたい所ですが現状データ分析はそんなに簡単では無く
1回で成功するのは難しいとされているそうです。
試行錯誤しながらサイクルを回しデータ分析方法自体を改善しながら
進めていく為に「意思決定者」「分析者」「現場」それぞれに
データ分析について理解して貰う必要があると。
ハードルは時代と共に下がって行くとは思いますが、
どこかで腹括って取り組まないといけない日が来るのかなー。
という訳で今回はここまでです。
さようなら。
結びのメッセージ
Switch with us!
採用エントリー
ご応募はこちら