そういえば異動したよって話。

1月の頭に部署が異動になりまして、広告事業本部からアドテクスタジオになりました。

これが自分が生きていく中でどんな意味合いがあるのかを色々と考えてます。

P1020242

1.予測モデルと立ち向かわなきゃ。

多分「分析やるんやー」っていう自分の人生の中で一番大きな意味合いはここなんじゃないかと。

今まではクライアントのサービスの状況や、マーケティングの情報を可視化・分析して何か施策に落とせないかな?という事をコンサルとしてやっていました。

データ分析しない人(というか多分している人でさえ)にとって、「因果関係と予測」の違いはあまり頭の中にないかと思います。

が、ここには雲泥の差があるわけです。

例えば地域の犯罪率と警察官の数のデータを各地域分持っているとしましょう。

行政は犯罪率の多い地域により多くの警察官を投入します。

よって、警察官が多いほど犯罪率が高いというデータを手にすることになります。

ある地域のデータが抜け落ちており、その地域の犯罪率を予測したい場合、警察官の数はかなり有力な予測の元データになりえます。

ただ、これに意味合いを付けてしまうと「警察官を増やすと犯罪率が上がる」というちょっと意味不明なことになってしまいます。

じゃぁ犯罪率を下げるためには警察官を取り除けばいいのか?とそんな議論になってしまうわけです。

ここで必要なのは、ある地域に警察官を一人追加した際に犯罪率がどのように変化するであろうか?というものです。

犯罪率が解らない地域の犯罪率を予測する事と、警官一人追加したときの犯罪率への影響を知る事は、ふわっとしゃべった感じでは同じに聞こえても、実は別の考え方に基づいて分析されなければいけません。

で、前者の様な試みは予測モデルと呼ばれ、後者の試みは因果推論と呼ばれるわけです。

前者は広告の分野で言えばアドテクプロダクトの中身で使われるもので、兎に角予測の精度が求められます。どんなデータをどんな処理をしても良いからとにかく当てる事が要求されます。ただ、そのため大量にデータを導入したり複雑なモデルを運用する必要が発生してしまうわけです。

後者は広告であれば効果測定やコンサルティングで使われるもので、施策やアクションの効果がどの程度だったのか?を出来る限り正確にとらえ、それを正確にレポートすることが求められます。こちらの場合では仮説ベースで分析を進めることが多いので、自然とデータの利用量は少なくなります。ただ、仮説の良しあしで効果がどのくらい正確にとらえられるかが決まってしまうので、仮説出しがかなり結果を左右することになります。

で、僕は完全に後者側の人間として生きてきたわけです。計量時系列とかをカウントに入れれば予測モデルをやったことが無いというのはウソになりますが・・・。

今回の異動で僕のミッションは大きく変わり、予測モデルを作る側になりました。

立ち向かわなきゃ。という心のもとに今必死になっております。

 

2. じゃー俺価値無いのかな?

正直異動してみるまで自分の価値無いんじゃないかな。って思ってました。

だってデータ揃っていたらkaggleとかで上位にあるモデルパクればなんかソコソコの結果でちゃいそうだったし。

機械学習をそもそも専門でやってる人達いるし。

が、何とか自分の存在意義がありそうな部分をちらほら見つけました。主にデータそろえる部分とかで。

予測モデルを作るにしても、どんな変数を用意するか?とか、データの選定をどうするか?っていう前処理に近い部分は結局仮説ベースな事が多いので、因果推論と広告を知っている事が価値になりそうだなと。

モデリングの部分はもっとに相談しながらやっていきたいですねw

なんで何とか自分の価値を見出せそうです。

 

3. 個人としてのゴールはどこに置くべきなんだろ?

業務でやらないからーって言って時系列以外の予測モデルはちゃんと勉強してこなかったんですけど、これを機会にちゃんと向き合い始めたのはたぶん自分にとって良い影響がいっぱいあると思います。

多分w

直接的なものは今は見えてないんで・・・

ただ、自分が今後予測モデルだけで生きていくとも思えないので、やっぱりアナリストとして目指すべきはハル・バリアンが提示したような因果推論と予測モデルのバランスなのかなーと思うわけです。

因果推論をするにもきっと機械学習の様な知識が役に立つ機会があると思います。

分類器の結果をモデルに入れる事とかも計量経済学で今後もっと普遍的になるかもしれません。

そんな流れにちゃんと乗れるようにこの1年2年とかで成れたら良いなーと思っております。

ちゃんと勉強しなきゃ。

 

4. もうちょいプログラミングやらねば。

Japan.Rの言語セッションで今後Rだけで飯が食えるのか?もっとほかの言語を学ぶべきなのか?という質問をさせてもらったことがあります。

その時の回答は「分析する言語自体はRで問題ないけれども、データの基盤とかにもっと触れるようになっておかないとね」という物を頂きました。

まさにその通りかなと。

仕事でずっと(とはいっても1年半程度ですが)Rを使ってきたので、良くも悪くもRしか使えません。

データベースもSQLiteとMySQLがせいぜいです。

やること自体はデータを扱う事なのですが、もう少し自分の触れる物を広くしていく必要性が今回の異動でぐっと増しました。

勉強しなきゃ・・・

 

 

てなことを考えてます。

人生に必要な事はRで全部やるという構想にとうとう終わりがやってきたのかもしれませんね。

カテゴリー: R パーマリンク

コメントを残す