データ分析との出会い 3

2011年の夏にノルウェーで勉強を始め、意気揚々と修士で一番難しい授業を片っ端から履修しました。そして思い知るわけです・・・如何に僕が数学が出来ないかを。

その時点での僕の数学の知識は、基礎的な統計・微分(教科書読みながら)のみで、他の数学に関する知識はゼロでした。(いや、本当にw)

そんな中で下みたいな数式に出会ってしまったわけです。

 

resource11

 

 

いや、あの時の焦燥感は半端じゃなかったですw(理系の人から見れば鼻くそ程度の物なわけなんですが・・・)

そして復習をしながら悟りました、とりあえずこのレベルは無理だから素直に基礎からやろうと。

よって1学期目は兎に角数学を勉強しました。その一方で経済的な意思決定を数学モデリングとプログラミングで行うという授業も履修し、計算自体は全てプログラムで行えば良いという割と大事な感覚も得ていました。

この授業のおかげで僕の中の数学の目標が「モデルを理解・作成出来る様になる」という所まで落とし込め、計算なんか自分で出来なくてもプログラムで全部やれれば良いと考えるようになりました。

コレはどの程度難しい数学までやるか?という問題から来る頭の痛みをかなり緩和してくれました。

なので、僕は原理を知っていても未だに手計算出来ない事がいっぱいあります。でもそれは割りとどーでもいいです。ただ、知らないことをプログラムに計算させることは出来ないのでもっと勉強しなければと思う毎日です。(因みにですが、義務教育の数学でもR等を使って勉強をすればいいと思っています。)

さて、データ分析の話に戻るとこの最初の学期ではあまり応用的な分析はしませんでした。

覚えているお題で言えば、

1.1950年〜2010年の石油価格データ・アメリカのGDP・エネルギー消費量を使って石油の消費動向を分析しろ

明らかに石油ショックの影響を見つけ出せという内容になるので、石油ショック以降と以前にダミー変数を入れてエネルギー消費と石油価格がGDPに与える影響を見ました。
石油ショック以降はGDP1%の成長が必要とするエネルギー消費量が減り、脱石油社会への道のりが若干ですが見て取れました。

2.アメリカの個人データ(年収・年齢・人種・住所等々)からその人(世帯)が持っている総資産額を推定しろ

いい場所に住んでて人種が白くて年齢が高いと普通に資産額が高いっていうつまらない結果でした。また、年収が一定以上上がると資産額がグイっと高くなりました。恐らく消費できる額には割りと限界があるということだったのでしょう。

3.不動産の特徴(築何年・家のタイプ・場所・部屋数・キッチンサイズ等々)から住宅の適正価格を推定しろ

家のタイプと築年数は組み合わせ効果があり、ヨーロッパスタイルだと古いほど高くなるという結果が出ていて面白かったです。あと学校の地区でダミー変数を入れると通りの向かいであっても価格がかなり違うというのが面白かったです。

4.NYのFulton fish marketの売上量と価格データを用いて価格予想

価格から供給量を予測し、売上量から価格を予想するという典型的な同時方程式の推定でした。ちなみにこの時には全く魚に興味がありませんでしたw

5.あるマクロ経済学の実証論文(マネーサプライとインフレとGDP成長の関係性について )をデータ分析の視点で否定しなさい。

あんまり覚えてないですw

 

とまぁ多種多様なデータ(ミクロなものからマクロなものまで)を扱って色々と議論する事が出来ました。

一方でデータ分析結果を前提として最適な選択をするという事もやっていました。(上のプログラミングでってやつですね)

1.他種類の原油があり(産地によって成分が異なる)、処理施設(性能が異なり、生産物の比率が違う。)が複数あって、市場の需要情報が分かっている時にどのような配分で処理施設に送るべきか?

oilampl

なんかどこかで観た感じのある図ですね。同じ計算でアトリビューションの予算配分なんかが出来るんじゃないかなと密かに考えています。

2.電力の自由市場システムを実際に構築し、最適な入札戦略を考案する。

電力が自由化された市場では発電所がただ発電するのではなく、幾らで電力を売るか?というのを入札しなくてはなりません。次の1時間は50000kwを〜ユーロで売りますと言った具合です。

そして需要側も入札を行い、下の図のようにそれらがおなじになるところで価格が決定されます。

system price

よって需要側と供給側の入札システムを組んで、入札の線を作ってそれらの交点を求めるような計算を動かせば市場が出来上がります。

そして、予め設定された市場の環境下で発電所がどのような入札を行えば利益を最大化出来るのかを考えて実際にシステムに値を入れて試しました。因みに僕は予算の半分で長期で安定的な入札を行い、残りの半分で市場の反応を見ながら入札を上下させるという戦略を取りました・・・がクラスの中で平均的な成績でした。(割りとみんな思いつく発想みたいです。DSPとかSEMでこういう入札戦略役立たないかなと考えたりしてます)

3.企業合併戦略(M&A戦略)

同じ業種の企業の一覧があり、全ての企業の販売網や能力などが分かっている。そしてその一覧は全ての企業が入手している。
そういった状況下で企業がどのように合併活動を進めてゆくかをシミュレートしてみる。

当然販売網が重なっている企業と合併しても大して良い効果が出ないので、なるべくかぶってないところを選ぶ。
能力的に弱いところはどうしても安く買い叩かれるといった結果が出たのを覚えてます。

4.投資ポートフォリオ作成

投資先の一覧が与えられていて、期待収益の変動も分かっている。(例えば投資Aの期待収益は100$(+ or -)50$といった感じ)変動はわかるが、来期に収益が幾らになるかは予測ができない。

このような状況下で最も収益を上げることが出来るポートフォリオ(予算配分)を作成する。
若しくは、最も損失を行う可能性が低くなるポートフォリオを作成する。

こういったことを3ヶ月で全て積み込み、12月の頭は真っ白な灰になっていました。しかし、その灰の中にはしっかりと経済学と統計学で必要な数学力という確かなものが残っていました。

そんなこんなで2012年になり、僕は魚との運命的な出会いをしました。

大学の中で一番数学を使って授業をするお爺さん教授が漁業経済学の授業を開催していました。

統計と最適化を駆使して漁業のあらゆる問題を分析・解決する。漁業自体にどれほどの面白みを感じていたかは今や定かではないですがw 授業ではシュミレーションの組み方なんかをかなり勉強できて楽しかったです。

その中でも特に鮭の養殖に気を引かれました。鮭だって当然生きているわけです。そういった生命を、管理した環境下においてデータを分析して、環境を調整して、利益の最大化をする。
結構エグいなとも思いつつちょっとしたSFみたいだなと思ってワクワクもしてました。

もう一方では環境問題をデータ分析と経済学で解決するという方面にも興味を伸ばしていました。

工場から出る排ガスが原因の空気汚染をどのようにして解決するか?河川の汚染が農業に与える影響をどのようにして補填するか?

この時期にはデータ分析はまだ用いることはありませんでしたが、ここではミクロな原因がマクロな影響をもたらしている時に、マクロな介入はどのように行うべきか?という事を学びました。

例えば、ある都市において車の排ガスによる空気汚染が健康被害を及ぼすほどまでになってしまった場合を考えます。原因はひとりひとりの車なのでとてもミクロなものです。しかし、それが集まった事によってその影響はマクロに達してしまいました。
この時一人一人が空気汚染を憂いて車を乗らないようになるでしょうか?答えはおそらくノーでしょう。そういうケースでは政府がこの問題に介入しなくてはなりません。
そして車の走行距離や排ガス量に税金をかけるわけです。この時走行距離と税金の関係性・排ガス量と走行距離の関係性をデータ分析で見つけておくことを忘れてはいけません。

税金が走行距離を減らし、減った走行距離によって排ガスも減る。データ分析でこの関係性が数字で見えていれば、あとは目的の値まで排ガス量が減る税金を計算すればいいわけです。

とまぁ、こういうことを勉強し、実際の政策レベルにつながる部分が面白いなと思っていました。

肝心のデータ分析はと言うと、

かなり苦しめられていました。

グループワークで組んだフィンランド人がゴミすぎてプロジェクトが頓挫しかけていました。(詳細

知識的にはかなり高いものになっていて、いろいろな問題にまぁまぁ使えそうな手法を選択することもできるようになっていました・・・が。

そんなことがどうでも良くなるくらいにプロジェクトが悲惨な結果に終わり、はしばらくデータ分析したくないと思うほどでした。

詳細の通り基本的にゴミなのは僕の相方だったわけですが、それでもそのゴミ部分をしっかりと認識して予防&修正が出来なかった点で明らかに僕に非があるわけです・・・
結局そのプロジェクトから4ヶ月くらいはデータ分析には一切触りませんでした。

ノルウェー2年目に続きます。

カテゴリー: 世間話, 備忘録, 統計学   パーマリンク


コメントを残す