計量経済学を独学したい人の為の教材

世間ではビッグデータが云々言われていて、そろそろ日本でもちゃんと計量経済学が評価される日が来るのではないかなと思っている今日このごろです。

ただ今のアルゴリズムと時系列一辺倒な感じを見ると、誰かがちゃんと「機械学習だけじゃなくて経済学で仮説作って統計解析って手も使えるよ」といううことを証明して宣伝しなければそんな未来は来そうにないですね。

僕は大学4年生になるまで、数学も統計も全く勉強して来ませんでした。けれども、アメリカで計量経済学の授業を取ってその有用性に気が付き、これを勉強して使えるように成ろうと決心しました。

なので、統計学も数学も最初に関しては独学でこなして来ました。
自分のレベルでどの教科書を使えば良いのか?という問に答えられるといいです。

 

そもそも計量経済学について(追記 2018/12/24)

計量経済学がそもそもどんな分析をするものなのか?という事を知らない状態で勉強を進めるのはかなり非効率だと思われます。

入口の最初の一冊として非常によくまとまった本だと思います。
因果関係と相関関係の違いとは何か?データをどのようにしたら因果関係を特定できるのか?といった基本的なコンセプトについて丁寧な解説がされています。

計量経済学(因果推論)に関してこのレベルの入門書が日本語で存在するのは非常に喜ばしいことですね。

原因と結果の経済学よりも少し詳細に書いてある入門書です。
分析の例が企業に関連する内容が多かったり、するのでバックグラウンド的にはこちらの方が面白いと思う方も多いかと思います。扱っている計量経済学の手法自体もこちらの方が少し難易度が高いものになっています。

 

計量経済学で行われる分析の結果やその物語について

(追記 2018/12/24)

社会における様々な面白いトピックを計量経済学を使って分析している研究の結果について、その物語を語るという本です。

相撲の八百長を立証したり、名前がスペルミスがある場合に就職活動に与える影響を分析したりと、話を聞いただけでは「一体どうやったらデータからこれを示せるのか?」と思ってしまう内容について語っています。

こちらは教育の効果に関してテーマを絞っている本です。テレビを見る時間が長いと学力は本当に下がるのか?子供をご褒美で釣って勉強させると学力は上がるのか?等々のお題についての計量経済学を用いた研究結果を紹介しています。

 

数学ダメな人のレベル

計量経済学が何をするためのもので、どんなプロセスで行われるのかを知っていれば、数学のバックグラウンドが無くとも計量経済学の教科書を読み始めることはそこまで無謀な挑戦ではありません。

むしろ、教科書を読みながら理解できることも多くあるはずです。恐らく学部レベルの内容であればおおきな問題は無いはずです。

しかし修士レベル以上の内容になってくると微分積分と線形代数はあった方が良いです。

本としてよかった点はとにかく練習問題が多いこと。
御託はいいからさっさと覚えろよと言わんばかりの量の問題数です。
正直コンピューターのあるこのご時世に自分で計算できる必要性は無いと思うんですが、方程式を扱うときに微積の操作を理解してないと結構あたふたして困ってしまいます。
なので、体に覚え込ませてサクサク進めるようにしましょう。

 

数学は少し出来るけど統計って何?って人

2〜3日で統計学の基礎的な部分を把握できるのは結構良いかと。
さらに割りと出来が良い。学部生の時に読んでました。

 

統計学はOK。で、経済学とどーやって使うの?って人。

(追記 2019/12/20)

自分の執筆した本が出版されることになったのでここで宣伝しておきます。
内容としては、因果推論と計量経済学の入門に当たるもので、それらが必要なモチベーションの解説からRを使った実際の分析までを行うという内容になっています。

一般的な教科書にはない機械学習との対比や、ほかの分野で統計を使ってきた人たちからもらうツッコミへの応答なんかについてもいくらか解説を入れています。

基本的には企業で使う事を想定して書かれているので、ビジネスとかに興味のある人には受け入れやすい内容になっている気がしています。

個人的にはMostly Harmlessは少しとっつきにくくて、Mastering Metricsは英語で読めないって状態の人とかが読むのが良いのではないかなと思います。

 

(追記 2018/12/24)

2018年現在だと計量経済学の入門的な学部向けの教科書で圧倒的な良書だと思います。
因果関係を特定するために統計学の提供する手法をどうやって”道具として”使いこなすか?という点に関して簡潔にまとめられた教科書です。
多くの学部向けの教科書ではあまりにも多くの余分な事が語られすぎていて、何が重要なのかが良くわからず、整理してみると教科書を書いた著者自体もあまり計量経済学の分析のプロセスをちゃんと整理できてないという状態が散見されます。
Mastering Metricsはその様なあやふやな部分が徹底的に取り除かれていて、何を目的に、どうやって、そこにたどり着くかをちゃんと整理してくれています。
今自分が入門しなおすなら間違いなくこの本から入ると思います。

注意点としては、マクロ経済学で使われるような方法については基本的には触れられていないという点と、言語が英語しかないという点です。

 

海外だと鉄板な計量経済学の入門書。
アメリカの大学でもノルウェーの大学院でも使いました。
回帰分析程度までをちゃんと理解してる人にとっては解りやすい教科書だと思います。

単回帰、重回帰、検定、時系列、Panel data、IV、Logit & Probit 辺りまでカバーされてます。
時系列の部分に関しては結構出来が悪いと教授は文句を言ってました。
教科書で用いられている分析例のデータを提供するRのパッケージなども存在します。

(追記 2018/12/24)

今考えるとちょっと内容的に乱雑な感じもするなと思います。
恐らくこの教科書を勉強すると計量経済学の手法を一通り学ぶことが出来ますが、それを使ってどのように実際に分析したら良いか?といった点に関してはあまり明確なアイデアを持つことはできないと思います。

この点から見てもMastering Metricsか次にあげるMostly Harmless Econometricsは合わせて読むと良いように思えます。

 

よっしゃ、じゃあ使ってみようかという状態の人

(追記 2018/2/14)

計量経済学の手法を因果関係を特定するための方法として整理しなおして、それらを実際に使ってみる際にどのような事に関して注意を払うべきか?
また、因果関係を特定する道具としてそれらがどの様な特徴を持っているのかをちゃんと書いている教科書。

結局実務で多用するのはこの教科書の内容でした。
ビジネスの現場だとABテストを評価のスタンダードに置く事が多く、この結果をいかに再現・細分化する事ができるかが価値になります。
この発想からいくと、RCTをしていないような状況でABテストの結果を再現しに行くような因果推論の手法群はかなり価値があります。
もしビジネスの現場で分析したいという感じであれば、他の教科書は良いからmastering metrics & mostly harmlessを読んでおくと良いのではと思います。

(追記 2021/11/28)

mostly harmlessが出てから10年ちょっと経ってしまったので、内容的にはそろそろ不足が出ている状態です。例えば計量経済学におけるかなり重要な発展だと言われているSynthetic Controlなどについては全く説明がされてません。

そんな中、mostly harmlessを基本としつつ、新しいトピックも網羅できている教科書であるCausal Inference: The Mixtapeが登場しました。RとStataでの実装方法なども詳細に解説されているのでRで計量経済学をやりたい人にも非常におすすめの一冊です。残念ながらまだ日本語訳はされていません。

 

ベイズモデリングに手を出したくなった人

計量経済学だとベイジアンはなんか遠い存在のようにみられるケースが多いように感じられますが、階層モデルの様な分析モデルは色々な分析したい事象の可能性を広げてくれます。

ベイジアン計量経済学の本にいきなり入るよりはまずはこっちからという感じです。ベイジアン計量経済学は応用系の観点からすると、アカデミアで事前分布をどう扱うかが難しそうだなと思います。ビジネスであればクライアントと分析者の合意等で良いのですが、経済学のアカデミアって話になるとどうなるんですかね?

(追記 2016/8/23)
結局平均的な効果を推定しようという発想だとベイジアンの発想で階層モデルとかを組んでもあまり大きな恩恵はないんじゃないかなと最近思っているしだいです。

ただ、既存の計量経済学の手法をベイジアンとして解釈して推定するという流れは一つあるのかなと。VAR作ったシムズとかはみんなベイズしようぜみたいな感じですね。

 

 

機械学習に手を出したい人

機械学習の教科書はいくらかあるのですが、いったんこの本がとっつきやすかったです。PRMLを最初からやるのは結構自殺行為でした。

そもそも計量経済学をやる人が機械学習をやる必要があるのか?という話が出てきますが、応用系の人はあるんじゃないかなと僕は思っていますし、やっていきたいと思っています。なんでかっていうと、シンプルに分析者が取得できるデータの量がかなり多くなってきているからです。

モデルの推定自体は今までの手法で行うとしても、そこに与えるデータは機械学習でクラスタリングや識別問題の結果だったりを使う事が出来ます。また、予測モデルを利用して因果推論を行うという方法も提示されていたりするので、政策効果の推定なんかにも応用できそうです。いったんハル・バリアンのペーパー読むのとか良いんじゃないでしょうか。(これも会社の先輩に教えてもらった奴)

http://www.sims.berkeley.edu/~hal/Papers/2013/BeyondBigDataPaperFINAL.pdf

(追記 2016/8/23)

色々回った結果一旦足がかりとしてわかりやすいのはカステラ本かなという結論が出ました。英語行ける人は英語版が著者のページに公開されているのでおすすめです。ブースティングとかちゃんと説明してくれてる教科書って実はそんなにないんじゃないかな?

(追記 2018/12/24)

カステラ本も今考えると違うなーって思う内容とかがあるのですが、そのあたりがいろいろとアップデートされてこんな教科書が出ています。

 

機械学習で計量経済学(追記 2016/8/23)

最近予測モデルを利用して因果を推論しようという流れが出てきています。

ビッグデータと言われる様な大量なログデータがある中で、試作の介入効果を推定しようとすると古典的な方法ではちゃんと結果が出ないケースなんかもあるらしく、他には取り扱わないといけない変数の数がかなり多くなるという事象からもこう言った取り組みへの需要が出てきているという状態かなと。

また因果関係を推定するような手法も分解してみると、予測する問題が部分的にあったりするのでその部分を機械学習に置き換えるといった考え方が出ています。

これのreferenceとかはさかのぼってみると面白いと思います。

 

因果推論を機械学習に使う(追記 2018/2/14)

Counter Factual Machine Learningという分野が最近盛り上がりを見せつつあります。
機械学習のアプリケーションでは、学習したモデルをサービスに投入し、そこで発生したログデータでまたモデルを学習するという状況が発生します。こういった状況の場合往往にして学習データがMissing At Randomの状況になってしまいます。
機械学習の制度評価はテストデータにおける各サンプルにおけるロスの平均なので、MNARの問題があると、評価にバイアスがかかってしまいます。この評価をPropensity ScoreやDoubly Robustを使って改善しようという話と、その評価を前提としてMARでの学習をより精度の高いものにしようという話がこの分野の大まかな狙いです。
コーネル大学の授業の資料がよくまとまっているなーと思います。

また、Deepmindがこの分野で論文を出したのも個人的には衝撃でした。

 

カテゴリー: データマイニング, 経済学, 統計学 タグ: , , , パーマリンク

コメントを残す