ロボットと因果

色々因果推論と機械学習の論文を漁っていたら(自分的に)すごいものを見つけてしまいました。。。

AAAI2016に出ていた論文で「Online Instrumental Variable Regression with Applications to Online Linear System Identification」という代物です。

http://www.cc.gatech.edu/~bboots3/files/OIVR_AAAI.pdf

OLYMPUS DIGITAL CAMERA

中身は非常にシンプルで、計量経済学でよく使われるInstrumental Variable Method(操作変数法)をオンライン学習の設定で学習できるようにしたというものです。

従来のIVは、データがすでに完全にそろっている状態で全部をメモリにのっけてOLSを二段階で解くというものでした。

が、これをオンライン学習にすると、データが1サンプルずつ都度手に入る場合に少しずつモデルを更新していってモデルを学習していくことができます。

これの良い点としては、データがそろうのを待たずにモデルを使い始められる事、リアルタイムにモデルが変化できるということ、学習にメモリが大量には必要でなくなることが挙がるかと思います。

アカデミックで計量経済学やっている人からすれば多分全部どうでも良いメリットなのですが、ウェブサービスへの導入を考えている人なんかにすればかなり都合の良い性質を持っているわけです。

1サンプルずつ学習すると、推論的にどうなんだ?とか、推定結果が普通の2SLSと異なってくるんじゃないか?とか思いますが、その辺も問題ないとの事です。

さて、この論文で一番驚いたのはその応用先でした。

想定されていた応用先はなんとroboticsで、計量経済学は古典的な応用先の一つとして挙がっていたにすぎませんでした。

roboticsの中におけるPredictive State Representationsという問題を扱う際に用いられていました。なんとなくは分かったのですがうまく言葉にできないので後でまたまとめます。

一言でいうと、自己が未来の自己を定義しているような動的な状況下での、追加動作が未来に与える影響の推定といったところでしょうか。

かなり外的な要因が省かれている状況が想定されているため、因果=予測という感じの状況設定で、実際に論文内でも”精度が向上している”と報告されていました。

PRMLのNNの章でロボットアームの例を読んだときになんか似てるかもなーと思ったのが懐かしかったです。

オンラインの状況設定での計量経済・因果推論はもっといろいろなアプリケーションがあるはずなので、今後も追いかけていきたいと思うこの頃でした。

 

 

カテゴリー: 未分類   パーマリンク


コメントを残す