2011/02/20

twitter streaming api でデータ収集

twitter streaming api を利用して24時間データ収集してみた.curl を利用してほいほいとやってみたので,json のデータをそのままファイルに保存しただけ.

24時間で約130万tweetを収集.まあこれは24時間の全tweetの1%にも満たない量だと思うけれど,収集する範囲をうまく決めたらそれこそかなりのデータセットを自前で準備できちゃうのではと.

このあたりを読みながら考えてみるとするかな.
Streaming API Documentation

0 件のコメント: