読者です 読者をやめる 読者になる 読者になる

Twitterに見るiPad予約開始日

mysql ipad twitter

 今日から iPad の日本国内(ソフトバンク)の予約受付が始まりました。私は早々に「今回は見送り」を決めているので渦中に入らずに済んだのですが、多くの人が Twitter 上でもたいへん盛り上がったようです。


 そんな中、id:sh2 さんが、twitteriPad 関連ツイートを取ってきて表示するサービス(http://sh2.mydns.to/twitter/ipad.ppl)を公開していたので、尋ねてみたところ、単なる垂れ流しでなくデータをちゃんと蓄積保存しているとのこと。
 「面白そうなデータとれそうだから、なんか集計してみてよ!」とお願いしたら、gzファイルが降ってきました(笑)。ありがたやありがたや。。。(_人_)



 ということで早速MySQLにつっこんで、ざっくりと非常に単純な集計作業を。本日5月10日の、1時間ごとの


(1)"iPad" を含むツイート全体数(ピンク色・左軸)
(2) (1)の中で「予約完了」を含むものの数(緑点線・右軸)
(3) (1)の中で「予約した」を含むものの数(青点線・右軸)
(4) (1)の中で「並んで」を含むものの数(茶色・右軸)


 です。本日18時台途中の状態なので18時台のデータは参考程度で。




 語尾の付き方まで見ていないので「並んでいない」とか「並んでまで欲しくない」なども含みますが、経験上これくらいの数になるとそういう値は誤差範囲に収まるので、ほぼ実態を表していると思って良いでしょう。
実際に「予約した」り「予約完了」したりした数が8時からほぼ横ばいになっているのは、処理能力のピークが正午過ぎまで続いていたということなのでしょうか(これだけではわかりませんが)。
 そういや、個別のデータを見ないといけないのは、このデータがツイートを漏れなく取得できているのかどうか。1分に1回の巡回だと(取り方にもよりますが1ページだけの取得で最大の100件だとすると)1時間に6000件が上限になってしまいますので。


 いや、それにしても面白い。さくっと gz を天から降らせてくださった(仕事を与えたともいう)id:sh2 さん、どうもありがとうございます!


.