自動的に数字を取得してグラフを作ってくれるサービス XPathGraphが面白そう

d:id:amachang:20080411:1207903422

XPathGraph


URL と XPath を指定すると一日に一回その URL をスクレイピングして XPath 式が示す値をグラフにしてくれる!という画期的なサービスです。

XPathGraphが面白そうだったのでさっそく遊んでみました。まだあんまりデータが集まってないですが、一週間後には面白いことになってるハズ。
後でまた絶対作りたくなると思ったのでメモしておきます。

2ちゃんねるスレの伸び具合

スレがどれくらいの勢いで伸びているのかを調べてもらうことにしました。
書き方はこんな感じです。

URL:   http://[鯖].2ch.net/test/read.cgi/[板ディレクトリ]/[dat番号]/
URL:例 http://pc11.2ch.net/test/read.cgi/tech/1205156417/

XPath: count(//body/dl[@class="thread"]/dt)

Scalaスレの伸び具合
http://xpath.kayac.com/graph/8CMl884H3RGiSA

最近Scalaスレで遊んでないなー

ニコニコ動画

ニコニコ動画のサムネイルはアカウントを持っていなくても見ることができるので、そこから再生数とかをグラフにしてもらえます。
ヒャダイン先生の新作もお楽しみ下さい。

URL:   http://www.nicovideo.jp/thumb/[動画ID]
URL:例 http://www.nicovideo.jp/thumb/sm2897167

XPath
  再生数:     /html/body/table/tr/td/p/strong[position()=2]
  コメント数: /html/body/table/tr/td/p/strong[position()=3]
  マイリスト: /html/body/table/tr/td/p/strong[position()=4]


ヒャダイン先生の新作をグラフにしてみよう。

Subversionの最新リビジョン番号

Subversionリポジトリの最新リビジョン番号を採取したら、プロジェクトの勢いが分かるかもしれない。
「コミット具合」を略して「コミ具合」と呼ぶことにします。「コミュティ具合」の略でもいいかも。

URL  : ソースコードリポジトリのURL
URL例: http://svn.apache.org/repos/asf/

XPath: /html/body/h2

XPathがシンプルで大変よいですね。


CodeReposのコミ具合
http://xpath.kayac.com/graph/funMXesH3RGPfA

Scalaのコミ具合
http://xpath.kayac.com/graph/NuvpM9UH3RGzRg

Rubyのコミ具合
http://xpath.kayac.com/graph/GHCw89gH3RGu9w

Liftのコミ具合
http://xpath.kayac.com/graph/9IrDOdkH3RG5sA

Apacheプロジェクトのコミ具合
http://xpath.kayac.com/graph/vhdApNwH3RGDhQ

Google検索

Google検索とニュース検索とブログ検索で検索した結果の件数が推移していく様を眺めたら楽しいかもしれません。
全然関係ないですが、Googleドラクエを検索するときは「ドラゴンクエスト OR ドラクエ」が基本です。ニコニコ動画も同様です。

URL:   http://www.google.co.jp/search?q=[検索ワード]
URL:例 http://www.google.co.jp/search?q=%E3%83%89%E3%83%A9%E3%82%AF%E3%82%A8
XPath: /html/body/table[position()=2]/tr/td[position()=2]/font/b[position()=2]
URL:   http://blogsearch.google.co.jp/blogsearch?q=[検索ワード]
URL:例 http://blogsearch.google.co.jp/blogsearch?q=%E3%83%89%E3%83%A9%E3%82%AF%E3%82%A8
XPath: /html/body/div[position()=5]/table[position()=4]/tbody/tr/td[position()=2]/font/b[position()=2]
URL:   http://news.google.co.jp/news?q=[検索ワード]
URL:例 http://news.google.co.jp/news?q=%E3%83%89%E3%83%A9%E3%82%AF%E3%82%A8
XPath: /html/body/table[position()=2]/tr[position()=2]/td[position()=2]/font/b[position()=2]

Googleニュースで「ドラゴンクエスト」を検索
http://xpath.kayac.com/graph/msrofOAH3RG6bA

Googleブログ検索で「ドラゴンクエスト」を検索
http://xpath.kayac.com/graph/0t55U-EH3RGM-w


Google検索はなぜか上手くいかなかったです。カンマ区切りの数字はダメなのかな。残念。

思ったこと

XPathが主役なのでプログラマーには楽しいサービスだけど、プログラマーじゃない人も楽しめるようにXPathをうまいこと隠して、例えば2ちゃんねるに限定したスレッド伸びグラフ作成サービスとか作ったら面白いかもしれないなーと思いました。