GUST NOTCH? DIARY

映画館リストの取得

先日書いたように、MovieWalkerからは映画のスケジュールを取得するのが難しくなったので、代替サイトを検討していました。結果、ジョルダンのやってる「映画の時間」がよさげかな、という感じです。

ポイントはスケジュールのページに複数日分が一緒に乗っていること。「ぴあ映画生活」より、こっちの方がシンプルかなと思って。
それで今はとりあえず映画館の一覧を取得するところまではできました。今までPerlで書いてたのだけど、Pythonで書き直してます。
本読んだ時のサンプルコードくらいしか動かしたことがなかったので、目的をもって書いてるのは今回が初です。
とりあえず、HTTPでファイルとってくる Request、HTMLのDOMを解析する BeautifulSoup のモジュールを入れて、必要に応じて json だったりパターンマッチさせるために re だったり、基本的な datetime だったりのモジュールを使ってみてます。

ところで、「映画の時間」のサイトのスケジュールって、時間にリンクがついてるんですよね。他のサイトでもよくあるようにここからチケット購入サイトに飛べたりするのかなー、と思っていたら、実はこれは

上映時刻をクリックすると、上映開始の10分前に映画館に到着する行き方を調べることができます。(※予約サイトではありません)

というものなのです。
そう、もともとジョルダンは乗り換え案内を提供するサービスの会社なんですよ。ってことは、映画のスケジュールと作品の上映時間、そして移動の時間も検索できるってことで、ハシゴ検索するのに必要な情報を持ってるってことじゃないですか。
今提供されてるのは「現在地からの劇場検索」と「映画館までの乗換案内」みたいなのですが、作品複数とエリア指定でハシゴできる経路を出してくれるサービスを期待します。

あれー、テストでアクセスしすぎたかな?sleep入れてみたけど connection reset by peer で切られるようになっちゃった。んー、制限されるんじゃ使えないなぁ。