GUST NOTCH? DIARY

バックエンドをPythonで書き直す

WebスクレイピングしてXMLにしているわけですが、もうちょっとまともにしようと思い書き直し始めました。
今までは Perl でファイルベースで解析してましたが、今度は Python でオン・ザ・フライでデータベースに保存していこうと思っています。今までは中間データは保存せずに常にXMLを上書きアップデートしていましたが、ディスクの容量が許す限り過去のデータも保持できるようにします。
まずは、映画館情報の一覧作成と更新の処理から。
さて、Python で真面目に書くのはほぼ初めてと言っていいのですが、HTML のパーサのルールを書くのがちょっと大変。それ以外はいまのところチョー楽チン。