GUST NOTCH? DIARY

Tesseract 3.0 を試してみた

Free の OCR である Tesseract が、いつのまにやら日本語にも対応していたので、ちょっと試してみた。

基本的にコマンドラインでしか使えない。入力は TIFF にしか対応していない。
うーん、数字の間違いが多いなあ。漢字は、まともなゴシックならばそこそこ読める感じ。デフォルトではまだまだですな。
元々、C/C++ API のある英語 OCR を探していたんだが。