2011-01-11 Tesseract 3.0 を試してみた Windows Free の OCR である Tesseract が、いつのまにやら日本語にも対応していたので、ちょっと試してみた。 tesseract-ocr · GitHub 基本的にコマンドラインでしか使えない。入力は TIFF にしか対応していない。 うーん、数字の間違いが多いなあ。漢字は、まともなゴシックならばそこそこ読める感じ。デフォルトではまだまだですな。 元々、C/C++ API のある英語 OCR を探していたんだが。