Question 1

OCRエンジンが対応している言語は？

Accepted Answer

英語、スペイン語、フランス語、ドイツ語、イタリア語、オランダ語、ポルトガル語、ポーランド語、スウェーデン語、トルコ語、ロシア語、アラビア語、ヒンディー語、タイ語、ベトナム語、中国語簡体／繁体、日本語、韓国語、インドネシア語の計20言語。画像の内容に最も近いものを選びます。多言語混在のときは、テキストの大半を占める文字体系を選ぶと精度が上がります。

Question 2

認識精度はどのくらい期待できますか？

Accepted Answer

300 dpi以上のきれいな印刷物（スクショ、スキャンPDF）であれば概ね95%以上です。手書き、低コントラスト、手ブレ、斜め撮りでは精度が大きく下がります。結果横の信頼度スコアでTesseractの確信度を確認できます。

Question 3

なぜ言語を切り替えた初回だけ数秒かかるの？

Accepted Answer

Tesseractの言語モデルは1つあたり10〜20 MBあり、その言語を初めて選んだときにダウンロードされます。一度キャッシュされれば、同じ言語の認識はほぼ即座に始まり、再ダウンロードは発生しません。

Question 4

ファイルをアップロードせずクリップボードから画像を貼れる？

Accepted Answer

貼れます。Win+Shift+S（Windows）またはCmd+Ctrl+Shift+4（macOS）でスクショを撮り、「画像を貼り付け」をクリック。ツールはディスクに保存せず、クリップボードから直接画像を読み込みます。

Question 5

アップロードした画像はサーバーに送られる？

Accepted Answer

いいえ。TesseractはWebAssemblyでページ内だけで動作し、画像のバイトは端末から出ません。開発者ツールでネットワークを切ったうえで認識を試すと、それでも完了することを自分の目で確認できます。

OCR 画像テキスト変換

OCR 画像テキスト変換とは？

使い方

使用するタイミング

結果

よくある質問

関連ツール

PDFブックマークエディター

PDFフラット化ツール

リッチテキストエディター

MarkdownからPDFへ変換

PDFトリミング

PDFページ並べ替え

OCR 画像テキスト変換