Question 1

OCR 引擎可以辨識哪些語言?

Accepted Answer

支援英文、西班牙文、法文、德文、義大利文、荷蘭文、葡萄牙文、波蘭文、瑞典文、土耳其文、俄文、阿拉伯文、印地文、泰文、越南文、簡繁中文、日文、韓文、印尼文,共 20 種。選最接近圖片內容的那個。多語混排時,選佔主導地位的文字系統效果最好。

Question 2

辨識準確率大概多高?

Accepted Answer

300 dpi 以上的清晰印刷字(截圖、掃描 PDF),準確率通常在 95% 以上。手寫、低對比、運動模糊或斜拍的照片會大幅拉低準確率。結果旁的「信心值」分數能告訴你 Tesseract 對辨識有多確定。

Question 3

為什麼第一次切換語言要等幾秒鐘?

Accepted Answer

每個 Tesseract 語言模型約 10 到 20 MB,首次選用時需要下載。之後會被瀏覽器快取,同一語言再次辨識幾乎是瞬間完成,不會再耗時下載。

Question 4

可以直接從剪貼簿貼上截圖,不上傳檔案嗎?

Accepted Answer

可以。先用 Win+Shift+S(Windows)或 Cmd+Ctrl+Shift+4(macOS)截圖,然後點「貼上圖片」。工具會直接從剪貼簿讀取影像,不需要先存到硬碟。

Question 5

我的圖片會被上傳到伺服器嗎?

Accepted Answer

不會。Tesseract 透過 WebAssembly 在頁面內執行,圖片位元組不會離開你的裝置。可以打開開發者工具切斷網路,辨識仍能完成,這就是最好的證明。

圖片文字辨識

什麼是圖片文字辨識？