什麼是圖片文字辨識?
使用完全在本機執行的 Tesseract OCR 引擎,從圖片、截圖、掃描文件和照片中擷取文字。支援多種語言,輸出可編輯文字供您複製或下載。檔案不會離開您的裝置,所有處理均在本機完成。
本工具內建編譯為 WebAssembly 的 Tesseract OCR,並附帶 20 個訓練好的語言包(英語、西班牙語、法語、德語、義大利語、荷蘭語、葡萄牙語、波蘭語、瑞典語、土耳其語、俄語、阿拉伯語、印地語、泰語、越南語、簡體/繁體中文、日語、韓語、印尼語)。每個語言包在首次使用時下載一次,之後會被快取。你可以載入圖片或單頁 PDF,旋轉傾斜的照片,並在辨識前框選某個區域,然後將結果儲存為純文字或 Word 文件。在截圖、300 dpi 掃描件和清晰的收據上準確率較高,印刷體可達 95% 以上,手寫或傾斜照片則會下降。
使用方法
- 上傳含有待擷取文字的圖片(PNG、JPG、BMP 或 WebP)或單頁 PDF,或從剪貼簿貼上截圖。第一次使用?點擊「試用範例」即可在範例上看到效果。
- 選擇圖片中文字的語言以提高辨識準確率,然後點擊「擷取文字」開始 OCR 處理。
- 檢查辨識出的文字,更正錯誤,然後複製,或下載為 .txt 或 Word(.docx)檔案。
何時使用
- 從聊天截圖、簡報截圖或不能複製的 PDF 截圖中擷取文字。
- 把紙本發票照片裡的明細一條條輸入記帳表格。
- 把手寫或印刷的課堂筆記數位化,日後就能全文搜尋。
結果
上傳一張餐廳收據的照片:OCR 會逐行讀出內容,例如「凱薩沙拉——NT$250」和「氣泡水——NT$80」,並給你一段乾淨的文字,可以直接貼進試算表。
常見問題
- OCR 引擎可以辨識哪些語言?
- 支援英文、西班牙文、法文、德文、義大利文、荷蘭文、葡萄牙文、波蘭文、瑞典文、土耳其文、俄文、阿拉伯文、印地文、泰文、越南文、簡繁中文、日文、韓文、印尼文,共 20 種。選最接近圖片內容的那個。多語混排時,選佔主導地位的文字系統效果最好。
- 辨識準確率大概多高?
- 300 dpi 以上的清晰印刷字(截圖、掃描 PDF),準確率通常在 95% 以上。手寫、低對比、運動模糊或斜拍的照片會大幅拉低準確率。結果旁的「信心值」分數能告訴你 Tesseract 對辨識有多確定。
- 為什麼第一次切換語言要等幾秒鐘?
- 每個 Tesseract 語言模型約 10 到 20 MB,首次選用時需要下載。之後會被瀏覽器快取,同一語言再次辨識幾乎是瞬間完成,不會再耗時下載。
- 可以直接從剪貼簿貼上截圖,不上傳檔案嗎?
- 可以。先用 Win+Shift+S(Windows)或 Cmd+Ctrl+Shift+4(macOS)截圖,然後點「貼上圖片」。工具會直接從剪貼簿讀取影像,不需要先存到硬碟。
- 我的圖片會被上傳到伺服器嗎?
- 不會。Tesseract 透過 WebAssembly 在頁面內執行,圖片位元組不會離開你的裝置。可以打開開發者工具切斷網路,辨識仍能完成,這就是最好的證明。