Question 1

Quais idiomas o motor OCR reconhece?

Accepted Answer

Inglês, espanhol, francês, alemão, italiano, neerlandês, português, polonês, sueco, turco, russo, árabe, hindi, tailandês, vietnamita, chinês simplificado e tradicional, japonês, coreano e indonésio — 20 no total. Escolha o mais próximo do conteúdo da imagem. Em textos multilíngues, prefira o sistema de escrita que cobre a maior parte do conteúdo.

Question 2

Que tipo de precisão dá para esperar?

Accepted Answer

Em impressos limpos a 300 dpi ou mais (capturas, PDF escaneado), a precisão fica geralmente em 95% ou mais. Manuscritos, baixo contraste, motion blur ou fotos tortas derrubam o resultado. A pontuação de confiança ao lado do resultado mostra o quanto o Tesseract está seguro.

Question 3

Por que o pacote de idioma demora alguns segundos na primeira vez?

Accepted Answer

Cada modelo de idioma do Tesseract tem entre 10 e 20 MB e é baixado na primeira vez que você o seleciona. Depois ele fica em cache no navegador, então reconhecimentos seguintes no mesmo idioma rodam quase na hora.

Question 4

Posso colar uma captura da área de transferência em vez de enviar arquivo?

Accepted Answer

Pode. Tire a captura (Win+Shift+S no Windows, Cmd+Ctrl+Shift+4 no macOS) e clique em Colar imagem. A ferramenta lê direto da área de transferência sem precisar salvar arquivo no disco.

Question 5

Minhas imagens são enviadas para algum servidor?

Accepted Answer

Não. O Tesseract roda dentro da página via WebAssembly. Os bytes da imagem não saem do seu dispositivo. Para confirmar, desligue a rede no DevTools e veja que o reconhecimento continua funcionando.

OCR de imagem para texto

O que é OCR de imagem para texto?

Como usar

Quando usar

Resultado

Perguntas frequentes

Ferramentas relacionadas

Editor de marcadores de PDF

Achatar PDF

Editor de Texto Rico

Markdown para PDF

Recortar PDF

Reordenar páginas de PDF

OCR de imagem para texto