Question 1

Welche Sprachen erkennt die OCR-Engine?

Accepted Answer

Englisch, Spanisch, Französisch, Deutsch, Italienisch, Niederländisch, Portugiesisch, Polnisch, Schwedisch, Türkisch, Russisch, Arabisch, Hindi, Thailändisch, Vietnamesisch, Chinesisch in Vereinfacht und Traditionell, Japanisch, Koreanisch und Indonesisch – insgesamt 20. Wählen Sie das passendste. Bei mehrsprachigen Bildern lieber das Schriftsystem nehmen, das den größten Teil abdeckt.

Question 2

Welche Genauigkeit ist realistisch?

Accepted Answer

Bei sauberen Drucken mit 300 dpi oder mehr (Screenshots, gescannte PDFs) erreicht Tesseract meist 95 % oder besser. Handschrift, geringer Kontrast, Bewegungsunschärfe oder schief aufgenommene Fotos drücken den Wert spürbar. Der Konfidenzwert neben dem Ergebnis zeigt, wie sicher Tesseract ist.

Question 3

Warum dauert das Sprachpaket beim ersten Mal ein paar Sekunden?

Accepted Answer

Jedes Tesseract-Sprachmodell ist 10 bis 20 MB groß und wird beim ersten Auswählen heruntergeladen. Danach liegt es im Browser-Cache, sodass spätere Erkennungen in derselben Sprache fast sofort starten.

Question 4

Lässt sich ein Screenshot aus der Zwischenablage einfügen, statt eine Datei hochzuladen?

Accepted Answer

Ja. Machen Sie den Screenshot (Win+Shift+S unter Windows, Cmd+Ctrl+Shift+4 unter macOS) und klicken Sie auf Bild einfügen. Das Werkzeug liest das Bild direkt aus der Zwischenablage, ohne es auf der Festplatte zu speichern.

Question 5

Werden meine Bilder irgendwohin geschickt?

Accepted Answer

Nein. Tesseract läuft via WebAssembly innerhalb der Seite. Die Bilddaten verlassen das Gerät nicht. Wer es prüfen will: das Netzwerk in den DevTools deaktivieren und erleben, dass die Erkennung trotzdem fertig wird.

OCR-Texterkennung

Was ist OCR-Texterkennung?

Anleitung

Wann verwenden

Ergebnis

Häufige Fragen

Ähnliche Tools

PDF-Lesezeichen-Editor

PDF einebnen

Rich-Text-Editor

Markdown zu PDF

PDF zuschneiden

PDF-Seiten umsortieren

OCR-Texterkennung