Was ist OCR-Texterkennung?

Extrahieren Sie Text aus Bildern, Screenshots, gescannten Dokumenten und Fotos mit Tesseract-OCR, das vollständig auf Ihrem Gerät läuft. Unterstützt mehrere Sprachen und gibt bearbeitbaren Text aus, den Sie kopieren oder herunterladen können. Keine Dateien verlassen Ihr Gerät — die gesamte Verarbeitung erfolgt lokal.

Das Tool bringt Tesseract OCR als WebAssembly mit und enthält 20 trainierte Sprachpakete (Englisch, Spanisch, Französisch, Deutsch, Italienisch, Niederländisch, Portugiesisch, Polnisch, Schwedisch, Türkisch, Russisch, Arabisch, Hindi, Thai, Vietnamesisch, Chinesisch vereinfacht/traditionell, Japanisch, Koreanisch, Indonesisch). Jedes Paket wird beim ersten Mal einmal geladen und danach zwischengespeichert. Du kannst ein Bild oder ein einseitiges PDF laden, schiefe Fotos drehen und vor der Erkennung einen Bereich auswählen und das Ergebnis dann als reinen Text oder Word-Dokument speichern. Die Genauigkeit ist gut bei Screenshots, Scans mit 300 dpi und klaren Belegen; bei Druckschrift sind 95 % oder mehr drin, bei Handschrift oder schrägen Fotos weniger.

Anleitung

  1. Lade ein Bild (PNG, JPG, BMP oder WebP) oder ein einseitiges PDF mit dem zu extrahierenden Text hoch oder füge einen Screenshot aus der Zwischenablage ein. Zum ersten Mal hier? Klicke auf Beispiel testen und sieh die Erkennung an einem Beispiel.
  2. Wählen Sie die Sprache des Textes im Bild für eine bessere Erkennungsgenauigkeit. Klicken Sie auf „Text extrahieren“, um die OCR-Verarbeitung zu starten.
  3. Prüfe den erkannten Text, korrigiere Fehler und kopiere ihn oder lade ihn als .txt- oder Word-Datei (.docx) herunter.

Wann verwenden

  • Editierbaren Text aus Screenshots von Chats, Folien oder kopiergeschützten PDFs ziehen.
  • Positionen von einem Papierkassenbon in eine Haushaltstabelle übertragen.
  • Handschriftliche oder gedruckte Vorlesungsnotizen digitalisieren, um später darin zu suchen.

Ergebnis

Laden Sie ein Foto einer Restaurantquittung hoch: Die OCR liest jede Zeile, etwa „Caesar Salat — 12,50 €“ und „Mineralwasser — 3,00 €“, und gibt Ihnen sauberen Text, den Sie direkt in eine Tabellenkalkulation einfügen.

Häufige Fragen

Welche Sprachen erkennt die OCR-Engine?
Englisch, Spanisch, Französisch, Deutsch, Italienisch, Niederländisch, Portugiesisch, Polnisch, Schwedisch, Türkisch, Russisch, Arabisch, Hindi, Thailändisch, Vietnamesisch, Chinesisch in Vereinfacht und Traditionell, Japanisch, Koreanisch und Indonesisch – insgesamt 20. Wählen Sie das passendste. Bei mehrsprachigen Bildern lieber das Schriftsystem nehmen, das den größten Teil abdeckt.
Welche Genauigkeit ist realistisch?
Bei sauberen Drucken mit 300 dpi oder mehr (Screenshots, gescannte PDFs) erreicht Tesseract meist 95 % oder besser. Handschrift, geringer Kontrast, Bewegungsunschärfe oder schief aufgenommene Fotos drücken den Wert spürbar. Der Konfidenzwert neben dem Ergebnis zeigt, wie sicher Tesseract ist.
Warum dauert das Sprachpaket beim ersten Mal ein paar Sekunden?
Jedes Tesseract-Sprachmodell ist 10 bis 20 MB groß und wird beim ersten Auswählen heruntergeladen. Danach liegt es im Browser-Cache, sodass spätere Erkennungen in derselben Sprache fast sofort starten.
Lässt sich ein Screenshot aus der Zwischenablage einfügen, statt eine Datei hochzuladen?
Ja. Machen Sie den Screenshot (Win+Shift+S unter Windows, Cmd+Ctrl+Shift+4 unter macOS) und klicken Sie auf Bild einfügen. Das Werkzeug liest das Bild direkt aus der Zwischenablage, ohne es auf der Festplatte zu speichern.
Werden meine Bilder irgendwohin geschickt?
Nein. Tesseract läuft via WebAssembly innerhalb der Seite. Die Bilddaten verlassen das Gerät nicht. Wer es prüfen will: das Netzwerk in den DevTools deaktivieren und erleben, dass die Erkennung trotzdem fertig wird.

Ähnliche Tools