Что такое Распознавание текста на изображениях?

Извлекайте текст из изображений, скриншотов, отсканированных документов и фотографий с помощью Tesseract OCR, работающего полностью на устройстве. Поддерживается множество языков, результат — редактируемый текст для копирования или скачивания. Файлы не покидают устройство — вся обработка происходит локально.

В инструмент встроен Tesseract OCR, скомпилированный в WebAssembly, и 20 обученных языковых пакетов (английский, испанский, французский, немецкий, итальянский, нидерландский, португальский, польский, шведский, турецкий, русский, арабский, хинди, тайский, вьетнамский, китайский упрощённый/традиционный, японский, корейский, индонезийский). Каждый пакет загружается один раз при первом использовании и затем кэшируется. Можно загрузить изображение или одностраничный PDF, повернуть наклонённые фото и выделить область перед распознаванием, а затем сохранить результат как обычный текст или документ Word. Точность высока на скриншотах, сканах при 300 dpi и чётких чеках; ждите 95% и выше на печатном тексте и меньше на рукописном или снятом под углом.

Как использовать

  1. Загрузите изображение (PNG, JPG, BMP или WebP) либо одностраничный PDF с текстом, который нужно распознать, или вставьте снимок экрана из буфера обмена. Впервые здесь? Нажмите «Попробовать пример», чтобы увидеть работу на готовом образце.
  2. Выберите язык текста на изображении для повышения точности распознавания. Нажмите «Извлечь текст», чтобы начать обработку.
  3. Проверьте распознанный текст, исправьте ошибки, затем скопируйте его или скачайте как файл .txt или Word (.docx).

Когда использовать

  • Достать редактируемый текст из скриншота чата, слайда или PDF, где запрещён копи-паст.
  • Перенести строки с фотографии бумажного чека в таблицу учёта расходов.
  • Оцифровать рукописные или печатные конспекты, чтобы потом по ним искать.

Результат

Загрузите фото чека из ресторана: OCR прочитает каждую строку, например «Салат Цезарь — $12.50» и «Газированная вода — $3.00», и вернёт чистый текст, который можно вставить прямо в таблицу.

Частые вопросы

Какие языки распознаёт OCR-движок?
Английский, испанский, французский, немецкий, итальянский, нидерландский, португальский, польский, шведский, турецкий, русский, арабский, хинди, тайский, вьетнамский, китайский упрощённый и традиционный, японский, корейский, индонезийский — всего 20. Выбирайте ближайший к содержимому. Для многоязычных изображений берите ту письменность, что покрывает большую часть текста.
На какую точность можно рассчитывать?
На чистой полиграфии 300 dpi и выше (скриншоты, сканы PDF) точность обычно 95% и больше. Рукописи, низкий контраст, смазы и наклонные кадры её существенно снижают. Рядом с результатом показан показатель уверенности — насколько Tesseract уверен в распознавании.
Почему языковой пакет грузится несколько секунд в первый раз?
Каждая модель Tesseract весит 10–20 МБ и скачивается при первом выборе данного языка. Затем она остаётся в кэше браузера, и последующие распознавания на этом же языке запускаются почти моментально.
Можно вставить скриншот из буфера обмена, не загружая файл?
Можно. Сделайте скриншот (Win+Shift+S в Windows, Cmd+Ctrl+Shift+4 в macOS) и нажмите «Вставить изображение». Инструмент считает картинку прямо из буфера обмена, без сохранения на диск.
Мои изображения куда-то отправляются?
Нет. Tesseract работает внутри страницы через WebAssembly, и байты изображения не покидают устройство. Проверить просто: отключите сеть в DevTools и убедитесь, что распознавание всё равно завершается.

Похожие инструменты