Что такое Распознавание текста на изображениях?
Извлекайте текст из изображений, скриншотов, отсканированных документов и фотографий с помощью Tesseract OCR, работающего полностью на устройстве. Поддерживается множество языков, результат — редактируемый текст для копирования или скачивания. Файлы не покидают устройство — вся обработка происходит локально.
В инструмент встроен Tesseract OCR, скомпилированный в WebAssembly, и 20 обученных языковых пакетов (английский, испанский, французский, немецкий, итальянский, нидерландский, португальский, польский, шведский, турецкий, русский, арабский, хинди, тайский, вьетнамский, китайский упрощённый/традиционный, японский, корейский, индонезийский). Каждый пакет загружается один раз при первом использовании и затем кэшируется. Можно загрузить изображение или одностраничный PDF, повернуть наклонённые фото и выделить область перед распознаванием, а затем сохранить результат как обычный текст или документ Word. Точность высока на скриншотах, сканах при 300 dpi и чётких чеках; ждите 95% и выше на печатном тексте и меньше на рукописном или снятом под углом.
Как использовать
- Загрузите изображение (PNG, JPG, BMP или WebP) либо одностраничный PDF с текстом, который нужно распознать, или вставьте снимок экрана из буфера обмена. Впервые здесь? Нажмите «Попробовать пример», чтобы увидеть работу на готовом образце.
- Выберите язык текста на изображении для повышения точности распознавания. Нажмите «Извлечь текст», чтобы начать обработку.
- Проверьте распознанный текст, исправьте ошибки, затем скопируйте его или скачайте как файл .txt или Word (.docx).
Когда использовать
- Достать редактируемый текст из скриншота чата, слайда или PDF, где запрещён копи-паст.
- Перенести строки с фотографии бумажного чека в таблицу учёта расходов.
- Оцифровать рукописные или печатные конспекты, чтобы потом по ним искать.
Результат
Загрузите фото чека из ресторана: OCR прочитает каждую строку, например «Салат Цезарь — $12.50» и «Газированная вода — $3.00», и вернёт чистый текст, который можно вставить прямо в таблицу.
Частые вопросы
- Какие языки распознаёт OCR-движок?
- Английский, испанский, французский, немецкий, итальянский, нидерландский, португальский, польский, шведский, турецкий, русский, арабский, хинди, тайский, вьетнамский, китайский упрощённый и традиционный, японский, корейский, индонезийский — всего 20. Выбирайте ближайший к содержимому. Для многоязычных изображений берите ту письменность, что покрывает большую часть текста.
- На какую точность можно рассчитывать?
- На чистой полиграфии 300 dpi и выше (скриншоты, сканы PDF) точность обычно 95% и больше. Рукописи, низкий контраст, смазы и наклонные кадры её существенно снижают. Рядом с результатом показан показатель уверенности — насколько Tesseract уверен в распознавании.
- Почему языковой пакет грузится несколько секунд в первый раз?
- Каждая модель Tesseract весит 10–20 МБ и скачивается при первом выборе данного языка. Затем она остаётся в кэше браузера, и последующие распознавания на этом же языке запускаются почти моментально.
- Можно вставить скриншот из буфера обмена, не загружая файл?
- Можно. Сделайте скриншот (Win+Shift+S в Windows, Cmd+Ctrl+Shift+4 в macOS) и нажмите «Вставить изображение». Инструмент считает картинку прямо из буфера обмена, без сохранения на диск.
- Мои изображения куда-то отправляются?
- Нет. Tesseract работает внутри страницы через WebAssembly, и байты изображения не покидают устройство. Проверить просто: отключите сеть в DevTools и убедитесь, что распознавание всё равно завершается.
Похожие инструменты
Редактор закладок PDF
Добавляйте и редактируйте закладки в PDF-файлах
Сведение PDF
Сведите поля форм и аннотации в PDF-файлах
Текстовый редактор
Пишите и форматируйте документы в визуальном редакторе
Markdown в PDF
Конвертируйте файлы Markdown в оформленные PDF-документы
Обрезка PDF
Обрезайте и подгоняйте поля страниц PDF
Сортировка страниц PDF
Перетаскивайте страницы PDF для изменения порядка