Question 1

Перенесутся ли изображения и графики из PDF в HTML?

Accepted Answer

По умолчанию извлекается только текст, поэтому встроенные изображения, векторные диаграммы и поля форм пропускаются. Включите «Встроить изображения страниц» — и каждая страница отрисуется как картинка и попадёт в HTML, так что диаграммы, графика и даже отсканированные страницы сохранятся. Файл остаётся автономным — ничего не размещается на стороне. Чем выше качество изображения, тем оно чётче и тем больше файл.

Question 2

Почему иногда появляются переносы строк посреди предложения?

Accepted Answer

Некоторые PDF хранят текст с жёсткими переводами строк вместо границ абзацев. Выключите «Сохранять разметку», и конвертер заново склеит строки в абзацы по вертикальным отступам. Двухколоночные макеты тоже требуют выключения этой опции.

Question 3

Всегда ли детектор заголовков угадывает правильно?

Accepted Answer

Работает хорошо, когда заголовки в PDF набраны крупнее или жирнее (типичный случай). Документы, где заголовки выделены только цветом или позицией при том же кегле, его сбивают — выключите детектор, всё станет p, и разметите вручную.

Question 4

Можно ли публиковать получившийся HTML напрямую?

Accepted Answer

На выходе семантический HTML без инлайн-JavaScript, без внешних скриптов и без инлайн-стилей по умолчанию. Вставляете в любой CMS или генератор статики, оборачиваете в свой шаблон — и готово.

Question 5

Что насчёт PDF с паролем или шифрованием?

Accepted Answer

Защищённые паролем PDF поддерживаются. Если файл зашифрован, после загрузки появится поле для пароля — введите его, и документ откроется и преобразуется прямо здесь. Пароль никуда не отправляется.

PDF в HTML

Настройки

Что такое PDF в HTML?

Как использовать

Когда использовать

Результат

Частые вопросы

Похожие инструменты

Редактор закладок PDF

Сведение PDF

Текстовый редактор

Markdown в PDF

Обрезка PDF

Сортировка страниц PDF

PDF в HTML

Настройки