Конвертер PDF в HTML
Преобразуйте PDF-документы в чистые, семантические HTML-файлы прямо в вашем браузере. Быстро, безопасно и сохраняет структуру документа.
Выберите PDF файл
или перетащите его сюда
Преобразуйте PDF-документы в чистые, семантические HTML-файлы прямо в вашем браузере. Быстро, безопасно и сохраняет структуру документа.
или перетащите его сюда
Преобразование PDF в HTML преобразует документ с фиксированным макетом в плавную веб-страницу. Преобразование сохраняет текстовое содержимое, заголовки, абзацы и основные стили, отказываясь от точного пиксельного макета PDF в пользу адаптивного HTML. Это правильная сделка для документов, переиздаваемых в качестве веб-контента (статьи, отчеты, техническая документация), и неправильная сделка для документов, макет которых имеет важное значение (формы, счета со строгим позиционированием, разработанные маркетинговые материалы).
Этот инструмент использует PDF.js для извлечения текста, шрифтов и базовой структуры из PDF-файла, а затем записывает соответствующую HTML-разметку со встроенным CSS для типографики. Результатом является отдельный файл .html, который можно открыть в любом браузере, вставить в CMS или дополнительно оформить с помощью специального CSS. Загрузка не происходит; преобразование выполняется в вашем браузере.
Поддерживаются два стиля вывода. Семантический HTML создает чистую разметку с элементами абзацев и заголовков, подходящую для повторной публикации контента в блоге или на сайте документации. Визуальный HTML сохраняет большую часть макета PDF-файла за счет абсолютного позиционирования, что подходит, когда внешний вид документа имеет большее значение, чем простота повторения.
PDF-файлы не очень хорошо работают в Интернете. Мобильные браузеры неуклюже обрабатывают PDF-файлы, программы чтения с экрана обрабатывают их непоследовательно, поисковые системы сканируют их, но оценивают их ниже, чем эквивалентный HTML, а встраивание PDF-файла в веб-страницу создает неуклюжую программу просмотра в формате iframe, а не нативный интерфейс. Преобразование в HTML создает контент, который работает так же, как работает Интернет.
HTML также доступен для редактирования. Как только содержимое PDF-файла будет преобразовано в HTML-форму, вы сможете изменить типографику, реструктурировать разделы, добавить интерактивные элементы и интегрировать содержимое с другими веб-страницами. PDF сопротивляется всем этим операциям.
Отбросьте PDF-файл, выберите стиль вывода, сгенерируйте.
PDF.js представляет текстовое содержимое в виде элементов с ограничивающими рамками, шрифтами и строками Юникода. Конвертер сортирует элементы по Y, затем по X, чтобы восстановить порядок чтения, группирует элементы с одинаковыми базовыми линиями в строки и группирует строки в абзацы на основе вертикального интервала.
При обнаружении заголовков используется анализ размера шрифта: размеры, значительно превышающие основной шрифт, становятся заголовками, при этом самый большой из них отображается в h1, следующий по величине — в h2 и так далее. Обнаружение списка ищет строки, начинающиеся с символов маркера или числовых последовательностей.
Выходной HTML является автономным: тип документа, заголовок со встроенным CSS для типографики, тело с преобразованным содержимым. Встроенные изображения из PDF-файла в настоящее время не встроены; они остаются известным ограничением. Вывод подтверждается как HTML5.