Безкоштовний конвертер

PDF в Word (DOCX)

Витягніть текст із PDF-файлу та повністю перетворіть його у формат Word, який можна редагувати, у вашому браузері. Швидко, безпечно та конфіденційно.

Перетягніть файл PDF сюди

Підтримує до 50 Мб

Або

Про цей інструмент

PDF і DOCX (Microsoft Word) описують документи, використовуючи принципово різні моделі. PDF — це формат із фіксованим макетом: кожен гліф має чітке розташування на сторінці фіксованого розміру, завдяки чому документ виглядає ідентичним всюди, де він відображається. DOCX — це формат потокового макета: абзаци, таблиці та заголовки описуються семантично, а механізм візуалізації вирішує, де вони розміщені на сторінці, залежно від поточного розміру сторінки та наявності шрифту. Перетворення з PDF на DOCX означає реверсивну інженерію фіксованого макета в семантичну структуру, яку Word може переформатувати.

Це перетворення за своєю суттю є втратним. PDF зазвичай не зберігає рівні заголовків, межі абзаців, структуру списку або семантику таблиці; конвертер має зробити висновок про це з розмірів шрифту, позиції та символів маркерів. Прості текстові PDF-файли легко конвертуються. Складні PDF-файли з макетами в кілька стовпців, вбудованими зображеннями, виносками або незвичайною типографікою зазвичай потребують ручного очищення після перетворення.

Цей інструмент запускає перетворення у вашому браузері, використовуючи PDF.js для синтаксичного аналізу та настроюваний записувач макета в DOCX, який створює стандартний вивід Office Open XML. Результат відкривається в Microsoft Word, LibreOffice Writer, Google Docs та будь-якому іншому DOCX-сумісному редакторі. Завантаження не відбувається; файл залишається на вашому пристрої.

Навіщо конвертувати PDF у DOCX

Вся причина в можливості редагування. PDF-файл неприйнятний для редагування — ви можете заповнювати поля форми та додавати примітки, але ви не можете переформатувати текст, змінити стилі абзаців або змінити структуру вмісту без спеціалізованих редакторів PDF, які коштують грошей і дають суперечливі результати. DOCX створено для редагування. Перетворення PDF-файлу на DOCX робить вміст придатним для редагування, перекладу, перепрофілювання або редизайну.

Інша причина – співпраця. Word і Google Docs є лінгва франка спільної роботи над документами в офісах, школах і більшості організацій. Потоки коментарів, відстеження змін і спільне редагування – все це передбачає DOCX або його хмарні еквіваленти. PDF-файли, надіслані на перевірку, стають вузькими місцями; DOCX працює через стандартні інструменти для співпраці.

Як використовувати

Скиньте PDF, згенеруйте, завантажте. Очікуйте, що згодом буде виконано очищення у Word.

  1. Завантажте свій PDF: Перетягніть файл у область завантаження або натисніть, щоб переглянути. Підтримуються файли розміром до 50 Мб. PDF-файли, захищені паролем, не підтримуються; спершу видаліть пароль за допомогою робочого столу.
  2. Дочекайтеся розбору: PDF.js витягує текст, інформацію про шрифт і положення макета з кожної сторінки. Синтаксичний аналіз займає секунди для коротких документів і довше для документів із вбудованими зображеннями або складною графікою.
  3. конвертувати: Конвертер переглядає проаналізований вміст, визначає межі абзаців і заголовків на основі розмірів і позицій шрифтів і записує Office Open XML у zip-файл у пам’яті. Заголовки, абзаци та марковані списки зіставляються з еквівалентними стилями DOCX.
  4. Завантажте та очистіть: Збережіть файл .docx і відкрийте його в Word або в улюбленому редакторі. Заплануйте витратити кілька хвилин на усунення залишкових проблем — ієрархії заголовків, форматування списку, меж таблиці — які конвертер не міг точно визначити з PDF-файлу.

Загальні випадки використання

Технічні деталі

PDF.js аналізує кожну PDF-сторінку на потік текстових і графічних операцій. API вилучення тексту повертає текстові елементи з їх обмежувальними рамками, інформацією про шрифт і рядками, декодованими Unicode. З цих елементів конвертер реконструює порядок читання, сортуючи зверху вниз і зліва направо, групуючи елементи зі схожими базовими лініями в рядки, а рядки в абзаци.

DOCX — це zip-архів, що містить файли XML (document.xml, styles.xml, а також маніфести типу вмісту та зв’язків). Конвертер створює вміст document.xml за допомогою ряду елементів абзацу (w:p) і рядка (w:r), застосовує посилання на стилі для заголовків (Заголовок 1, Заголовок 2), де розмір шрифту пропонує заголовок, і збирає архів zip у пам’яті за допомогою JSZip.

Обмеження: макети стовпців не завжди відновлюються правильно. Таблиці в PDF-файлі відновлюються як абзаци, якщо тільки макет не передбачає табличної структури. Заголовки, нижні колонтитули та виноски зазвичай розміщуються в тексті, а не у відповідних зонах DOCX. Зображення, вбудовані в PDF, наразі не зберігаються у вихідних даних DOCX.

Найкращі практики

Поширені запитання

Чи змінює вміст конвертація PDF у DOCX?
Вміст збережено максимально точно. Проте деякі особливості формату можуть не мати прямих еквівалентів, тому можуть виникнути незначні відмінності у форматуванні.
Для чого використовується формат DOCX?
DOCX (Microsoft Word Document) в основному використовується для редагованих текстових документів із форматуванням.
Чи є якісь обмеження, про які варто знати?
Підтримуються файли розміром до 50 МБ. Обробка дуже великих або складних файлів може тривати довше. Усі перетворення відбуваються у вашому браузері, тому швидкість обробки залежить від вашого пристрою.
Чи дані мого документа захищені?
так Обробка документів повністю виконується у вашому браузері. Ваші файли та їхній вміст ніколи не завантажуються на сервери. Це робить безпечним конвертування чутливих або конфіденційних документів.
Чи збережуться таблиці?
Прості таблиці іноді перетворюються на таблиці Word; складні таблиці зазвичай перетворюються на форматовані абзаци, які потребують ручної реструктуризації. Заплануйте відтворення критичних таблиць вручну, якщо точність має значення.
Чи мій PDF-файл завантажено на сервер?
Ні. Синтаксичний аналіз PDF використовує PDF.js, а запис DOCX використовує JSZip — обидва вони повністю працюють у вашому браузері.
Який максимальний розмір файлу?
50 МБ. Практичні обмеження залежать від складності документа; PDF-файл такого розміру, який містить багато тексту, конвертується за секунди, тоді як документ такого ж розміру, який містить велику кількість графіки, може мати проблеми.
Чи можу я конвертувати PDF-файли, захищені паролем?
Ні. PDF.js не підтримує дешифрування. Спершу видаліть пароль за допомогою інструменту для робочого столу, наприклад qpdf або параметрів безпеки Acrobat.