Convertor gratuit

PDF către Word (DOCX)

Extrageți text din PDF și convertiți-l în format Word editabil în întregime în browser. Rapid, sigur și privat.

Aruncă fișierul PDF aici

Suportă până la 50 MB

Sau

Despre acest instrument

PDF și DOCX (Microsoft Word) descriu documente folosind modele fundamental diferite. PDF este un format cu aspect fix: fiecare glif are o poziție explicită pe o pagină de dimensiune fixă, făcând documentul să arate identic oriunde este redat. DOCX este un format de layout flux: paragrafele, tabelele și titlurile sunt descrise semantic, iar motorul de randare decide unde se află în pagină în funcție de dimensiunea actuală a paginii și disponibilitatea fontului. Convertirea de la PDF la DOCX înseamnă realizarea de inginerie inversă a aspectului fix într-o structură semantică pe care Word o poate reflua.

Această conversie este în mod inerent cu pierderi. PDF, în general, nu păstrează nivelurile de titlu, limitele paragrafelor, structura listei sau semantica tabelului; convertizorul trebuie să deducă acestea din dimensiunile fontului, pozițiile și caracterele marcatoare. PDF-urile simple bazate pe text se convertesc în mod curat. PDF-urile complexe cu aspect pe mai multe coloane, imagini încorporate, note de subsol sau tipografie neobișnuită necesită de obicei curățare manuală după conversie.

Acest instrument rulează conversia în browser utilizând PDF.js pentru analiza și un writer personalizat de layout-to-DOCX care produce ieșire standard Office Open XML. Rezultatul se deschide în Microsoft Word, LibreOffice Writer, Google Docs și orice alt editor compatibil DOCX. Nu are loc încărcare; fișierul rămâne pe dispozitivul dvs.

De ce convertiți PDF în DOCX

Editabilitatea este întregul motiv. PDF-ul este ostil editării — puteți completa câmpurile de formular și puteți face adnotări, dar nu puteți redistribui textul, nu puteți modifica stilurile de paragraf sau nu puteți restructura conținut fără editori PDF specializați care costă bani și produc rezultate inconsecvente. DOCX este creat pentru editare. Convertirea unui PDF în DOCX face ca conținutul să fie tratabil pentru revizuire, traducere, reutilizare sau reproiectare.

Celălalt motiv este colaborarea. Word și Google Docs sunt limba franca a colaborării documentelor în birouri, școli și majoritatea organizațiilor. Firele de comentarii, urmărirea modificărilor și editarea partajată presupun DOCX sau echivalentele sale în cloud. PDF-urile trimise spre revizuire devin blocaje; DOCX curge prin instrumente standard de colaborare.

Cum se utilizează

Aruncă PDF-ul, generează, descarcă. Așteptați-vă să faceți ceva curățare în Word după aceea.

  1. Încărcați PDF-ul: Trageți fișierul în zona de încărcare sau faceți clic pentru a răsfoi. Sunt acceptate fișiere de până la 50 MB. PDF-urile protejate prin parolă nu sunt acceptate; mai întâi eliminați parola folosind un instrument desktop.
  2. Așteptați analizarea: PDF.js extrage text, informații despre font și poziții de aspect din fiecare pagină. Analiza durează câteva secunde pentru documentele scurte și mai mult pentru documentele cu imagini încorporate sau grafică complexă.
  3. Convertiți: Convertorul parcurge conținutul analizat, deduce limitele paragrafelor și titlurilor din dimensiunile și pozițiile fontului și scrie Office Open XML într-un fișier zip din memorie. Titlurile, paragrafele și listele cu marcatori sunt mapate la stilurile DOCX echivalente.
  4. Descărcați și curățați: Salvați fișierul .docx și deschideți-l în Word sau editorul preferat. Planificați să petreceți câteva minute pentru a remedia problemele reziduale - ierarhia titlurilor, formatarea listei, limitele tabelelor - pe care convertorul nu le-a putut deduce perfect din PDF.

Cazuri comune de utilizare

Detalii tehnice

PDF.js analizează fiecare pagină PDF într-un flux de operații de text și grafică. API-ul de extracție a textului returnează elementele de text cu casetele lor de delimitare, informațiile despre font și șirurile decodate Unicode. Din aceste elemente, convertorul reconstruiește ordinea de citire prin sortarea de sus în jos și de la stânga la dreapta, grupând elementele cu linii de bază similare în linii și linii în paragrafe.

DOCX este o arhivă zip care conține fișiere XML (document.xml, styles.xml, plus tipul de conținut și manifeste de relații). Convertorul construiește conținutul document.xml folosind o serie de elemente de paragraf (w:p) și rulează (w:r), aplică referințe de stil pentru titluri (Titlu 1, Titlu 2) unde dimensiunea fontului sugerează un titlu și asambla zip-ul în memorie folosind JSZip.

Limitări: layout-urile coloanelor nu sunt întotdeauna reconstruite corect. Tabelele din PDF sunt recuperate ca paragrafe, cu excepția cazului în care aspectul sugerează cu tărie o structură tabelară. Anteturile, subsolurile și notele de subsol ajung de obicei în linie în corp, mai degrabă decât în ​​zonele DOCX corespunzătoare. Imaginile încorporate în PDF nu sunt păstrate în prezent în ieșirea DOCX.

Cele mai bune practici

Întrebări frecvente

Convertirea PDF în DOCX schimbă conținutul?
Conținutul este păstrat cât mai exact posibil. Cu toate acestea, este posibil ca unele caracteristici specifice formatului să nu aibă echivalente directe, astfel încât pot apărea diferențe minore de formatare.
Pentru ce este folosit formatul DOCX?
DOCX (document Microsoft Word) este utilizat în principal pentru documente text editabile cu formatare.
Există limitări de care trebuie să fii conștient?
Sunt acceptate fișiere de până la 50 MB. Procesarea fișierelor foarte mari sau complexe poate dura mai mult. Toate conversiile au loc în browserul dvs., astfel încât viteza de procesare depinde de dispozitivul dvs.
Datele documentului meu sunt securizate?
Da. Procesarea documentelor rulează în întregime în browserul dvs. Fișierele dvs. și conținutul lor nu sunt încărcate niciodată pe niciun server. Acest lucru face să fie sigură convertirea documentelor sensibile sau confidențiale.
Se vor păstra mesele?
Tabelele simple se convertesc uneori în tabele Word; tabelele complexe se convertesc de obicei în paragrafe formatate care necesită restructurare manuală. Planificați să recreați manual tabelele critice dacă precizia contează.
PDF-ul meu este încărcat pe un server?
Nu. Analiza PDF folosește PDF.js, iar scrierea DOCX folosește JSZip - ambele rulează în întregime în browser.
Care este dimensiunea maximă a fișierului?
50 MB. Limitele practice depind de complexitatea documentului; un PDF bogat în text de aceeași dimensiune se convertește în câteva secunde, în timp ce un document bogat în grafică de aceeași dimensiune poate avea dificultăți.
Pot converti fișiere PDF protejate cu parolă?
Nu. PDF.js nu implementează decriptarea. Îndepărtați mai întâi parola folosind un instrument desktop, cum ar fi qpdf sau setările de securitate Acrobat.