Bezmaksas pārveidotājs

PDF uz Word (DOCX)

Izņemiet tekstu no PDF un pilnībā pārveidojiet to rediģējamā Word formātā savā pārlūkprogrammā. Ātri, droši un privāti.

Nometiet PDF failu šeit

Atbalsta līdz 50 MB

Or

Par šo rīku

PDF un DOCX (Microsoft Word) apraksta dokumentus, izmantojot principiāli atšķirīgus modeļus. PDF ir fiksēta izkārtojuma formāts: katram glifam ir skaidra pozīcija fiksēta izmēra lapā, tādējādi dokuments izskatās identisks visur, kur tas tiek renderēts. DOCX ir plūsmas izkārtojuma formāts: rindkopas, tabulas un virsraksti tiek aprakstīti semantiski, un renderēšanas programma izlemj, kur tie atrodas lapā, pamatojoties uz pašreizējo lapas izmēru un fontu pieejamību. Konvertēšana no PDF uz DOCX nozīmē fiksētā izkārtojuma reverso inženieriju semantiskā struktūrā, ko Word var atkārtoti plūst.

Šī konversija pēc būtības ir ar zaudējumiem. PDF parasti nesaglabā virsrakstu līmeņus, rindkopu robežas, saraksta struktūru vai tabulas semantiku; pārveidotājam tie ir jāsecina no fontu izmēriem, pozīcijām un aizzīmju rakstzīmēm. Vienkārši teksta PDF faili tiek tīri pārveidoti. Sarežģītiem PDF failiem ar vairāku kolonnu izkārtojumu, iegultiem attēliem, zemsvītras piezīmēm vai neparastu tipogrāfiju pēc konvertēšanas parasti ir nepieciešama manuāla tīrīšana.

Šis rīks palaiž konvertēšanu jūsu pārlūkprogrammā, izmantojot PDF.js parsēšanai un pielāgotu izkārtojumu-DOCX rakstītāju, kas rada standarta Office Open XML izvadi. Rezultāts tiek atvērts programmā Microsoft Word, LibreOffice Writer, Google dokumenti un jebkurā citā ar DOCX saderīgā redaktorā. Augšupielāde nenotiek; fails paliek jūsu ierīcē.

Kāpēc konvertēt PDF uz DOCX

Rediģējamība ir viss iemesls. PDF ir naidīgs rediģēšanai — jūs varat aizpildīt veidlapas laukus un komentēt, taču nevarat pārkārtot tekstu, mainīt rindkopu stilus vai pārstrukturēt saturu bez specializētiem PDF redaktoriem, kas maksā naudu un rada nekonsekventus rezultātus. DOCX ir paredzēts rediģēšanai. PDF konvertēšana uz DOCX padara saturu izsekojamu pārskatīšanai, tulkošanai, pārveidošanai vai pārveidošanai.

Otrs iemesls ir sadarbība. Word un Google dokumenti ir lingua franca dokumentu sadarbībai birojos, skolās un lielākajā daļā organizāciju. Komentāru pavedieni, izsekošanas izmaiņas un koplietojamā rediģēšana pieņem DOCX vai tā mākoņa ekvivalentu. Pārskatīšanai nosūtītie PDF faili kļūst par vājajām vietām; DOCX plūst, izmantojot standarta sadarbības rīkus.

Kā lietot

Nometiet PDF, ģenerējiet, lejupielādējiet. Gaidiet, ka pēc tam veiksiet tīrīšanu programmā Word.

  1. Augšupielādējiet savu PDF failu: Velciet failu uz augšupielādes apgabalu vai noklikšķiniet, lai pārlūkotu. Tiek atbalstīti faili līdz 50 MB. Ar paroli aizsargāti PDF faili netiek atbalstīti; vispirms noņemiet paroli, izmantojot darbvirsmas rīku.
  2. Pagaidiet parsēšanu: PDF.js no katras lapas iegūst tekstu, fontu informāciju un izkārtojuma pozīcijas. Parsēšana aizņem sekundes īsiem dokumentiem un ilgāk – dokumentiem ar iegultiem attēliem vai sarežģītu grafiku.
  3. Konvertēt: Pārveidotājs staigā parsētajā saturā, secina rindkopu un virsrakstu robežas no fontu izmēriem un pozīcijām un ieraksta Office Open XML atmiņas zip failā. Virsraksti, rindkopas un aizzīmju saraksti tiek kartēti ar līdzvērtīgiem DOCX stiliem.
  4. Lejupielādējiet un notīriet: Saglabājiet .docx failu un atveriet to programmā Word vai vēlamajā redaktorā. Plānojiet dažas minūtes, lai novērstu atlikušās problēmas — virsrakstu hierarhiju, saraksta formatējumu, tabulu robežas —, kuras pārveidotājs nevarēja perfekti secināt no PDF faila.

Bieži lietojami gadījumi

Tehniskās detaļas

PDF.js parsē katru PDF lapu teksta un grafikas darbību plūsmā. Teksta ekstrakcijas API atgriež teksta vienumus ar to ierobežojošajiem lodziņiem, fonta informāciju un unikoda dekodētām virknēm. No šiem vienumiem pārveidotājs rekonstruē lasīšanas secību, kārtojot no augšas uz leju un no kreisās uz labo pusi, grupējot vienumus ar līdzīgām bāzes līnijām rindās un rindas rindkopās.

DOCX ir zip arhīvs, kas satur XML failus (document.xml, styles.xml, kā arī satura veidu un attiecību manifestus). Pārveidotājs veido document.xml saturu, izmantojot virkni rindkopu (w:p) un palaist (w:r) elementu, piemēro stila atsauces virsrakstiem (1. virsraksts, 2. virsraksts), kur fonta lielums norāda uz virsrakstu, un apkopo zip atmiņu, izmantojot JSZip.

Ierobežojumi: kolonnu izkārtojumi ne vienmēr tiek rekonstruēti pareizi. Tabulas PDF failā tiek atkoptas kā rindkopas, ja vien izkārtojumā nav skaidri norādīta tabulas struktūra. Galvenes, kājenes un zemsvītras piezīmes parasti tiek iekļautas pamattekstā, nevis attiecīgajās DOCX zonās. PDF failā iegultie attēli pašlaik netiek saglabāti DOCX izvadē.

Labākā prakse

Bieži uzdotie jautājumi

Vai PDF konvertēšana uz DOCX maina saturu?
Saturs tiek saglabāts pēc iespējas precīzāk. Tomēr dažiem formātam raksturīgajiem līdzekļiem var nebūt tiešu ekvivalentu, tāpēc var rasties nelielas formatēšanas atšķirības.
Kam tiek izmantots DOCX formāts?
DOCX (Microsoft Word dokuments) galvenokārt tiek izmantots rediģējamiem teksta dokumentiem ar formatējumu.
Vai ir kādi ierobežojumi, kas jāzina?
Tiek atbalstīti faili līdz 50 MB. Ļoti lielu vai sarežģītu failu apstrāde var aizņemt ilgāku laiku. Visas konversijas notiek jūsu pārlūkprogrammā, tāpēc apstrādes ātrums ir atkarīgs no jūsu ierīces.
Vai mani dokumenta dati ir droši?
Jā. Dokumentu apstrāde pilnībā darbojas jūsu pārlūkprogrammā. Jūsu faili un to saturs nekad netiek augšupielādēti nevienā serverī. Tādējādi ir droši konvertēt sensitīvus vai konfidenciālus dokumentus.
Vai tiks saglabāti galdi?
Vienkāršas tabulas dažreiz tiek pārveidotas par Word tabulām; sarežģītas tabulas parasti pārvērš formatētās rindkopās, kas ir manuāli jāpārstrukturē. Ja precizitātei ir nozīme, plānojiet manuāli izveidot kritiskās tabulas.
Vai mans PDF ir augšupielādēts serverī?
Nē. PDF parsēšanai tiek izmantots PDF.js un DOCX rakstīšanai tiek izmantots JSZip — abas pilnībā darbojas jūsu pārlūkprogrammā.
Kāds ir maksimālais faila lielums?
50 MB. Praktiskie ierobežojumi ir atkarīgi no dokumenta sarežģītības; Šāda izmēra PDF fails ar lielu tekstu pārveido dažu sekunžu laikā, savukārt tāda paša izmēra dokuments, kurā ir daudz grafisko dokumentu, var rasties grūtības.
Vai es varu konvertēt ar paroli aizsargātus PDF failus?
Nē. PDF.js neievieš atšifrēšanu. Vispirms noņemiet paroli, izmantojot darbvirsmas rīku, piemēram, qpdf vai Acrobat drošības iestatījumus.