Brezplačni pretvornik

PDF v Word (DOCX)

Ekstrahirajte besedilo iz PDF-ja in ga v celoti pretvorite v Wordov format, ki ga je mogoče urejati, v vašem brskalniku. Hitro, varno in zasebno.

Spustite datoteko PDF sem

Podpira do 50 MB

oz

O tem orodju

PDF in DOCX (Microsoft Word) opisujeta dokumente z bistveno različnimi modeli. PDF je format s fiksno postavitvijo: vsak glif ima eksplicitno določen položaj na strani s fiksno velikostjo, zaradi česar je dokument videti enak povsod, kjer je upodobljen. DOCX je format tekoče postavitve: odstavki, tabele in naslovi so opisani semantično, mehanizem za upodabljanje pa se odloči, kje na strani bodo na podlagi trenutne velikosti strani in razpoložljivosti pisave. Pretvarjanje iz PDF v DOCX pomeni obratno pretvorbo fiksne postavitve v semantično strukturo, ki jo lahko Word pretoči.

Ta pretvorba je sama po sebi izgubna. PDF na splošno ne ohranja ravni naslovov, meja odstavkov, strukture seznama ali semantike tabel; pretvornik jih mora sklepati iz velikosti pisave, položajev in znakov. Preprosti besedilni PDF-ji se čisto pretvorijo. Zapletene datoteke PDF s postavitvami v več stolpcih, vdelanimi slikami, sprotnimi opombami ali nenavadno tipografijo je po pretvorbi običajno treba ročno očistiti.

To orodje zažene pretvorbo v vašem brskalniku z uporabo PDF.js za razčlenjevanje in zapisovalnika postavitve v DOCX po meri, ki ustvari standardni izpis Office Open XML. Rezultat se odpre v programih Microsoft Word, LibreOffice Writer, Google Docs in katerem koli drugem urejevalniku, združljivem z DOCX. Nalaganje se ne zgodi; datoteka ostane v vaši napravi.

Zakaj pretvoriti PDF v DOCX

Možnost urejanja je glavni razlog. PDF je sovražen do urejanja – lahko izpolnite polja obrazca in dodate opombe, vendar ne morete preoblikovati besedila, spremeniti slogov odstavkov ali prestrukturirati vsebine brez specializiranih urejevalnikov PDF, ki stanejo in dajejo nedosledne rezultate. DOCX je zasnovan za urejanje. S pretvorbo PDF-ja v DOCX je vsebina primerna za revizijo, prevod, preoblikovanje ali preoblikovanje.

Drugi razlog je sodelovanje. Word in Google Docs sta lingua franca sodelovanja pri dokumentih v pisarnah, šolah in večini organizacij. Niti komentiranja, spremljanje sprememb in urejanje v skupni rabi predvidevajo DOCX ali njegove ekvivalente v oblaku. PDF-ji, poslani v pregled, postanejo ozka grla; DOCX teče skozi standardna orodja za sodelovanje.

Kako uporabljati

Spustite PDF, ustvarite, prenesite. Pričakujte, da boste pozneje opravili nekaj čiščenja v Wordu.

  1. Naložite svoj PDF: Povlecite datoteko v območje za nalaganje ali kliknite za brskanje. Podprte so datoteke do 50 MB. PDF-ji, zaščiteni z geslom, niso podprti; najprej odstranite geslo z namiznim orodjem.
  2. Počakajte na razčlenjevanje: PDF.js izvleče besedilo, informacije o pisavah in položaje postavitve z vsake strani. Razčlenjevanje traja nekaj sekund za kratke dokumente in dlje za dokumente z vdelanimi slikami ali zapleteno grafiko.
  3. Pretvori: Pretvornik se sprehodi po razčlenjeni vsebini, sklepa o mejah odstavkov in naslovov iz velikosti in položajev pisave ter zapiše Office Open XML v datoteko zip v pomnilniku. Naslovi, odstavki in seznami oznak so preslikani v enakovredne sloge DOCX.
  4. Prenesite in počistite: Shranite datoteko .docx in jo odprite v Wordu ali svojem želenem urejevalniku. Načrtujte, da boste porabili nekaj minut za odpravljanje preostalih težav – hierarhije naslovov, oblikovanja seznama, meja tabele – ki jih pretvornik ni mogel popolnoma razbrati iz PDF-ja.

Pogosti primeri uporabe

Tehnične podrobnosti

PDF.js vsako stran PDF razčleni v tok besedilnih in grafičnih operacij. API za ekstrakcijo besedila vrne besedilne elemente z njihovimi omejevalnimi okvirji, informacijami o pisavi in ​​nizi, dekodiranimi z Unicode. Iz teh elementov pretvornik rekonstruira vrstni red branja z razvrščanjem od zgoraj navzdol in od leve proti desni, združevanje elementov s podobnimi osnovnimi črtami v vrstice in vrstice v odstavke.

DOCX je arhiv zip, ki vsebuje datoteke XML (document.xml, styles.xml ter manifeste vrste vsebine in odnosov). Pretvornik gradi vsebino document.xml z nizom elementov odstavkov (w:p) in run (w:r), uporablja sklice na sloge za naslove (Naslov 1, Naslov 2), kjer velikost pisave predlaga naslov, in sestavi zip v pomnilniku z uporabo JSZip.

Omejitve: postavitve stolpcev niso vedno pravilno rekonstruirane. Tabele v PDF-ju so obnovljene kot odstavki, razen če postavitev močno nakazuje tabelarno strukturo. Glave, noge in sprotne opombe se običajno končajo v vrstici v telesu in ne v ustreznih območjih DOCX. Slike, vdelane v PDF, trenutno niso ohranjene v izhodu DOCX.

Najboljše prakse

Pogosta vprašanja

Ali pretvorba PDF v DOCX spremeni vsebino?
Vsebina je ohranjena čim bolj natančno. Vendar pa nekatere funkcije, specifične za obliko, morda nimajo neposrednih ustreznikov, zato lahko pride do manjših razlik v oblikovanju.
Za kaj se uporablja format DOCX?
DOCX (Microsoft Word Document) se uporablja predvsem za urejanje besedilnih dokumentov z oblikovanjem.
Ali obstajajo kakšne omejitve, na katere se morate zavedati?
Podprte so datoteke do 50 MB. Obdelava zelo velikih ali zapletenih datotek lahko traja dlje. Vse pretvorbe se zgodijo v vašem brskalniku, zato je hitrost obdelave odvisna od vaše naprave.
Ali so podatki mojih dokumentov varni?
ja Obdelava dokumentov poteka v celoti v vašem brskalniku. Vaše datoteke in njihova vsebina se nikoli ne naložijo na noben strežnik. Tako je pretvorba občutljivih ali zaupnih dokumentov varna.
Se bodo tabele ohranile?
Preproste tabele se včasih pretvorijo v Wordove tabele; kompleksne tabele se običajno pretvorijo v oblikovane odstavke, ki potrebujejo ročno prestrukturiranje. Načrtujte ročno ponovno ustvarjanje kritičnih tabel, če je natančnost pomembna.
Ali je moj PDF naložen na strežnik?
Ne. Razčlenjevanje PDF uporablja PDF.js, pisanje DOCX pa JSZip – oboje se v celoti izvaja v vašem brskalniku.
Kakšna je največja velikost datoteke?
50 MB. Praktične omejitve so odvisne od kompleksnosti dokumenta; besedilo težak PDF te velikosti se pretvori v nekaj sekundah, medtem ko lahko grafično težak dokument enake velikosti povzroči težave.
Ali lahko pretvorim PDF-je, zaščitene z geslom?
Ne. PDF.js ne izvaja dešifriranja. Najprej odstranite geslo z namiznim orodjem, kot je qpdf ali varnostnimi nastavitvami Acrobat.