Besplatni pretvarač

PDF u Word (DOCX)

Ekstrahirajte tekst iz PDF-a i pretvorite ga u Wordov format koji se može uređivati ​​u potpunosti u vašem pregledniku. Brzo, sigurno i privatno.

Ispustite PDF datoteku ovdje

Podržava do 50 MB

Ili

O ovom alatu

PDF i DOCX (Microsoft Word) opisuju dokumente koristeći bitno različite modele. PDF je format fiksnog rasporeda: svaki glif ima eksplicitnu poziciju na stranici fiksne veličine, zbog čega dokument izgleda identično svugdje gdje se prikazuje. DOCX je format protočnog rasporeda: odlomci, tablice i naslovi opisani su semantički, a mehanizam za iscrtavanje odlučuje gdje će pasti na stranici na temelju trenutne veličine stranice i dostupnosti fonta. Pretvorba iz PDF-a u DOCX znači obrnuti inženjering fiksnog izgleda u semantičku strukturu koju Word može ponovno pretočiti.

Ova konverzija je sama po sebi s gubicima. PDF općenito ne čuva razine naslova, granice odlomaka, strukturu popisa ili semantiku tablice; pretvarač ih mora zaključiti iz veličine fonta, položaja i znakova grafičkih oznaka. Jednostavni tekstualni PDF-ovi čisto se pretvaraju. Složeni PDF-ovi s rasporedom u više stupaca, ugrađenim slikama, fusnotama ili neobičnom tipografijom obično trebaju ručno čišćenje nakon pretvorbe.

Ovaj alat pokreće pretvorbu u vašem pregledniku koristeći PDF.js za raščlanjivanje i prilagođeni pisač izgleda u DOCX koji proizvodi standardni Office Open XML izlaz. Rezultat se otvara u Microsoft Wordu, LibreOffice Writeru, Google Dokumentima i bilo kojem drugom uređivaču koji je kompatibilan s DOCX-om. Nema prijenosa; datoteka ostaje na vašem uređaju.

Zašto pretvoriti PDF u DOCX

Mogućnost uređivanja je cijeli razlog. PDF je neprijateljski raspoložen prema uređivanju — možete popuniti polja obrasca i komentirati, ali ne možete preoblikovati tekst, promijeniti stilove odlomaka ili restrukturirati sadržaj bez specijaliziranih PDF uređivača koji koštaju i daju nedosljedne rezultate. DOCX je napravljen za uređivanje. Pretvaranje PDF-a u DOCX čini sadržaj pogodnim za reviziju, prijevod, prenamjenu ili redizajn.

Drugi razlog je suradnja. Word i Google Docs su lingua franca suradnje na dokumentima u uredima, školama i većini organizacija. Niti komentiranja, praćenje promjena i zajedničko uređivanje pretpostavljaju DOCX ili njegove ekvivalente u oblaku. PDF-ovi poslani na pregled postaju uska grla; DOCX teče kroz standardne alate za suradnju.

Kako koristiti

Ispustite PDF, generirajte, preuzmite. Očekujte naknadno čišćenje u Wordu.

  1. Učitajte svoj PDF: Povucite datoteku u područje za učitavanje ili kliknite za pregledavanje. Podržane su datoteke do 50 MB. PDF-ovi zaštićeni lozinkom nisu podržani; prvo uklonite lozinku pomoću alata za radnu površinu.
  2. Pričekajte raščlanjivanje: PDF.js izdvaja tekst, informacije o fontu i položaje izgleda sa svake stranice. Raščlanjivanje traje nekoliko sekundi za kratke dokumente i duže za dokumente s ugrađenim slikama ili složenom grafikom.
  3. pretvoriti: Konverter prolazi kroz raščlanjeni sadržaj, zaključuje o granicama odlomaka i naslova na temelju veličina i položaja fonta te zapisuje Office Open XML u zip datoteku u memoriji. Naslovi, odlomci i popisi s grafičkim oznakama preslikavaju se u ekvivalentne DOCX stilove.
  4. Preuzmite i očistite: Spremite .docx datoteku i otvorite je u Wordu ili svom željenom editoru. Planirajte provesti nekoliko minuta popravljajući preostale probleme - hijerarhiju naslova, formatiranje popisa, granice tablice - koje pretvarač nije mogao savršeno zaključiti iz PDF-a.

Uobičajeni slučajevi upotrebe

Tehnički detalji

PDF.js analizira svaku PDF stranicu u tok tekstualnih i grafičkih operacija. API za izdvajanje teksta vraća tekstualne stavke s njihovim graničnim okvirima, informacijama o fontu i Unicode dekodiranim nizovima. Iz ovih stavki pretvarač rekonstruira redoslijed čitanja razvrstavanjem od vrha prema dolje i slijeva nadesno, grupirajući stavke sa sličnim osnovnim crtama u retke, a retke u odlomke.

DOCX je zip arhiva koja sadrži XML datoteke (document.xml, styles.xml, plus tip sadržaja i manifesti odnosa). Pretvarač gradi dokument.xml sadržaj pomoću niza elemenata odlomaka (w:p) i niza (w:r), primjenjuje stilske reference za naslove (Naslov 1, Naslov 2) gdje veličina fonta sugerira naslov i sastavlja zip u memoriji pomoću JSZipa.

Ograničenja: rasporedi stupaca nisu uvijek ispravno rekonstruirani. Tablice u PDF-u vraćaju se kao odlomci osim ako izgled snažno ne sugerira tabelarnu strukturu. Zaglavlja, podnožja i bilješke obično završavaju unutar teksta u tijelu, a ne u odgovarajućim DOCX zonama. Slike ugrađene u PDF trenutno nisu sačuvane u DOCX izlazu.

Najbolji primjeri iz prakse

Često postavljana pitanja

Mijenja li se sadržaj pretvaranjem PDF-a u DOCX?
Sadržaj je sačuvan što je točnije moguće. Međutim, neke značajke specifične za format možda nemaju izravne ekvivalente, pa se mogu pojaviti manje razlike u formatiranju.
Za što se koristi DOCX format?
DOCX (Microsoft Word Document) prvenstveno se koristi za uređivane tekstualne dokumente s formatiranjem.
Postoje li neka ograničenja kojih treba biti svjestan?
Podržane su datoteke do 50 MB. Obrada vrlo velikih ili složenih datoteka može potrajati dulje. Sve pretvorbe odvijaju se u vašem pregledniku, tako da brzina obrade ovisi o vašem uređaju.
Jesu li podaci mojih dokumenata sigurni?
da Obrada dokumenata u potpunosti se odvija u vašem pregledniku. Vaše datoteke i njihov sadržaj nikada se ne učitavaju ni na jedan poslužitelj. To čini sigurnim pretvaranje osjetljivih ili povjerljivih dokumenata.
Hoće li se stolovi sačuvati?
Jednostavne tablice ponekad se pretvaraju u Wordove tablice; složene tablice obično se pretvaraju u formatirane odlomke kojima je potrebno ručno restrukturiranje. Planirajte ponovno ručno kreiranje kritičnih tablica ako je preciznost važna.
Je li moj PDF prenesen na poslužitelj?
Ne. Raščlanjivanje PDF-a koristi PDF.js, a pisanje DOCX-a koristi JSZip — oba se u potpunosti izvode u vašem pregledniku.
Koja je najveća veličina datoteke?
50 MB. Praktična ograničenja ovise o složenosti dokumenta; PDF te veličine s puno teksta pretvara se u nekoliko sekundi, dok dokument s puno grafike iste veličine može imati poteškoća.
Mogu li pretvoriti PDF-ove zaštićene lozinkom?
Ne. PDF.js ne implementira dešifriranje. Najprije uklonite zaporku pomoću alata za radnu površinu kao što je qpdf ili Acrobatovih sigurnosnih postavki.