PDF u Word (DOCX)
Ekstrahirajte tekst iz PDF-a i pretvorite ga u Wordov format koji se može uređivati u potpunosti u vašem pregledniku. Brzo, sigurno i privatno.
Ispustite PDF datoteku ovdje
Podržava do 50 MB
Ekstrahirajte tekst iz PDF-a i pretvorite ga u Wordov format koji se može uređivati u potpunosti u vašem pregledniku. Brzo, sigurno i privatno.
Podržava do 50 MB
PDF i DOCX (Microsoft Word) opisuju dokumente koristeći bitno različite modele. PDF je format fiksnog rasporeda: svaki glif ima eksplicitnu poziciju na stranici fiksne veličine, zbog čega dokument izgleda identično svugdje gdje se prikazuje. DOCX je format protočnog rasporeda: odlomci, tablice i naslovi opisani su semantički, a mehanizam za iscrtavanje odlučuje gdje će pasti na stranici na temelju trenutne veličine stranice i dostupnosti fonta. Pretvorba iz PDF-a u DOCX znači obrnuti inženjering fiksnog izgleda u semantičku strukturu koju Word može ponovno pretočiti.
Ova konverzija je sama po sebi s gubicima. PDF općenito ne čuva razine naslova, granice odlomaka, strukturu popisa ili semantiku tablice; pretvarač ih mora zaključiti iz veličine fonta, položaja i znakova grafičkih oznaka. Jednostavni tekstualni PDF-ovi čisto se pretvaraju. Složeni PDF-ovi s rasporedom u više stupaca, ugrađenim slikama, fusnotama ili neobičnom tipografijom obično trebaju ručno čišćenje nakon pretvorbe.
Ovaj alat pokreće pretvorbu u vašem pregledniku koristeći PDF.js za raščlanjivanje i prilagođeni pisač izgleda u DOCX koji proizvodi standardni Office Open XML izlaz. Rezultat se otvara u Microsoft Wordu, LibreOffice Writeru, Google Dokumentima i bilo kojem drugom uređivaču koji je kompatibilan s DOCX-om. Nema prijenosa; datoteka ostaje na vašem uređaju.
Mogućnost uređivanja je cijeli razlog. PDF je neprijateljski raspoložen prema uređivanju — možete popuniti polja obrasca i komentirati, ali ne možete preoblikovati tekst, promijeniti stilove odlomaka ili restrukturirati sadržaj bez specijaliziranih PDF uređivača koji koštaju i daju nedosljedne rezultate. DOCX je napravljen za uređivanje. Pretvaranje PDF-a u DOCX čini sadržaj pogodnim za reviziju, prijevod, prenamjenu ili redizajn.
Drugi razlog je suradnja. Word i Google Docs su lingua franca suradnje na dokumentima u uredima, školama i većini organizacija. Niti komentiranja, praćenje promjena i zajedničko uređivanje pretpostavljaju DOCX ili njegove ekvivalente u oblaku. PDF-ovi poslani na pregled postaju uska grla; DOCX teče kroz standardne alate za suradnju.
Ispustite PDF, generirajte, preuzmite. Očekujte naknadno čišćenje u Wordu.
PDF.js analizira svaku PDF stranicu u tok tekstualnih i grafičkih operacija. API za izdvajanje teksta vraća tekstualne stavke s njihovim graničnim okvirima, informacijama o fontu i Unicode dekodiranim nizovima. Iz ovih stavki pretvarač rekonstruira redoslijed čitanja razvrstavanjem od vrha prema dolje i slijeva nadesno, grupirajući stavke sa sličnim osnovnim crtama u retke, a retke u odlomke.
DOCX je zip arhiva koja sadrži XML datoteke (document.xml, styles.xml, plus tip sadržaja i manifesti odnosa). Pretvarač gradi dokument.xml sadržaj pomoću niza elemenata odlomaka (w:p) i niza (w:r), primjenjuje stilske reference za naslove (Naslov 1, Naslov 2) gdje veličina fonta sugerira naslov i sastavlja zip u memoriji pomoću JSZipa.
Ograničenja: rasporedi stupaca nisu uvijek ispravno rekonstruirani. Tablice u PDF-u vraćaju se kao odlomci osim ako izgled snažno ne sugerira tabelarnu strukturu. Zaglavlja, podnožja i bilješke obično završavaju unutar teksta u tijelu, a ne u odgovarajućim DOCX zonama. Slike ugrađene u PDF trenutno nisu sačuvane u DOCX izlazu.