Bezplatný prevodník

PDF do Word (DOCX)

Extrahujte text z PDF a preveďte ho do upraviteľného formátu Word úplne vo svojom prehliadači. Rýchle, bezpečné a súkromné.

Sem presuňte súbor PDF

Podporuje až 50 MB

Alebo

O tomto nástroji

PDF a DOCX (Microsoft Word) popisujú dokumenty pomocou zásadne odlišných modelov. PDF je formát s pevným rozložením: každý glyf má explicitnú polohu na stránke s pevnou veľkosťou, vďaka čomu bude dokument vyzerať rovnako všade, kde je vykreslený. DOCX je formát flow-layout: odseky, tabuľky a nadpisy sú popísané sémanticky a vykresľovacie jadro rozhoduje o tom, kde na stránke spadnú na základe aktuálnej veľkosti stránky a dostupnosti písma. Konverzia z PDF do DOCX znamená spätné inžinierstvo pevného rozloženia do sémantickej štruktúry, ktorú môže Word pretaviť.

Táto konverzia je vo svojej podstate stratová. PDF vo všeobecnosti nezachováva úrovne nadpisov, hranice odsekov, štruktúru zoznamu ani sémantiku tabuľky; konvertor ich musí odvodiť z veľkostí písma, pozícií a znakov odrážok. Jednoduché textové súbory PDF sa prevádzajú čisto. Komplexné súbory PDF s rozložením vo viacerých stĺpcoch, vloženými obrázkami, poznámkami pod čiarou alebo nezvyčajnou typografiou zvyčajne vyžadujú po konverzii manuálne čistenie.

Tento nástroj spúšťa konverziu vo vašom prehliadači pomocou súboru PDF.js na analýzu a vlastného zapisovača formátu DOCX, ktorý vytvára štandardný výstup Office Open XML. Výsledok sa otvorí v programe Microsoft Word, LibreOffice Writer, Dokumenty Google a akomkoľvek inom editore kompatibilnom s DOCX. Nedochádza k žiadnemu nahrávaniu; súbor zostane vo vašom zariadení.

Prečo konvertovať PDF do DOCX

Úpravnosť je hlavným dôvodom. PDF je nepriateľské voči úpravám – môžete vyplniť polia formulárov a pridávať poznámky, ale nemôžete preformátovať text, zmeniť štýly odsekov ani reštrukturalizovať obsah bez špecializovaných editorov PDF, ktoré stoja peniaze a prinášajú nekonzistentné výsledky. DOCX je vytvorený na úpravu. Konverzia PDF do DOCX robí obsah spracovateľným na revíziu, preklad, prepracovanie alebo prepracovanie.

Ďalším dôvodom je spolupráca. Word a Dokumenty Google sú lingua franca spolupráce na dokumentoch v kanceláriách, školách a väčšine organizácií. Vlákna komentárov, sledovanie zmien a zdieľané úpravy predpokladajú DOCX alebo jeho cloudové ekvivalenty. Súbory PDF odoslané na kontrolu sa stávajú prekážkami; DOCX prechádza štandardnými nástrojmi spolupráce.

Ako používať

Pustite PDF, vygenerujte, stiahnite. Očakávajte, že potom vo Worde urobíte nejaké vyčistenie.

  1. Nahrajte súbor PDF: Presuňte súbor do oblasti nahrávania alebo ho kliknutím prehľadávajte. Podporované sú súbory do 50 MB. Súbory PDF chránené heslom nie sú podporované; najprv odstráňte heslo pomocou nástroja na pracovnej ploche.
  2. Počkajte na analýzu: PDF.js extrahuje text, informácie o písme a pozície rozloženia z každej stránky. Analýza trvá niekoľko sekúnd pre krátke dokumenty a dlhšie pre dokumenty s vloženými obrázkami alebo zložitou grafikou.
  3. Konvertovať: Konvertor prechádza analyzovaným obsahom, odvodzuje hranice odsekov a nadpisov z veľkostí a pozícií písma a zapisuje Office Open XML do súboru zip v pamäti. Nadpisy, odseky a zoznamy odrážok sú namapované na ekvivalentné štýly DOCX.
  4. Stiahnite si a vyčistite: Uložte súbor .docx a otvorte ho v programe Word alebo v preferovanom editore. Plánujte stráviť niekoľko minút opravou zvyškových problémov – hierarchia nadpisov, formátovanie zoznamu, hranice tabuliek – ktoré konvertor nedokázal dokonale odvodiť z PDF.

Bežné prípady použitia

Technické detaily

PDF.js analyzuje každú stránku PDF do prúdu textových a grafických operácií. Rozhranie API na extrakciu textu vracia textové položky s ich ohraničovacími rámčekmi, informáciami o písme a reťazcami dekódovanými v kódovaní Unicode. Z týchto položiek konvertor rekonštruuje poradie čítania triedením zhora nadol a zľava doprava, zoskupením položiek s podobnými základnými čiarami do riadkov a riadkov do odsekov.

DOCX je zip archív obsahujúci súbory XML (document.xml, styles.xml plus typ obsahu a manifesty vzťahov). Konvertor vytvorí obsah document.xml pomocou série prvkov odsek (w:p) a run (w:r), použije odkazy na štýl pre nadpisy (nadpis 1, nadpis 2), kde veľkosť písma naznačuje nadpis, a zostaví zip v pamäti pomocou JSZip.

Obmedzenia: rozloženia stĺpcov nie sú vždy správne zrekonštruované. Tabuľky v PDF sa obnovia ako odseky, pokiaľ rozloženie silne nenaznačuje tabuľkovú štruktúru. Hlavičky, päty a poznámky pod čiarou zvyčajne skončia v riadku v tele a nie v zodpovedajúcich zónach DOCX. Obrázky vložené do PDF nie sú momentálne zachované vo výstupe DOCX.

osvedčené postupy

Často kladené otázky

Zmení prevod PDF do DOCX obsah?
Obsah je zachovaný čo najpresnejšie. Niektoré funkcie špecifické pre formát však nemusia mať priame ekvivalenty, takže sa môžu vyskytnúť menšie rozdiely vo formátovaní.
Na čo sa používa formát DOCX?
DOCX (Microsoft Word Document) sa primárne používa na upraviteľné textové dokumenty s formátovaním.
Existujú nejaké obmedzenia, ktoré si treba uvedomiť?
Podporované sú súbory do 50 MB. Spracovanie veľmi veľkých alebo zložitých súborov môže trvať dlhšie. Všetky konverzie prebiehajú vo vašom prehliadači, takže rýchlosť spracovania závisí od vášho zariadenia.
Sú údaje môjho dokumentu v bezpečí?
áno. Spracovanie dokumentov prebieha výlučne vo vašom prehliadači. Vaše súbory a ich obsah sa nikdy neodovzdávajú na žiadny server. Vďaka tomu je bezpečná konverzia citlivých alebo dôverných dokumentov.
Zostanú zachované tabuľky?
Jednoduché tabuľky sa niekedy prevedú na tabuľky programu Word; zložité tabuľky sa zvyčajne prevedú na formátované odseky, ktoré si vyžadujú manuálnu reštrukturalizáciu. Naplánujte si manuálne opätovné vytvorenie kritických tabuliek, ak záleží na presnosti.
Je moje PDF nahrané na server?
Nie. Parsovanie PDF používa PDF.js a písanie DOCX používa JSZip – obe bežia úplne vo vašom prehliadači.
Aká je maximálna veľkosť súboru?
50 MB. Praktické limity závisia od zložitosti dokumentu; PDF takejto veľkosti s veľkým množstvom textu sa skonvertuje v priebehu niekoľkých sekúnd, zatiaľ čo dokument s rovnakou veľkosťou náročný na grafiku môže mať problémy.
Môžem konvertovať súbory PDF chránené heslom?
Nie. PDF.js neimplementuje dešifrovanie. Najprv odstráňte heslo pomocou nástroja pracovnej plochy, ako je napríklad qpdf alebo nastavenia zabezpečenia aplikácie Acrobat.