Zdarma převodník

PDF do Word (DOCX)

Extrahujte text z PDF a převeďte jej do upravitelného formátu Word zcela ve vašem prohlížeči. Rychlé, bezpečné a soukromé.

Sem přetáhněte soubor PDF

Podporuje až 50 MB

Nebo

O tomto nástroji

PDF a DOCX (Microsoft Word) popisují dokumenty pomocí zásadně odlišných modelů. PDF je formát s pevným rozvržením: každý glyf má explicitní polohu na stránce s pevnou velikostí, takže dokument vypadá identicky všude, kde je vykreslen. DOCX je formát flow-layout: odstavce, tabulky a nadpisy jsou popsány sémanticky a vykreslovací modul rozhoduje o tom, kde na stránce spadají, na základě aktuální velikosti stránky a dostupnosti písem. Převod z PDF do DOCX znamená zpětné inženýrství pevného rozvržení do sémantické struktury, kterou může Word přetavit.

Tato konverze je ze své podstaty ztrátová. PDF obecně nezachovává úrovně nadpisů, hranice odstavců, strukturu seznamu ani sémantiku tabulek; převodník je musí odvodit z velikostí písma, pozic a znaků odrážek. Jednoduché textové soubory PDF se převádějí čistě. Složité soubory PDF s rozvržením ve více sloupcích, vloženými obrázky, poznámkami pod čarou nebo neobvyklou typografií obvykle vyžadují po převodu ruční vyčištění.

Tento nástroj spouští převod ve vašem prohlížeči pomocí souboru PDF.js pro analýzu a vlastního zápisu rozložení do DOCX, který vytváří standardní výstup Office Open XML. Výsledek se otevře v aplikacích Microsoft Word, LibreOffice Writer, Dokumenty Google a jakémkoli jiném editoru kompatibilním s DOCX. Nedojde k nahrání; soubor zůstane ve vašem zařízení.

Proč převádět PDF do DOCX

Editovatelnost je celý důvod. PDF je nepřátelské k úpravám – můžete vyplňovat pole formulářů a přidávat poznámky, ale nemůžete přeformátovat text, měnit styly odstavců nebo restrukturalizovat obsah bez specializovaných editorů PDF, které stojí peníze a produkují nekonzistentní výsledky. DOCX je vytvořen pro editaci. Převedením PDF do DOCX je obsah upravitelný pro revizi, překlad, přepracování nebo přepracování.

Dalším důvodem je spolupráce. Word a Dokumenty Google jsou lingua franca spolupráce na dokumentech v kancelářích, školách a většině organizací. Vlákna komentářů, sledování změn a sdílené úpravy předpokládají DOCX nebo jeho cloudové ekvivalenty. Soubory PDF odeslané ke kontrole se stávají úzkými hrdly; DOCX prochází standardními nástroji pro spolupráci.

Jak používat

Pusťte PDF, vygenerujte, stáhněte. Počítejte s tím, že poté ve Wordu provedete nějaké vyčištění.

  1. Nahrajte soubor PDF: Přetáhněte soubor do oblasti pro nahrávání nebo kliknutím procházejte. Podporovány jsou soubory do 50 MB. Soubory PDF chráněné heslem nejsou podporovány; nejprve odstraňte heslo pomocí nástroje na ploše.
  2. Počkejte na analýzu: PDF.js extrahuje text, informace o písmech a umístění rozvržení z každé stránky. Analýza trvá několik sekund u krátkých dokumentů a déle u dokumentů s vloženými obrázky nebo složitou grafikou.
  3. Převést: Převaděč prochází analyzovaný obsah, odvozuje hranice odstavců a nadpisů z velikostí a pozic písem a zapisuje Office Open XML do souboru zip v paměti. Nadpisy, odstavce a seznamy odrážek jsou mapovány na ekvivalentní styly DOCX.
  4. Stáhněte a vyčistěte: Uložte soubor .docx a otevřete jej ve Wordu nebo v preferovaném editoru. Naplánujte si, že strávíte několik minut opravou zbytkových problémů – hierarchie nadpisů, formátování seznamu, hranice tabulek – které převaděč nedokázal dokonale odvodit z PDF.

Běžné případy použití

Technické detaily

PDF.js analyzuje každou stránku PDF do proudu textových a grafických operací. Rozhraní API pro extrakci textu vrací textové položky s jejich ohraničujícími rámečky, informacemi o písmech a řetězci dekódovanými v Unicode. Z těchto položek převaděč rekonstruuje pořadí čtení řazením shora dolů a zleva doprava, seskupováním položek s podobnými účařími do řádků a řádků do odstavců.

DOCX je zip archiv obsahující soubory XML (document.xml, styles.xml, plus typ obsahu a manifesty vztahů). Převaděč vytvoří obsah document.xml pomocí řady prvků odstavce (w:p) a run (w:r), použije odkazy na styl pro nadpisy (Nadpis 1, Nadpis 2), kde velikost písma naznačuje nadpis, a sestaví zip v paměti pomocí JSZip.

Omezení: rozvržení sloupců není vždy správně rekonstruováno. Tabulky v PDF jsou obnoveny jako odstavce, pokud rozložení silně nenaznačuje tabulkovou strukturu. Záhlaví, zápatí a poznámky pod čarou obvykle končí inline v těle, nikoli v odpovídajících zónách DOCX. Obrázky vložené do PDF nejsou aktuálně zachovány ve výstupu DOCX.

Nejlepší postupy

Často kladené dotazy

Změní převod PDF do DOCX obsah?
Obsah je zachován co nejpřesněji. Některé funkce specifické pro formát však nemusí mít přímé ekvivalenty, takže mohou nastat drobné rozdíly ve formátování.
K čemu se používá formát DOCX?
DOCX (Microsoft Word Document) se primárně používá pro editovatelné textové dokumenty s formátováním.
Existují nějaká omezení, která je třeba si uvědomit?
Podporovány jsou soubory do 50 MB. Zpracování velmi velkých nebo složitých souborů může trvat déle. Veškerá konverze probíhá ve vašem prohlížeči, takže rychlost zpracování závisí na vašem zařízení.
Jsou data mých dokumentů v bezpečí?
Ano. Zpracování dokumentů probíhá výhradně ve vašem prohlížeči. Vaše soubory a jejich obsah nejsou nikdy nahrány na žádný server. Díky tomu lze bezpečně převádět citlivé nebo důvěrné dokumenty.
Budou zachovány tabulky?
Jednoduché tabulky se někdy převádějí na tabulky aplikace Word; složité tabulky se obvykle převádějí na formátované odstavce, které vyžadují ruční restrukturalizaci. Pokud záleží na přesnosti, naplánujte si ruční opětovné vytvoření kritických tabulek.
Je moje PDF nahráno na server?
Ne. Analýza PDF používá soubor PDF.js a zápis DOCX používá JSZip – oba běží výhradně ve vašem prohlížeči.
Jaká je maximální velikost souboru?
50 MB. Praktické limity závisí na složitosti dokumentu; textově zatížené PDF takové velikosti se převede během několika sekund, zatímco grafický dokument stejné velikosti může mít potíže.
Mohu převádět soubory PDF chráněné heslem?
Ne. PDF.js neimplementuje dešifrování. Nejprve odstraňte heslo pomocí nástroje na ploše, jako je qpdf nebo nastavení zabezpečení aplikace Acrobat.