PDF do Převaděč HTML
Převeďte dokumenty PDF na čisté, sémantické soubory HTML přímo ve vašem prohlížeči. Rychlé, bezpečné a zachovává strukturu dokumentu.
Vyberte soubor PDF
nebo sem přetáhněte
Převeďte dokumenty PDF na čisté, sémantické soubory HTML přímo ve vašem prohlížeči. Rychlé, bezpečné a zachovává strukturu dokumentu.
nebo sem přetáhněte
Převod PDF do HTML přemění dokument s pevným rozvržením na plynulou webovou stránku. Převod zachová textový obsah, nadpisy, odstavce a základní styly, přičemž se opustí přesné rozložení pixelů PDF ve prospěch responzivního toku HTML. Toto je správný obchod pro dokumenty, které jsou znovu publikovány jako webový obsah – články, zprávy, technická dokumentace – a špatný obchod pro dokumenty, jejichž vzhled je zásadní – formuláře, faktury s přesným umístěním, navržené marketingové kusy.
Tento nástroj používá soubor PDF.js k extrahování textu, písem a základní struktury z PDF a poté zapíše odpovídající označení HTML s vloženým CSS pro typografii. Výstupem je samostatný .html soubor, který můžete otevřít v libovolném prohlížeči, vložit do CMS nebo dále upravit pomocí vlastního CSS. Nedojde k nahrání; převod probíhá ve vašem prohlížeči.
Jsou podporovány dva výstupní styly. Sémantické HTML vytváří čisté značení s prvky odstavců a nadpisů, které je vhodné pro opětovné publikování obsahu na blogu nebo webu s dokumentací. Vizuální HTML zachovává větší část rozvržení PDF prostřednictvím absolutního umístění, což je vhodné, když na vzhledu dokumentu záleží více než na možnosti změny toku.
Soubory PDF nefungují dobře na webu. Mobilní prohlížeče vykreslují PDF nešikovně, čtečky obrazovky s nimi zacházejí nekonzistentně, vyhledávače je procházejí, ale hodnotí je níže než ekvivalentní HTML, a vložení PDF do webové stránky vytváří spíše neohrabaný prohlížeč v rámci prvku iframe než nativní zážitek. Převod do HTML vytváří obsah, který funguje tak, jak funguje web.
HTML je také editovatelné. Jakmile je obsah PDF ve formě HTML, můžete změnit typografii, restrukturalizovat sekce, přidat interaktivní prvky a integrovat obsah s jinými webovými stránkami. PDF odolává všem těmto operacím.
Pusťte PDF, vyberte styl výstupu, vygenerujte.
PDF.js zpřístupňuje textový obsah jako položky s ohraničujícími rámečky, písmy a řetězci Unicode. Převaděč třídí položky podle Y a poté podle X, aby obnovil pořadí čtení, seskupuje položky na podobných účařích do řádků a seskupuje řádky do odstavců na základě vertikálních mezer.
Detekce nadpisů využívá analýzu velikosti písma: velikosti výrazně větší než hlavní písmo se stanou nadpisy, přičemž největší je mapován na h1, další největší na h2 atd. Detekce seznamu hledá řádky začínající znaky odrážek nebo číselnými sekvencemi.
Výstupní HTML je samostatné: doctype, hlava s vloženým CSS pro typografii, tělo s převedeným obsahem. Vložené obrázky z PDF nejsou aktuálně vloženy; zůstávají známým omezením. Výstup je validován jako HTML5.