Zdarma převodník

PDF do Převaděč HTML

Převeďte dokumenty PDF na čisté, sémantické soubory HTML přímo ve vašem prohlížeči. Rychlé, bezpečné a zachovává strukturu dokumentu.

Vyberte soubor PDF

nebo sem přetáhněte

Nebo

O tomto nástroji

Převod PDF do HTML přemění dokument s pevným rozvržením na plynulou webovou stránku. Převod zachová textový obsah, nadpisy, odstavce a základní styly, přičemž se opustí přesné rozložení pixelů PDF ve prospěch responzivního toku HTML. Toto je správný obchod pro dokumenty, které jsou znovu publikovány jako webový obsah – články, zprávy, technická dokumentace – a špatný obchod pro dokumenty, jejichž vzhled je zásadní – formuláře, faktury s přesným umístěním, navržené marketingové kusy.

Tento nástroj používá soubor PDF.js k extrahování textu, písem a základní struktury z PDF a poté zapíše odpovídající označení HTML s vloženým CSS pro typografii. Výstupem je samostatný .html soubor, který můžete otevřít v libovolném prohlížeči, vložit do CMS nebo dále upravit pomocí vlastního CSS. Nedojde k nahrání; převod probíhá ve vašem prohlížeči.

Jsou podporovány dva výstupní styly. Sémantické HTML vytváří čisté značení s prvky odstavců a nadpisů, které je vhodné pro opětovné publikování obsahu na blogu nebo webu s dokumentací. Vizuální HTML zachovává větší část rozvržení PDF prostřednictvím absolutního umístění, což je vhodné, když na vzhledu dokumentu záleží více než na možnosti změny toku.

Proč převádět PDF do HTML

Soubory PDF nefungují dobře na webu. Mobilní prohlížeče vykreslují PDF nešikovně, čtečky obrazovky s nimi zacházejí nekonzistentně, vyhledávače je procházejí, ale hodnotí je níže než ekvivalentní HTML, a vložení PDF do webové stránky vytváří spíše neohrabaný prohlížeč v rámci prvku iframe než nativní zážitek. Převod do HTML vytváří obsah, který funguje tak, jak funguje web.

HTML je také editovatelné. Jakmile je obsah PDF ve formě HTML, můžete změnit typografii, restrukturalizovat sekce, přidat interaktivní prvky a integrovat obsah s jinými webovými stránkami. PDF odolává všem těmto operacím.

Jak používat

Pusťte PDF, vyberte styl výstupu, vygenerujte.

  1. Nahrajte soubor PDF: Přetáhněte soubor do oblasti pro nahrávání nebo kliknutím procházejte. Podporovány jsou soubory do 50 MB. Soubory PDF chráněné heslem nejsou podporovány; nejprve odstraňte ochranu.
  2. Vyberte styl výstupu: Sémantické HTML vytváří plynulý obsah se značkami odstavců a nadpisů. Visual HTML zachovává umístění PDF pomocí absolutních CSS. Vyberte sémantiku pro opětovné publikování, vizuální pro dokumenty důležité pro rozvržení.
  3. Převést: PDF.js extrahuje text a rozvržení. Převaděč mapuje velikosti písma na úrovně nadpisů, identifikuje konce odstavců a generuje HTML se styly CSS pro typografii. Konverze u typických dokumentů trvá několik sekund.
  4. Stáhněte si HTML: Uložte soubor .html. Chcete-li zobrazit náhled, otevřete jej v libovolném prohlížeči. Chcete-li použít obsah v CMS, zkopírujte vnitřní obsah těla a vložte jej do editoru.

Běžné případy použití

Technické detaily

PDF.js zpřístupňuje textový obsah jako položky s ohraničujícími rámečky, písmy a řetězci Unicode. Převaděč třídí položky podle Y a poté podle X, aby obnovil pořadí čtení, seskupuje položky na podobných účařích do řádků a seskupuje řádky do odstavců na základě vertikálních mezer.

Detekce nadpisů využívá analýzu velikosti písma: velikosti výrazně větší než hlavní písmo se stanou nadpisy, přičemž největší je mapován na h1, další největší na h2 atd. Detekce seznamu hledá řádky začínající znaky odrážek nebo číselnými sekvencemi.

Výstupní HTML je samostatné: doctype, hlava s vloženým CSS pro typografii, tělo s převedeným obsahem. Vložené obrázky z PDF nejsou aktuálně vloženy; zůstávají známým omezením. Výstup je validován jako HTML5.

Nejlepší postupy

Často kladené dotazy

Změní převod PDF do HTML obsah?
Obsah je zachován co nejpřesněji. Některé funkce specifické pro formát však nemusí mít přímé ekvivalenty, takže mohou nastat drobné rozdíly ve formátování.
K čemu se používá formát HTML?
HTML (HyperText Markup Language) se primárně používá pro webové stránky a webový obsah.
Existují nějaká omezení, která je třeba si uvědomit?
Podporovány jsou soubory do 50 MB. Zpracování velmi velkých nebo složitých souborů může trvat déle. Veškerá konverze probíhá ve vašem prohlížeči, takže rychlost zpracování závisí na vašem zařízení.
Jsou data mých dokumentů v bezpečí?
Ano. Zpracování dokumentů probíhá výhradně ve vašem prohlížeči. Vaše soubory a jejich obsah nejsou nikdy nahrány na žádný server. Díky tomu lze bezpečně převádět citlivé nebo důvěrné dokumenty.
Je výstup vhodný pro mobilní zařízení?
Sémantický režim vytváří obsah, který se přizpůsobí libovolné šířce. Vizuální režim využívá absolutní umístění, které se nepřizpůsobuje malým obrazovkám. Pro mobilní zařízení použijte sémantický režim.
Je moje PDF nahráno na server?
Ne. PDF.js běží ve vašem prohlížeči; soubor neopustí vaše zařízení.
Jaká je maximální velikost souboru?
50 MB. Analýza větších dokumentů trvá déle.
Mohu upravit kód HTML po převodu?
Ano – to je část věci. Výstupem je prosté HTML s vloženým CSS, které lze snadno upravit v libovolném textovém editoru nebo vložit do CMS.