Bezplatný prevodník

PDF do HTML konvertor

Konvertujte dokumenty PDF na čisté, sémantické súbory HTML priamo vo vašom prehliadači. Rýchle, bezpečné a zachováva štruktúru dokumentu.

Vyberte súbor PDF

alebo sem presuňte myšou

Alebo

O tomto nástroji

Prevod PDF do HTML premení dokument s pevným rozložením na plynulú webovú stránku. Konverzia zachová textový obsah, nadpisy, odseky a základný štýl, pričom sa upustí od presného rozloženia v pixeloch PDF v prospech responzívneho toku HTML. Toto je správny obchod pre dokumenty, ktoré sa opätovne publikujú ako webový obsah – články, správy, technická dokumentácia – a nesprávny obchod pre dokumenty, ktorých rozloženie je nevyhnutné – formuláre, faktúry s presným umiestnením, navrhnuté marketingové kusy.

Tento nástroj používa súbor PDF.js na extrahovanie textu, písiem a základnej štruktúry z PDF a následne zapisuje zodpovedajúce značky HTML s vloženým CSS pre typografiu. Výstupom je samostatný .html súbor, ktorý môžete otvoriť v ľubovoľnom prehliadači, vložiť do CMS alebo ďalej upravovať pomocou vlastného CSS. Nedochádza k žiadnemu nahrávaniu; konverzia prebieha vo vašom prehliadači.

Podporované sú dva výstupné štýly. Sémantické HTML vytvára čisté značenie s prvkami odsekov a nadpisov, ktoré je vhodné na opätovné publikovanie obsahu na blogu alebo stránke s dokumentáciou. Vizuálny HTML zachováva väčšiu časť rozloženia PDF prostredníctvom absolútneho umiestnenia, čo je vhodné, keď na vzhľade dokumentu záleží viac ako na plynulosti.

Prečo konvertovať PDF do HTML

Súbory PDF nefungujú dobre na webe. Mobilné prehliadače vykresľujú súbory PDF nešikovne, čítačky obrazovky s nimi zaobchádzajú nekonzistentne, vyhľadávače ich prehľadávajú, ale hodnotia ich nižšie ako ekvivalentné HTML, a vloženie PDF do webovej stránky vytvára skôr neohrabaný prehliadač v rámci prvku iframe než natívny zážitok. Prevod do HTML vytvára obsah, ktorý funguje tak, ako funguje web.

HTML je tiež upraviteľné. Keď je obsah PDF vo forme HTML, môžete zmeniť typografiu, reštrukturalizovať sekcie, pridať interaktívne prvky a integrovať obsah s inými webovými stránkami. PDF odoláva všetkým týmto operáciám.

Ako používať

Pustite PDF, vyberte štýl výstupu, vygenerujte.

  1. Nahrajte súbor PDF: Presuňte súbor do oblasti nahrávania alebo ho kliknutím prehľadávajte. Podporované sú súbory do 50 MB. Súbory PDF chránené heslom nie sú podporované; najprv odstráňte ochranu.
  2. Vyberte štýl výstupu: Sémantické HTML vytvára plynulý obsah so značkami odsekov a nadpisov. Visual HTML zachováva umiestnenie PDF pomocou absolútneho CSS. Vyberte sémantiku pre opätovné publikovanie, vizuál pre dokumenty, ktoré sú dôležité pre rozloženie.
  3. Konvertovať: PDF.js extrahuje text a rozloženie. Konvertor mapuje veľkosti písma na úrovne nadpisov, identifikuje zlomy odsekov a vydáva HTML so štýlom CSS pre typografiu. Prevod typických dokumentov trvá niekoľko sekúnd.
  4. Stiahnite si HTML: Uložte súbor .html. Ak chcete zobraziť ukážku, otvorte ho v ľubovoľnom prehliadači. Ak chcete použiť obsah v CMS, skopírujte obsah vnútorného tela a prilepte ho do editora.

Bežné prípady použitia

Technické detaily

PDF.js exposes text content as items with bounding boxes, fonts, and Unicode strings. Konvertor triedi položky podľa Y a potom X, aby obnovil poradie čítania, zoskupuje položky s podobnými základnými čiarami do riadkov a zoskupuje riadky do odsekov na základe zvislých medzier.

Detekcia nadpisov využíva analýzu veľkosti písma: veľkosti výrazne väčšie ako písmo tela sa stanú nadpismi, pričom najväčší sa mapuje na h1, ďalší najväčší na h2 atď. Detekcia zoznamu hľadá riadky začínajúce znakmi odrážok alebo číselnými postupnosťami.

Výstupné HTML je samostatné: doctype, hlavička s vloženým CSS pre typografiu, telo s konvertovaným obsahom. Vložené obrázky z PDF nie sú momentálne vložené; zostávajú známym obmedzením. Výstup sa overí ako HTML5.

osvedčené postupy

Často kladené otázky

Mení prevod PDF do HTML obsah?
Obsah je zachovaný čo najpresnejšie. Niektoré funkcie špecifické pre formát však nemusia mať priame ekvivalenty, takže sa môžu vyskytnúť menšie rozdiely vo formátovaní.
Na čo sa používa formát HTML?
HTML (HyperText Markup Language) sa primárne používa pre webové stránky a webový obsah.
Existujú nejaké obmedzenia, ktoré si treba uvedomiť?
Podporované sú súbory do 50 MB. Spracovanie veľmi veľkých alebo zložitých súborov môže trvať dlhšie. Všetky konverzie prebiehajú vo vašom prehliadači, takže rýchlosť spracovania závisí od vášho zariadenia.
Sú údaje môjho dokumentu v bezpečí?
áno. Spracovanie dokumentov prebieha výlučne vo vašom prehliadači. Vaše súbory a ich obsah sa nikdy neodovzdávajú na žiadny server. Vďaka tomu je bezpečná konverzia citlivých alebo dôverných dokumentov.
Je výstup vhodný pre mobilné zariadenia?
Sémantický režim vytvára obsah, ktorý sa prispôsobí akejkoľvek šírke. Vizuálny režim využíva absolútne polohovanie, ktoré sa neprispôsobuje malým obrazovkám. Pre mobilné zariadenia použite sémantický režim.
Je moje PDF nahrané na server?
Nie. PDF.js beží vo vašom prehliadači; súbor neopustí vaše zariadenie.
Aká je maximálna veľkosť súboru?
50 MB. Analýza väčších dokumentov trvá dlhšie.
Môžem upraviť kód HTML po konverzii?
Áno – to je časť pointy. Výstupom je obyčajný HTML s vloženým CSS, ľahko upraviteľný v ľubovoľnom textovom editore alebo vložiť do CMS.