PDF do HTML konvertor
Konvertujte dokumenty PDF na čisté, sémantické súbory HTML priamo vo vašom prehliadači. Rýchle, bezpečné a zachováva štruktúru dokumentu.
Vyberte súbor PDF
alebo sem presuňte myšou
Konvertujte dokumenty PDF na čisté, sémantické súbory HTML priamo vo vašom prehliadači. Rýchle, bezpečné a zachováva štruktúru dokumentu.
alebo sem presuňte myšou
Prevod PDF do HTML premení dokument s pevným rozložením na plynulú webovú stránku. Konverzia zachová textový obsah, nadpisy, odseky a základný štýl, pričom sa upustí od presného rozloženia v pixeloch PDF v prospech responzívneho toku HTML. Toto je správny obchod pre dokumenty, ktoré sa opätovne publikujú ako webový obsah – články, správy, technická dokumentácia – a nesprávny obchod pre dokumenty, ktorých rozloženie je nevyhnutné – formuláre, faktúry s presným umiestnením, navrhnuté marketingové kusy.
Tento nástroj používa súbor PDF.js na extrahovanie textu, písiem a základnej štruktúry z PDF a následne zapisuje zodpovedajúce značky HTML s vloženým CSS pre typografiu. Výstupom je samostatný .html súbor, ktorý môžete otvoriť v ľubovoľnom prehliadači, vložiť do CMS alebo ďalej upravovať pomocou vlastného CSS. Nedochádza k žiadnemu nahrávaniu; konverzia prebieha vo vašom prehliadači.
Podporované sú dva výstupné štýly. Sémantické HTML vytvára čisté značenie s prvkami odsekov a nadpisov, ktoré je vhodné na opätovné publikovanie obsahu na blogu alebo stránke s dokumentáciou. Vizuálny HTML zachováva väčšiu časť rozloženia PDF prostredníctvom absolútneho umiestnenia, čo je vhodné, keď na vzhľade dokumentu záleží viac ako na plynulosti.
Súbory PDF nefungujú dobre na webe. Mobilné prehliadače vykresľujú súbory PDF nešikovne, čítačky obrazovky s nimi zaobchádzajú nekonzistentne, vyhľadávače ich prehľadávajú, ale hodnotia ich nižšie ako ekvivalentné HTML, a vloženie PDF do webovej stránky vytvára skôr neohrabaný prehliadač v rámci prvku iframe než natívny zážitok. Prevod do HTML vytvára obsah, ktorý funguje tak, ako funguje web.
HTML je tiež upraviteľné. Keď je obsah PDF vo forme HTML, môžete zmeniť typografiu, reštrukturalizovať sekcie, pridať interaktívne prvky a integrovať obsah s inými webovými stránkami. PDF odoláva všetkým týmto operáciám.
Pustite PDF, vyberte štýl výstupu, vygenerujte.
PDF.js exposes text content as items with bounding boxes, fonts, and Unicode strings. Konvertor triedi položky podľa Y a potom X, aby obnovil poradie čítania, zoskupuje položky s podobnými základnými čiarami do riadkov a zoskupuje riadky do odsekov na základe zvislých medzier.
Detekcia nadpisov využíva analýzu veľkosti písma: veľkosti výrazne väčšie ako písmo tela sa stanú nadpismi, pričom najväčší sa mapuje na h1, ďalší najväčší na h2 atď. Detekcia zoznamu hľadá riadky začínajúce znakmi odrážok alebo číselnými postupnosťami.
Výstupné HTML je samostatné: doctype, hlavička s vloženým CSS pre typografiu, telo s konvertovaným obsahom. Vložené obrázky z PDF nie sú momentálne vložené; zostávajú známym obmedzením. Výstup sa overí ako HTML5.