Brezplačni pretvornik

PDF v Pretvornik HTML

Pretvorite dokumente PDF v čiste, semantične datoteke HTML neposredno v brskalniku. Hitro, varno in ohranja strukturo dokumenta.

Izberite datoteko PDF

ali povlecite in spustite sem

oz

O tem orodju

Pretvorba PDF v HTML pretvori dokument s fiksno postavitvijo v tekočo spletno stran. Pretvorba ohrani vsebino besedila, naslove, odstavke in osnovni slog, medtem ko opusti natančno postavitev pikslov PDF v korist odzivnega toka HTML. To je prava trgovina za dokumente, ki se ponovno objavljajo kot spletna vsebina – članki, poročila, tehnična dokumentacija – in napačna trgovina za dokumente, katerih postavitev je bistvenega pomena – obrazci, računi s strogim pozicioniranjem, oblikovani tržni deli.

To orodje uporablja PDF.js za ekstrahiranje besedila, pisav in osnovne strukture iz PDF-ja, nato pa zapiše ustrezno oznako HTML z vdelanim CSS za tipografijo. Rezultat je samostojna datoteka .html, ki jo lahko odprete v katerem koli brskalniku, prilepite v CMS ali dodatno oblikujete s CSS po meri. Nalaganje se ne zgodi; pretvorba teče v vašem brskalniku.

Podprta sta dva izhodna sloga. Semantični HTML ustvari čisto oznako z elementi odstavkov in naslovov, ki je primerna za ponovno objavo vsebine na spletnem dnevniku ali dokumentacijskem mestu. Visual HTML ohrani več postavitve PDF-ja prek absolutnega pozicioniranja, kar je primerno, ko je videz dokumenta pomembnejši od pretočnosti.

Zakaj pretvoriti PDF v HTML

PDF-ji ne delujejo dobro v spletu. Mobilni brskalniki nerodno upodabljajo PDF-je, bralniki zaslona jih obravnavajo nedosledno, iskalniki jih preiščejo, vendar jih uvrščajo nižje od enakovrednega HTML-ja, vdelava PDF-ja v spletno stran pa ustvari okoren pregledovalnik v iframeu namesto izvorne izkušnje. Pretvorba v HTML ustvari vsebino, ki deluje tako, kot deluje splet.

HTML je tudi mogoče urejati. Ko je vsebina PDF-ja v obliki HTML, lahko spremenite tipografijo, prestrukturirate razdelke, dodate interaktivne elemente in integrirate vsebino z drugimi spletnimi stranmi. PDF se upira vsem tem operacijam.

Kako uporabljati

Spustite PDF, izberite slog izpisa, ustvarite.

  1. Naložite svoj PDF: Povlecite datoteko v območje za nalaganje ali kliknite za brskanje. Podprte so datoteke do 50 MB. PDF-ji, zaščiteni z geslom, niso podprti; najprej odstranite zaščito.
  2. Izberite slog izpisa: Semantični HTML ustvari tekočo vsebino z oznakami odstavkov in naslovov. Visual HTML ohranja položaj PDF-ja prek absolutnega CSS. Izberite semantiko za ponovno objavo, vizualno za dokumente, ki so pomembni za postavitev.
  3. Pretvori: PDF.js izvleče besedilo in postavitev. Pretvornik preslika velikosti pisave v ravni naslovov, prepozna prelome odstavkov in odda HTML s slogom CSS za tipografijo. Pretvorba traja nekaj sekund za tipične dokumente.
  4. Prenesite HTML: Shranite datoteko .html. Odprite ga v katerem koli brskalniku za predogled. Če želite uporabiti vsebino v CMS, kopirajte vsebino notranjega telesa in jo prilepite v urejevalnik.

Pogosti primeri uporabe

Tehnične podrobnosti

PDF.js izpostavlja besedilno vsebino kot elemente z omejevalnimi okvirji, pisavami in nizi Unicode. Pretvornik razvrsti elemente po Y in nato X, da obnovi vrstni red branja, združi elemente na podobnih osnovnih črtah v vrstice in združi vrstice v odstavke na podlagi navpičnega razmika.

Zaznavanje naslovov uporablja analizo velikosti pisave: velikosti, ki so bistveno večje od pisave telesa, postanejo naslovi, pri čemer je največja preslikana v h1, naslednja največja v h2 itd. Zaznavanje seznama išče vrstice, ki se začnejo z znaki ali številskimi zaporedji.

Izhodni HTML je samostojen: doctype, glava z vdelanim CSS za tipografijo, telo s pretvorjeno vsebino. Vdelane slike iz PDF trenutno niso vdelane; ostajajo znana omejitev. Izhod se potrdi kot HTML5.

Najboljše prakse

Pogosta vprašanja

Ali pretvorba PDF v HTML spremeni vsebino?
Vsebina je ohranjena čim bolj natančno. Vendar pa nekatere funkcije, specifične za obliko, morda nimajo neposrednih ustreznikov, zato lahko pride do manjših razlik v oblikovanju.
Za kaj se uporablja format HTML?
HTML (HyperText Markup Language) se uporablja predvsem za spletne strani in spletno vsebino.
Ali obstajajo kakšne omejitve, na katere se morate zavedati?
Podprte so datoteke do 50 MB. Obdelava zelo velikih ali zapletenih datotek lahko traja dlje. Vse pretvorbe se zgodijo v vašem brskalniku, zato je hitrost obdelave odvisna od vaše naprave.
Ali so podatki mojih dokumentov varni?
ja Obdelava dokumentov poteka v celoti v vašem brskalniku. Vaše datoteke in njihova vsebina se nikoli ne naložijo na noben strežnik. Tako je pretvorba občutljivih ali zaupnih dokumentov varna.
Je izhod prijazen do mobilnih naprav?
Semantični način ustvari vsebino, ki teče poljubni širini. Vizualni način uporablja absolutno pozicioniranje, ki se ne prilagaja majhnim zaslonom. Za mobilne naprave uporabite semantični način.
Ali je moj PDF naložen na strežnik?
Ne. PDF.js deluje v vašem brskalniku; datoteka ne zapusti vaše naprave.
Kakšna je največja velikost datoteke?
50 MB. Razčlenjevanje večjih dokumentov traja dlje.
Ali lahko uredim HTML po pretvorbi?
Da - to je del bistva. Izhod je navaden HTML z vdelanim CSS, ki ga je enostavno urejati v katerem koli urejevalniku besedila ali prilepiti v CMS.