PDF v Pretvornik HTML
Pretvorite dokumente PDF v čiste, semantične datoteke HTML neposredno v brskalniku. Hitro, varno in ohranja strukturo dokumenta.
Izberite datoteko PDF
ali povlecite in spustite sem
Pretvorite dokumente PDF v čiste, semantične datoteke HTML neposredno v brskalniku. Hitro, varno in ohranja strukturo dokumenta.
ali povlecite in spustite sem
Pretvorba PDF v HTML pretvori dokument s fiksno postavitvijo v tekočo spletno stran. Pretvorba ohrani vsebino besedila, naslove, odstavke in osnovni slog, medtem ko opusti natančno postavitev pikslov PDF v korist odzivnega toka HTML. To je prava trgovina za dokumente, ki se ponovno objavljajo kot spletna vsebina – članki, poročila, tehnična dokumentacija – in napačna trgovina za dokumente, katerih postavitev je bistvenega pomena – obrazci, računi s strogim pozicioniranjem, oblikovani tržni deli.
To orodje uporablja PDF.js za ekstrahiranje besedila, pisav in osnovne strukture iz PDF-ja, nato pa zapiše ustrezno oznako HTML z vdelanim CSS za tipografijo. Rezultat je samostojna datoteka .html, ki jo lahko odprete v katerem koli brskalniku, prilepite v CMS ali dodatno oblikujete s CSS po meri. Nalaganje se ne zgodi; pretvorba teče v vašem brskalniku.
Podprta sta dva izhodna sloga. Semantični HTML ustvari čisto oznako z elementi odstavkov in naslovov, ki je primerna za ponovno objavo vsebine na spletnem dnevniku ali dokumentacijskem mestu. Visual HTML ohrani več postavitve PDF-ja prek absolutnega pozicioniranja, kar je primerno, ko je videz dokumenta pomembnejši od pretočnosti.
PDF-ji ne delujejo dobro v spletu. Mobilni brskalniki nerodno upodabljajo PDF-je, bralniki zaslona jih obravnavajo nedosledno, iskalniki jih preiščejo, vendar jih uvrščajo nižje od enakovrednega HTML-ja, vdelava PDF-ja v spletno stran pa ustvari okoren pregledovalnik v iframeu namesto izvorne izkušnje. Pretvorba v HTML ustvari vsebino, ki deluje tako, kot deluje splet.
HTML je tudi mogoče urejati. Ko je vsebina PDF-ja v obliki HTML, lahko spremenite tipografijo, prestrukturirate razdelke, dodate interaktivne elemente in integrirate vsebino z drugimi spletnimi stranmi. PDF se upira vsem tem operacijam.
Spustite PDF, izberite slog izpisa, ustvarite.
PDF.js izpostavlja besedilno vsebino kot elemente z omejevalnimi okvirji, pisavami in nizi Unicode. Pretvornik razvrsti elemente po Y in nato X, da obnovi vrstni red branja, združi elemente na podobnih osnovnih črtah v vrstice in združi vrstice v odstavke na podlagi navpičnega razmika.
Zaznavanje naslovov uporablja analizo velikosti pisave: velikosti, ki so bistveno večje od pisave telesa, postanejo naslovi, pri čemer je največja preslikana v h1, naslednja največja v h2 itd. Zaznavanje seznama išče vrstice, ki se začnejo z znaki ali številskimi zaporedji.
Izhodni HTML je samostojen: doctype, glava z vdelanim CSS za tipografijo, telo s pretvorjeno vsebino. Vdelane slike iz PDF trenutno niso vdelane; ostajajo znana omejitev. Izhod se potrdi kot HTML5.