PDF-i HTML-i konverter
Teisendage PDF-dokumendid otse brauseris puhasteks semantilisteks HTML-failideks. Kiire, turvaline ja säilitab dokumendi struktuuri.
Valige PDF-fail
või lohistage siia
Teisendage PDF-dokumendid otse brauseris puhasteks semantilisteks HTML-failideks. Kiire, turvaline ja säilitab dokumendi struktuuri.
või lohistage siia
PDF-i teisendamine HTML-iks muudab fikseeritud paigutusega dokumendi voolavaks veebileheks. Teisendamine säilitab teksti sisu, pealkirjad, lõigud ja põhilised stiilid, jättes kõrvale PDF-i täpse pikslipaigutuse, eelistades HTML-i reageerivat voogu. See on õige kauplemine veebisisuna taasavaldatavate dokumentide jaoks – artiklid, aruanded, tehniline dokumentatsioon – ja vale kauplemine dokumentidega, mille kujundus on oluline – vormid, range paigutusega arved, kujundatud turundustükid.
See tööriist kasutab PDF.js-i, et ekstraheerida PDF-ist teksti, fonte ja põhistruktuuri, seejärel kirjutab tüpograafia jaoks vastava HTML-märgistuse koos manustatud CSS-iga. Väljund on eraldiseisev .html-fail, mille saate avada mis tahes brauseris, kleepida CMS-i või kohandatud CSS-iga täiendada. Üleslaadimist ei toimu; konversioon töötab teie brauseris.
Toetatud on kaks väljundstiili. Semantiline HTML loob puhta märgistuse lõigu ja pealkirja elementidega, mis sobivad ajaveebi või dokumentatsiooni saidil sisu uuesti avaldamiseks. Visuaalne HTML säilitab rohkem PDF-i paigutust absoluutse positsioneerimise kaudu, mis sobib siis, kui dokumendi välimus on olulisem kui uuesti voolavus.
PDF-failid ei tööta veebis hästi. Mobiilibrauserid renderdavad PDF-faile kohmakalt, ekraanilugejad töötlevad neid ebajärjekindlalt, otsingumootorid roomavad need üles, kuid asetavad need samaväärsest HTML-ist madalamale, ja PDF-i manustamine veebilehele loob pigem kohmaka iframe'i vaataja kui natiivse kasutuskogemuse. HTML-i teisendamine loob sisu, mis töötab nii, nagu veebis töötab.
HTML on ka redigeeritav. Kui PDF-i sisu on HTML-vormingus, saate muuta tüpograafiat, ümberstruktureerida jaotisi, lisada interaktiivseid elemente ja integreerida sisu teiste veebilehtedega. PDF peab vastu kõigile neile toimingutele.
Loobuge PDF-failist, valige väljundstiil, genereerige.
PDF.js paljastab tekstisisu piirdekastide, fontide ja Unicode'i stringidega üksustena. Muundur sorteerib üksused Y ja seejärel X järgi, et taastada lugemisjärjekord, rühmitab sarnastel alusjoontel olevad üksused ridadeks ja rühmitab read vertikaalsete vahekauguste alusel lõikudeks.
Pealkirja tuvastamine kasutab fondi suuruse analüüsi: põhifondist oluliselt suuremad suurused muutuvad pealkirjadeks, kusjuures suurim vastendatakse h1-le, suuruselt järgmine h2-le ja nii edasi. Loendituvastus otsib ridu, mis algavad täppmärkide või numbrijadadega.
Väljund-HTML on iseseisev: doctype, pea koos manustatud CSS-iga tüpograafia jaoks, keha koos teisendatud sisuga. PDF-i tekstisisesed kujutised pole praegu manustatud; need jäävad teadaolevaks piiranguks. Väljund valideeritakse HTML5-na.