PDF uz HTML pārveidotājs
Pārveidojiet PDF dokumentus tīros, semantiskos HTML failos tieši savā pārlūkprogrammā. Ātra, droša un saglabā dokumentu struktūru.
Izvēlieties PDF failu
vai velciet un nometiet šeit
Pārveidojiet PDF dokumentus tīros, semantiskos HTML failos tieši savā pārlūkprogrammā. Ātra, droša un saglabā dokumentu struktūru.
vai velciet un nometiet šeit
Pārvēršot PDF par HTML, fiksēta izkārtojuma dokuments tiek pārveidots par plūstošu tīmekļa lapu. Konvertēšana saglabā teksta saturu, virsrakstus, rindkopas un pamata stilu, vienlaikus atsakoties no PDF precīzā pikseļu izkārtojuma par labu HTML adaptīvajai plūsmai. Šī ir pareizā tirdzniecība dokumentiem, kas tiek pārpublicēti kā tīmekļa saturs — raksti, atskaites, tehniskā dokumentācija — un nepareiza tirdzniecība ar dokumentiem, kuru izkārtojumam ir būtiska nozīme — veidlapām, rēķiniem ar stingru pozicionēšanu, izstrādātiem mārketinga elementiem.
Šis rīks izmanto PDF.js, lai no PDF izvilktu tekstu, fontus un pamatstruktūru, un pēc tam raksta atbilstošu HTML marķējumu ar iegultu CSS tipogrāfijai. Izvade ir atsevišķs .html fails, ko varat atvērt jebkurā pārlūkprogrammā, ielīmēt SPS vai veidot citā stilā, izmantojot pielāgotu CSS. Augšupielāde nenotiek; reklāmguvums tiek veikts jūsu pārlūkprogrammā.
Tiek atbalstīti divi izvades stili. Semantiskais HTML veido tīru marķējumu ar rindkopas un virsraksta elementiem, kas ir piemēroti satura pārpublicēšanai emuārā vai dokumentācijas vietnē. Vizuālais HTML saglabā vairāk PDF izkārtojuma, izmantojot absolūto pozicionēšanu, kas ir piemērots gadījumos, kad dokumenta izskats ir svarīgāks par plūstamību.
PDF faili nedarbojas labi tīmeklī. Mobilās pārlūkprogrammas neveikli atveido PDF failus, ekrāna lasītāji tos apstrādā nekonsekventi, meklētājprogrammas tos pārmeklē, bet ierindo tos zemāk par līdzvērtīgu HTML, un PDF faila iegulšana tīmekļa lapā rada neērtu iframe skatītāju, nevis vietējo pieredzi. Pārveidojot uz HTML, tiek izveidots saturs, kas darbojas tā, kā darbojas tīmeklis.
HTML ir arī rediģējams. Kad PDF saturs ir HTML formātā, varat mainīt tipogrāfiju, pārstrukturēt sadaļas, pievienot interaktīvus elementus un integrēt saturu ar citām tīmekļa lapām. PDF iztur visas šīs darbības.
Nometiet PDF, izvēlieties izvades stilu, ģenerējiet.
PDF.js parāda teksta saturu kā vienumus ar ierobežojošiem lodziņiem, fontiem un unikoda virknēm. Pārveidotājs sakārto vienumus pēc Y, pēc tam pēc X, lai atgūtu lasīšanas secību, grupē vienumus līdzīgās bāzes līnijās rindās un grupē rindas rindkopās, pamatojoties uz vertikālajām atstarpēm.
Virsrakstu noteikšana izmanto fonta lieluma analīzi: izmēri, kas ir ievērojami lielāki par pamatteksta fontu, kļūst par virsrakstiem, kur lielākais tiek kartēts uz h1, nākamais lielākais uz h2 un tā tālāk. Saraksta noteikšana meklē rindiņas, kas sākas ar aizzīmju rakstzīmēm vai ciparu secībām.
Izvades HTML ir autonoms: doctype, galva ar iegultu CSS tipogrāfijai, pamatteksts ar konvertēto saturu. Iekļautie attēli no PDF pašlaik nav iegulti; tie joprojām ir zināms ierobežojums. Izvade tiek apstiprināta kā HTML5.