Bezmaksas pārveidotājs

PDF uz HTML pārveidotājs

Pārveidojiet PDF dokumentus tīros, semantiskos HTML failos tieši savā pārlūkprogrammā. Ātra, droša un saglabā dokumentu struktūru.

Izvēlieties PDF failu

vai velciet un nometiet šeit

Or

Par šo rīku

Pārvēršot PDF par HTML, fiksēta izkārtojuma dokuments tiek pārveidots par plūstošu tīmekļa lapu. Konvertēšana saglabā teksta saturu, virsrakstus, rindkopas un pamata stilu, vienlaikus atsakoties no PDF precīzā pikseļu izkārtojuma par labu HTML adaptīvajai plūsmai. Šī ir pareizā tirdzniecība dokumentiem, kas tiek pārpublicēti kā tīmekļa saturs — raksti, atskaites, tehniskā dokumentācija — un nepareiza tirdzniecība ar dokumentiem, kuru izkārtojumam ir būtiska nozīme — veidlapām, rēķiniem ar stingru pozicionēšanu, izstrādātiem mārketinga elementiem.

Šis rīks izmanto PDF.js, lai no PDF izvilktu tekstu, fontus un pamatstruktūru, un pēc tam raksta atbilstošu HTML marķējumu ar iegultu CSS tipogrāfijai. Izvade ir atsevišķs .html fails, ko varat atvērt jebkurā pārlūkprogrammā, ielīmēt SPS vai veidot citā stilā, izmantojot pielāgotu CSS. Augšupielāde nenotiek; reklāmguvums tiek veikts jūsu pārlūkprogrammā.

Tiek atbalstīti divi izvades stili. Semantiskais HTML veido tīru marķējumu ar rindkopas un virsraksta elementiem, kas ir piemēroti satura pārpublicēšanai emuārā vai dokumentācijas vietnē. Vizuālais HTML saglabā vairāk PDF izkārtojuma, izmantojot absolūto pozicionēšanu, kas ir piemērots gadījumos, kad dokumenta izskats ir svarīgāks par plūstamību.

Kāpēc konvertēt PDF uz HTML

PDF faili nedarbojas labi tīmeklī. Mobilās pārlūkprogrammas neveikli atveido PDF failus, ekrāna lasītāji tos apstrādā nekonsekventi, meklētājprogrammas tos pārmeklē, bet ierindo tos zemāk par līdzvērtīgu HTML, un PDF faila iegulšana tīmekļa lapā rada neērtu iframe skatītāju, nevis vietējo pieredzi. Pārveidojot uz HTML, tiek izveidots saturs, kas darbojas tā, kā darbojas tīmeklis.

HTML ir arī rediģējams. Kad PDF saturs ir HTML formātā, varat mainīt tipogrāfiju, pārstrukturēt sadaļas, pievienot interaktīvus elementus un integrēt saturu ar citām tīmekļa lapām. PDF iztur visas šīs darbības.

Kā lietot

Nometiet PDF, izvēlieties izvades stilu, ģenerējiet.

  1. Augšupielādējiet savu PDF failu: Velciet failu uz augšupielādes apgabalu vai noklikšķiniet, lai pārlūkotu. Tiek atbalstīti faili līdz 50 MB. Ar paroli aizsargāti PDF faili netiek atbalstīti; vispirms noņemiet aizsardzību.
  2. Izvēlieties izvades stilu: Semantiskais HTML veido plūstošu saturu ar rindkopu un virsrakstu tagiem. Vizuālais HTML saglabā PDF pozicionēšanu, izmantojot absolūto CSS. Izvēlieties semantisku pārpublicēšanai, vizuālo izkārtojumam kritiskiem dokumentiem.
  3. Konvertēt: PDF.js izvilk tekstu un izkārtojumu. Pārveidotājs kartē fontu izmērus virsrakstu līmeņos, identificē rindkopu pārtraukumus un izstaro HTML ar CSS stilu tipogrāfijai. Tipisku dokumentu konvertēšana aizņem sekundes.
  4. Lejupielādējiet HTML: Saglabājiet .html failu. Lai priekšskatītu, atveriet to jebkurā pārlūkprogrammā. Lai izmantotu saturu SPS, kopējiet iekšējo pamattekstu un ielīmējiet to redaktorā.

Bieži lietojami gadījumi

Tehniskās detaļas

PDF.js parāda teksta saturu kā vienumus ar ierobežojošiem lodziņiem, fontiem un unikoda virknēm. Pārveidotājs sakārto vienumus pēc Y, pēc tam pēc X, lai atgūtu lasīšanas secību, grupē vienumus līdzīgās bāzes līnijās rindās un grupē rindas rindkopās, pamatojoties uz vertikālajām atstarpēm.

Virsrakstu noteikšana izmanto fonta lieluma analīzi: izmēri, kas ir ievērojami lielāki par pamatteksta fontu, kļūst par virsrakstiem, kur lielākais tiek kartēts uz h1, nākamais lielākais uz h2 un tā tālāk. Saraksta noteikšana meklē rindiņas, kas sākas ar aizzīmju rakstzīmēm vai ciparu secībām.

Izvades HTML ir autonoms: doctype, galva ar iegultu CSS tipogrāfijai, pamatteksts ar konvertēto saturu. Iekļautie attēli no PDF pašlaik nav iegulti; tie joprojām ir zināms ierobežojums. Izvade tiek apstiprināta kā HTML5.

Labākā prakse

Bieži uzdotie jautājumi

Vai PDF konvertēšana uz HTML maina saturu?
Saturs tiek saglabāts pēc iespējas precīzāk. Tomēr dažiem formātam raksturīgajiem līdzekļiem var nebūt tiešu ekvivalentu, tāpēc var rasties nelielas formatēšanas atšķirības.
Kam tiek izmantots HTML formāts?
HTML (hiperteksta iezīmēšanas valoda) galvenokārt tiek izmantota tīmekļa lapām un tīmekļa saturam.
Vai ir kādi ierobežojumi, kas jāzina?
Tiek atbalstīti faili līdz 50 MB. Ļoti lielu vai sarežģītu failu apstrāde var aizņemt ilgāku laiku. Visas konversijas notiek jūsu pārlūkprogrammā, tāpēc apstrādes ātrums ir atkarīgs no jūsu ierīces.
Vai mani dokumenta dati ir droši?
Jā. Dokumentu apstrāde pilnībā darbojas jūsu pārlūkprogrammā. Jūsu faili un to saturs nekad netiek augšupielādēti nevienā serverī. Tādējādi ir droši konvertēt sensitīvus vai konfidenciālus dokumentus.
Vai izvade ir piemērota mobilajām ierīcēm?
Semantiskais režīms rada saturu, kas plūst, lai tas atbilstu jebkuram platumam. Vizuālais režīms izmanto absolūtu pozicionēšanu, kas nepielāgojas maziem ekrāniem. Mobilajām ierīcēm izmantojiet semantisko režīmu.
Vai mans PDF ir augšupielādēts serverī?
Nē. PDF.js darbojas jūsu pārlūkprogrammā; fails neatstāj jūsu ierīci.
Kāds ir maksimālais faila lielums?
50 MB. Lielāku dokumentu parsēšana aizņem ilgāku laiku.
Vai es varu rediģēt HTML pēc konvertēšanas?
Jā - tā ir daļa no lietas. Izvade ir vienkāršs HTML ar iegultu CSS, ko ir viegli rediģēt jebkurā teksta redaktorā vai ielīmēt CMS.