Nemokamas konverteris

PDF į HTML keitiklis

Konvertuokite PDF dokumentus į švarius, semantinius HTML failus tiesiai naršyklėje. Greitas, saugus ir išsaugantis dokumentų struktūrą.

Pasirinkite PDF failą

arba vilkite ir numeskite čia

Arba

Apie šį įrankį

Konvertuojant PDF į HTML, fiksuoto išdėstymo dokumentas paverčiamas sklandžiu tinklalapiu. Konvertuojant išsaugomas teksto turinys, antraštės, pastraipos ir pagrindinis stilius, kartu atsisakoma tikslaus PDF pikselių išdėstymo ir pasirenkamas HTML reaguojantis srautas. Tai tinkama prekyba dokumentais, perpublikuojamais kaip žiniatinklio turinys – straipsniais, ataskaitomis, technine dokumentacija – ir neteisinga prekyba dokumentais, kurių išdėstymas yra labai svarbus – formomis, sąskaitomis faktūromis su griežta padėtimi, suplanuotais rinkodaros elementais.

Šis įrankis naudoja PDF.js tekstui, šriftams ir pagrindinei struktūrai iš PDF išgauti, tada rašo atitinkamą HTML žymėjimą su įterptu CSS tipografijai. Išvestis yra atskiras .html failas, kurį galite atidaryti bet kurioje naršyklėje, įklijuoti į TVS arba pakeisti stilių naudodami tinkintą CSS. Įkėlimas nevyksta; konversija vykdoma jūsų naršyklėje.

Palaikomi du išvesties stiliai. Semantinis HTML sukuria švarų žymėjimą su pastraipos ir antraštės elementais, tinkamus turiniui pakartotinai paskelbti tinklaraštyje arba dokumentacijos svetainėje. Vizualinis HTML išsaugo daugiau PDF maketo naudodamas absoliučią padėtį, tinkamas, kai dokumento išvaizda yra svarbesnė už pakartotinį srautą.

Kodėl konvertuoti PDF į HTML

PDF failai neveikia gerai žiniatinklyje. Mobiliosios naršyklės nepatogiai atvaizduoja PDF failus, ekrano skaitytuvai juos tvarko nenuosekliai, paieškos varikliai juos tikrina, bet reitinguoja žemesnę nei lygiavertę HTML, o PDF įterpimas į tinklalapį sukuria gremėzdišką peržiūros priemonę „iframe“, o ne savąją. Konvertuojant į HTML, gaunamas turinys, veikiantis taip, kaip veikia žiniatinklis.

HTML taip pat galima redaguoti. Kai PDF turinys yra HTML formatu, galite pakeisti tipografiją, pertvarkyti skyrius, pridėti interaktyvių elementų ir integruoti turinį su kitais tinklalapiais. PDF atlaiko visas šias operacijas.

Kaip naudoti

Nuleiskite PDF, pasirinkite išvesties stilių, generuokite.

  1. Įkelkite savo PDF: Vilkite failą į įkėlimo sritį arba spustelėkite, kad naršytumėte. Palaikomi failai iki 50 MB. Slaptažodžiu apsaugoti PDF failai nepalaikomi; pirmiausia pašalinkite apsaugą.
  2. Pasirinkite išvesties stilių: Semantinis HTML sukuria sklandų turinį su pastraipų ir antraščių žymomis. Vaizdinis HTML išsaugo PDF vietą naudodamas absoliučią CSS. Pasirinkite semantiką, kad publikuotumėte iš naujo, o vizualinę – svarbių maketavimo dokumentų.
  3. Konvertuoti: PDF.js ištraukia tekstą ir išdėstymą. Keitiklis susieja šrifto dydžius su antraštės lygiais, nustato pastraipų lūžius ir spausdina HTML su CSS stiliumi. Įprastų dokumentų konvertavimas trunka kelias sekundes.
  4. Atsisiųskite HTML: Išsaugokite .html failą. Norėdami peržiūrėti, atidarykite jį bet kurioje naršyklėje. Norėdami naudoti turinį TVS, nukopijuokite vidinį turinį ir įklijuokite į redaktorių.

Bendro naudojimo atvejai

Techninės detalės

PDF.js atskleidžia teksto turinį kaip elementus su ribojančiais langeliais, šriftais ir unikodo eilutėmis. Keitiklis rūšiuoja elementus pagal Y, tada X, kad atkurtų skaitymo tvarką, sugrupuoja elementus, esančius panašiose pradinėse linijose, į eilutes ir sugrupuoja eilutes į pastraipas pagal vertikalius tarpus.

Antraštės aptikimas naudoja šrifto dydžio analizę: dydžiai, žymiai didesni už pagrindinį šriftą, tampa antraštėmis, o didžiausias susietas su h1, kitas pagal dydį - su h2 ir pan. Sąrašo aptikimas ieško eilučių, prasidedančių ženkleliais arba skaitinėmis sekomis.

Išvesties HTML yra savarankiškas: doctype, galvutė su įterptu CSS tipografijai, turinys su konvertuotu turiniu. Įterptieji vaizdai iš PDF šiuo metu nėra įterpti; jie išlieka žinomu apribojimu. Išvestis patvirtinama kaip HTML5.

Geriausia praktika

Dažnai užduodami klausimai

Ar PDF konvertavimas į HTML pakeičia turinį?
Turinys išsaugomas kuo tiksliau. Tačiau kai kurios su formatu susijusios funkcijos gali neturėti tiesioginių atitikmenų, todėl gali atsirasti nedidelių formatavimo skirtumų.
Kam naudojamas HTML formatas?
HTML (HyperText Markup Language) pirmiausia naudojamas tinklalapiams ir žiniatinklio turiniui.
Ar yra kokių nors apribojimų, kuriuos reikia žinoti?
Palaikomi failai iki 50 MB. Labai didelių ar sudėtingų failų apdorojimas gali užtrukti ilgiau. Visa konversija vyksta jūsų naršyklėje, todėl apdorojimo greitis priklauso nuo jūsų įrenginio.
Ar mano dokumento duomenys saugūs?
Taip. Dokumentų apdorojimas vykdomas tik jūsų naršyklėje. Jūsų failai ir jų turinys niekada neįkeliami į jokį serverį. Tai leidžia saugiai konvertuoti neskelbtinus ar konfidencialius dokumentus.
Ar išvestis pritaikyta mobiliesiems telefonams?
Semantinis režimas sukuria turinį, kuris patenka į bet kokį plotį. Vaizdinis režimas naudoja absoliučią padėties nustatymą, nepritaikantį prie mažų ekranų. Mobiliesiems naudokite semantinį režimą.
Ar mano PDF įkeltas į serverį?
Ne. PDF.js veikia jūsų naršyklėje; failas nepalieka jūsų įrenginio.
Koks yra maksimalus failo dydis?
50 MB. Didesnių dokumentų analizė užtrunka ilgiau.
Ar galiu redaguoti HTML po konvertavimo?
Taip – tai dalis esmės. Išvestis yra paprastas HTML su įterptu CSS, kurį lengva redaguoti bet kuriame teksto rengyklėje arba įklijuoti į TVS.