Besplatni pretvarač

PDF u HTML pretvarač

Pretvorite PDF dokumente u čiste, semantičke HTML datoteke izravno u vašem pregledniku. Brzo, sigurno i čuva strukturu dokumenta.

Odaberite PDF datoteku

ili povucite i ispustite ovdje

Ili

O ovom alatu

Pretvaranje PDF-a u HTML pretvara dokument s fiksnim izgledom u pokretnu web stranicu. Konverzija čuva tekstualni sadržaj, naslove, odlomke i osnovni stil dok napušta točan raspored piksela u PDF-u u korist HTML-a koji odgovara tijeku. Ovo je prava trgovina za dokumente koji se ponovno objavljuju kao web sadržaj — članci, izvješća, tehnička dokumentacija — i pogrešna trgovina za dokumente čiji je izgled bitan — obrasci, fakture sa strogim pozicioniranjem, dizajnirani marketinški dijelovi.

Ovaj alat koristi PDF.js za izdvajanje teksta, fontova i osnovne strukture iz PDF-a, zatim piše odgovarajuću HTML oznaku s ugrađenim CSS-om za tipografiju. Izlaz je samostalna .html datoteka koju možete otvoriti u bilo kojem pregledniku, zalijepiti u CMS ili dodatno stilizirati prilagođenim CSS-om. Nema prijenosa; konverzija se izvodi u vašem pregledniku.

Podržana su dva izlazna stila. Semantički HTML proizvodi čisto označavanje s elementima odlomaka i naslova, prikladno za ponovno objavljivanje sadržaja na blogu ili dokumentacijskom mjestu. Visual HTML čuva više izgleda PDF-a putem apsolutnog pozicioniranja, prikladnog kada je izgled dokumenta važniji od mogućnosti ponovnog protoka.

Zašto pretvoriti PDF u HTML

PDF-ovi ne rade dobro na webu. Mobilni preglednici nespretno prikazuju PDF-ove, čitači zaslona nedosljedno ih obrađuju, tražilice ih indeksiraju, ali ih rangiraju niže od ekvivalentnog HTML-a, a ugrađivanje PDF-a u web-stranicu stvara nezgrapni in-iframe preglednik umjesto izvornog iskustva. Pretvaranjem u HTML stvara se sadržaj koji funkcionira onako kako web funkcionira.

HTML je također moguće uređivati. Nakon što je sadržaj PDF-a u HTML obliku, možete promijeniti tipografiju, restrukturirati odjeljke, dodati interaktivne elemente i integrirati sadržaj s drugim web stranicama. PDF se opire svim tim operacijama.

Kako koristiti

Ispustite PDF, odaberite stil ispisa, generirajte.

  1. Učitajte svoj PDF: Povucite datoteku u područje za učitavanje ili kliknite za pregledavanje. Podržane su datoteke do 50 MB. PDF-ovi zaštićeni lozinkom nisu podržani; prvo uklonite zaštitu.
  2. Odaberite stil ispisa: Semantički HTML stvara tekući sadržaj s oznakama odlomaka i naslova. Visual HTML čuva pozicioniranje PDF-a putem apsolutnog CSS-a. Odaberite semantiku za ponovno objavljivanje, vizualnu za dokumente kritične za izgled.
  3. pretvoriti: PDF.js izdvaja tekst i izgled. Pretvarač preslikava veličine fonta na razine naslova, identificira prijelome odlomaka i emitira HTML sa CSS stilom za tipografiju. Konverzija traje nekoliko sekundi za tipične dokumente.
  4. Preuzmite HTML: Spremite .html datoteku. Otvorite ga u bilo kojem pregledniku za pregled. Za korištenje sadržaja u CMS-u kopirajte sadržaj unutarnjeg tijela i zalijepite ga u uređivač.

Uobičajeni slučajevi upotrebe

Tehnički detalji

PDF.js izlaže tekstualni sadržaj kao stavke s graničnim okvirima, fontovima i Unicode nizovima. Pretvarač razvrstava stavke prema Y, a zatim prema X kako bi vratio redoslijed čitanja, grupira stavke na sličnim osnovnim linijama u retke i grupira retke u odlomke na temelju okomitog razmaka.

Detekcija naslova koristi analizu veličine fonta: veličine znatno veće od fonta tijela postaju naslovi, s najvećim mapiranim u h1, sljedećim najvećim u h2, i tako dalje. Otkrivanje popisa traži retke koji počinju znakovima s grafičkim oznakama ili numeričkim nizovima.

Izlazni HTML je samostalan: doctype, glava s ugrađenim CSS-om za tipografiju, tijelo s pretvorenim sadržajem. Inline slike iz PDF-a trenutno nisu ugrađene; ostaju poznato ograničenje. Izlaz se potvrđuje kao HTML5.

Najbolji primjeri iz prakse

Često postavljana pitanja

Mijenja li se sadržaj pretvaranjem PDF-a u HTML?
Sadržaj je sačuvan što je točnije moguće. Međutim, neke značajke specifične za format možda nemaju izravne ekvivalente, pa se mogu pojaviti manje razlike u formatiranju.
Za što se koristi HTML format?
HTML (HyperText Markup Language) prvenstveno se koristi za web stranice i web sadržaj.
Postoje li neka ograničenja kojih treba biti svjestan?
Podržane su datoteke do 50 MB. Obrada vrlo velikih ili složenih datoteka može potrajati dulje. Sve pretvorbe odvijaju se u vašem pregledniku, tako da brzina obrade ovisi o vašem uređaju.
Jesu li podaci mojih dokumenata sigurni?
da Obrada dokumenata u potpunosti se odvija u vašem pregledniku. Vaše datoteke i njihov sadržaj nikada se ne učitavaju ni na jedan poslužitelj. To čini sigurnim pretvaranje osjetljivih ili povjerljivih dokumenata.
Je li izlaz prilagođen mobilnim uređajima?
Semantički način rada proizvodi sadržaj koji teče kako bi odgovarao bilo kojoj širini. Vizualni način rada koristi apsolutno pozicioniranje koje se ne prilagođava malim zaslonima. Za mobitel, koristite semantički način.
Je li moj PDF prenesen na poslužitelj?
Ne. PDF.js radi u vašem pregledniku; datoteka ne napušta vaš uređaj.
Koja je najveća veličina datoteke?
50 MB. Veći dokumenti se dulje analiziraju.
Mogu li urediti HTML nakon konverzije?
Da - to je dio poante. Izlaz je običan HTML s ugrađenim CSS-om, koji se lako uređuje u bilo kojem uređivaču teksta ili zalijepi u CMS.