PDF către Convertor HTML
Convertiți documente PDF în fișiere HTML curate și semantice direct în browser. Rapid, sigur și păstrează structura documentului.
Selectați fișierul PDF
sau trageți și plasați aici
Convertiți documente PDF în fișiere HTML curate și semantice direct în browser. Rapid, sigur și păstrează structura documentului.
sau trageți și plasați aici
Conversia PDF în HTML transformă un document cu aspect fix într-o pagină web fluidă. Conversia păstrează conținutul textului, titlurile, paragrafele și stilul de bază, abandonând în același timp aspectul exact în pixeli a PDF-ului în favoarea fluxului de răspuns al HTML. Acesta este comerțul potrivit pentru documentele republicate ca conținut web — articole, rapoarte, documentație tehnică — și comerțul greșit pentru documente a căror aspect este esențial — formulare, facturi cu poziționare strictă, piese de marketing concepute.
Acest instrument folosește PDF.js pentru a extrage text, fonturi și structura de bază din PDF, apoi scrie marcaj HTML corespunzător cu CSS încorporat pentru tipografie. Rezultatul este un fișier .html de sine stătător pe care îl puteți deschide în orice browser, îl puteți lipi într-un CMS sau un stil suplimentar cu CSS personalizat. Nu are loc încărcare; conversia rulează în browserul dvs.
Sunt acceptate două stiluri de ieșire. HTML semantic produce un marcaj curat cu elemente de paragraf și titlu, potrivite pentru republicarea conținutului pe un blog sau pe un site de documentare. Visual HTML păstrează mai mult aspectul PDF-ului printr-o poziționare absolută, potrivită atunci când aspectul documentului contează mai mult decât refluxabilitate.
PDF-urile nu funcționează bine pe web. Browserele mobile redă PDF-uri stânjenitor, cititoarele de ecran le tratează inconsecvent, motoarele de căutare le accesează cu crawlere, dar le clasifică mai jos decât HTML echivalent, iar încorporarea unui PDF într-o pagină web produce un vizualizator in-iframe greoi, mai degrabă decât o experiență nativă. Convertirea în HTML produce conținut care funcționează așa cum funcționează web-ul.
HTML este, de asemenea, editabil. Odată ce conținutul unui PDF este în formă HTML, puteți schimba tipografia, restructura secțiuni, adăuga elemente interactive și integra conținutul cu alte pagini web. PDF rezistă tuturor acestor operațiuni.
Aruncă PDF-ul, alege stilul de ieșire, generează.
PDF.js expune conținutul text ca elemente cu casete de delimitare, fonturi și șiruri Unicode. Convertorul sortează articolele după Y apoi X pentru a recupera ordinea de citire, grupează articolele la linii de bază similare în linii și grupează liniile în paragrafe pe baza spațierii verticale.
Detectarea titlurilor folosește analiza mărimii fontului: dimensiunile semnificativ mai mari decât fontul corpului devin titluri, cel mai mare fiind mapat la h1, următorul cel mai mare la h2 și așa mai departe. Detectarea listei caută linii care încep cu marcatori sau secvențe numerice.
HTML de ieșire este autonom: doctype, cap cu CSS încorporat pentru tipografie, corp cu conținutul convertit. Imaginile inline din PDF nu sunt în prezent încorporate; ele rămân o limitare cunoscută. Ieșirea se validează ca HTML5.