PDF till HTML-konverterare
Konvertera PDF-dokument till rena, semantiska HTML-filer direkt i din webbläsare. Snabbt, säkert och bevarar dokumentstrukturen.
Välj PDF-fil
eller dra och släpp här
Konvertera PDF-dokument till rena, semantiska HTML-filer direkt i din webbläsare. Snabbt, säkert och bevarar dokumentstrukturen.
eller dra och släpp här
Att konvertera PDF till HTML förvandlar ett dokument med fast layout till en flödande webbsida. Konverteringen bevarar textinnehåll, rubriker, stycken och grundläggande stil samtidigt som PDF:s exakta pixellayout överges till förmån för HTMLs responsiva flöde. Detta är rätt handel för dokument som återpubliceras som webbinnehåll - artiklar, rapporter, teknisk dokumentation - och fel handel för dokument vars layout är avgörande - blanketter, fakturor med strikt positionering, designade marknadsföringsartiklar.
Det här verktyget använder PDF.js för att extrahera text, teckensnitt och grundläggande struktur från PDF:en, och skriver sedan motsvarande HTML-uppmärkning med inbäddad CSS för typografi. Utdata är en fristående .html-fil som du kan öppna i vilken webbläsare som helst, klistra in i ett CMS eller ytterligare stil med anpassad CSS. Ingen uppladdning sker; konverteringen körs i din webbläsare.
Två utmatningsstilar stöds. Semantisk HTML producerar ren uppmärkning med stycke- och rubrikelement, lämpliga för att återpublicera innehåll på en blogg eller dokumentationswebbplats. Visual HTML bevarar mer av PDF:s layout via absolut positionering, lämpligt när dokumentets utseende betyder mer än återflytbarhet.
PDF-filer fungerar inte bra på webben. Mobila webbläsare återger PDF-filer på ett obekvämt sätt, skärmläsare hanterar dem inkonsekvent, sökmotorer genomsöker dem men rankar dem lägre än motsvarande HTML, och att bädda in en PDF-fil på en webbsida ger en klumpig in-iframe-visare snarare än en inbyggd upplevelse. Konvertering till HTML ger innehåll som fungerar som webben fungerar.
HTML är också redigerbart. När en PDFs innehåll är i HTML-form kan du ändra typografi, strukturera om avsnitt, lägga till interaktiva element och integrera innehållet med andra webbsidor. PDF motstår alla dessa operationer.
Släpp PDF-filen, välj utmatningsstil, generera.
PDF.js exponerar textinnehåll som objekt med begränsningsrutor, teckensnitt och Unicode-strängar. Omvandlaren sorterar objekt efter Y och sedan X för att återställa läsordningen, grupperar objekt vid liknande baslinjer till linjer och grupperar linjer i stycken baserat på vertikalt avstånd.
Rubrikidentifiering använder typsnittsstorleksanalys: storlekar som är betydligt större än textteckensnittet blir rubriker, med den största mappad till h1, den näst största till h2 och så vidare. Listdetektering letar efter rader som börjar med punkttecken eller numeriska sekvenser.
Utdata-HTML är fristående: doctype, huvud med inbäddad CSS för typografi, brödtext med det konverterade innehållet. Inline-bilder från PDF-filen är för närvarande inte inbäddade; de förblir en känd begränsning. Utdata valideras som HTML5.