PDF til HTML konverter
Konverter PDF-dokumenter til rene, semantiske HTML-filer direkte i din browser. Hurtig, sikker og bevarer dokumentstruktur.
Vælg PDF-fil
eller træk og slip her
Konverter PDF-dokumenter til rene, semantiske HTML-filer direkte i din browser. Hurtig, sikker og bevarer dokumentstruktur.
eller træk og slip her
Konvertering af PDF til HTML forvandler et dokument med fast layout til en flydende webside. Konverteringen bevarer tekstindhold, overskrifter, afsnit og grundlæggende stil, mens PDF'ens nøjagtige pixellayout opgives til fordel for HTMLs responsive flow. Dette er den rigtige handel for dokumenter, der genudgives som webindhold - artikler, rapporter, teknisk dokumentation - og den forkerte handel for dokumenter, hvis layout er essentielt - formularer, fakturaer med streng positionering, designede markedsføringsstykker.
Dette værktøj bruger PDF.js til at udtrække tekst, skrifttyper og grundlæggende struktur fra PDF'en og skriver derefter tilsvarende HTML-markering med indlejret CSS til typografi. Outputtet er en selvstændig .html-fil, du kan åbne i enhver browser, indsætte i et CMS eller yderligere stil med tilpasset CSS. Ingen upload sker; konverteringen kører i din browser.
To output-stile understøttes. Semantisk HTML producerer ren opmærkning med afsnits- og overskriftselementer, velegnet til genudgivelse af indhold på en blog eller dokumentationsside. Visuel HTML bevarer mere af PDF'ens layout via absolut positionering, velegnet når dokumentets udseende betyder mere end re-flowability.
PDF'er fungerer ikke godt på nettet. Mobile browsere gengiver PDF'er akavet, skærmlæsere håndterer dem inkonsekvent, søgemaskiner gennemgår dem, men rangerer dem lavere end tilsvarende HTML, og indlejring af en PDF på en webside giver en klodset in-iframe viewer snarere end en indbygget oplevelse. Konvertering til HTML producerer indhold, der fungerer, som internettet fungerer.
HTML kan også redigeres. Når en PDF-indhold er i HTML-form, kan du ændre typografi, omstrukturere sektioner, tilføje interaktive elementer og integrere indholdet med andre websider. PDF modstår alle disse operationer.
Drop PDF'en, vælg outputstil, generer.
PDF.js eksponerer tekstindhold som elementer med afgrænsningsfelter, skrifttyper og Unicode-strenge. Konverteren sorterer elementer efter Y og derefter X for at genskabe læserækkefølgen, grupperer elementer på lignende basislinjer i linjer og grupperer linjer i afsnit baseret på lodret afstand.
Overskriftsregistrering bruger skriftstørrelsesanalyse: størrelser, der er væsentligt større end brødteksten, bliver til overskrifter, hvor den største er kortlagt til h1, den næststørste til h2 og så videre. Listeregistrering søger efter linjer, der starter med punkttegn eller numeriske sekvenser.
HTML-outputtet er selvstændigt: doctype, hoved med indlejret CSS til typografi, brødtekst med det konverterede indhold. Indlejrede billeder fra PDF'en er i øjeblikket ikke indlejret; de forbliver en kendt begrænsning. Outputtet valideres som HTML5.