PDF til HTML-konvertering
Konverter PDF-dokumenter til rene, semantiske HTML-filer direkte i nettleseren din. Rask, sikker og bevarer dokumentstrukturen.
Velg PDF-fil
eller dra og slipp her
Konverter PDF-dokumenter til rene, semantiske HTML-filer direkte i nettleseren din. Rask, sikker og bevarer dokumentstrukturen.
eller dra og slipp her
Konvertering av PDF til HTML forvandler et dokument med fast oppsett til en flytende nettside. Konverteringen bevarer tekstinnhold, overskrifter, avsnitt og grunnleggende stil mens den forlater PDF-ens eksakte pikseloppsett til fordel for HTMLs responsive flyt. Dette er den riktige handelen for dokumenter som publiseres på nytt som nettinnhold - artikler, rapporter, teknisk dokumentasjon - og feil handel for dokumenter hvis layout er avgjørende - skjemaer, fakturaer med streng posisjonering, utformede markedsføringsartikler.
Dette verktøyet bruker PDF.js til å trekke ut tekst, fonter og grunnleggende struktur fra PDF-en, og skriver deretter tilsvarende HTML-oppmerking med innebygd CSS for typografi. Utdataene er en frittstående .html-fil som du kan åpne i hvilken som helst nettleser, lime inn i et CMS eller ytterligere stil med tilpasset CSS. Ingen opplasting skjer; konverteringen kjører i nettleseren din.
To utdatastiler støttes. Semantisk HTML produserer ren markering med avsnitts- og overskriftselementer, egnet for republisering av innhold på en blogg eller dokumentasjonsside. Visuell HTML bevarer mer av PDF-ens layout via absolutt posisjonering, egnet når dokumentets utseende betyr mer enn re-flytbarhet.
PDF-filer fungerer ikke bra på nettet. Mobilnettlesere gjengir PDF-filer på en vanskelig måte, skjermlesere håndterer dem inkonsekvent, søkemotorer gjennomsøker dem, men rangerer dem lavere enn tilsvarende HTML, og å bygge inn en PDF på en nettside gir en klønete iframe-visning i stedet for en naturlig opplevelse. Konvertering til HTML produserer innhold som fungerer slik nettet fungerer.
HTML er også redigerbar. Når en PDF-innhold er i HTML-form, kan du endre typografi, omstrukturere seksjoner, legge til interaktive elementer og integrere innholdet med andre nettsider. PDF motstår alle disse operasjonene.
Slipp PDF-en, velg utdatastil, generer.
PDF.js avslører tekstinnhold som elementer med avgrensningsbokser, fonter og Unicode-strenger. Konverteren sorterer elementer etter Y og deretter X for å gjenopprette leserekkefølgen, grupperer elementer ved lignende grunnlinjer i linjer, og grupperer linjer i avsnitt basert på vertikal avstand.
Overskriftsgjenkjenning bruker skriftstørrelsesanalyse: størrelser som er betydelig større enn hovedskrifttypen blir overskrifter, med den største tilordnet til h1, den nest største til h2, og så videre. Listegjenkjenning ser etter linjer som starter med punkttegn eller numeriske sekvenser.
Utdata-HTML er selvstendig: doctype, hode med innebygd CSS for typografi, brødtekst med det konverterte innholdet. Innebygde bilder fra PDF-en er for øyeblikket ikke innebygd; de forblir en kjent begrensning. Utdataene valideres som HTML5.