PDF a Convertidor HTML
Converteix documents PDF en fitxers HTML nets i semàntics directament al teu navegador. Ràpid, segur i conserva l'estructura del document.
Seleccioneu el fitxer PDF
o arrossega i deixa anar aquí
Converteix documents PDF en fitxers HTML nets i semàntics directament al teu navegador. Ràpid, segur i conserva l'estructura del document.
o arrossega i deixa anar aquí
La conversió de PDF a HTML transforma un document de disseny fix en una pàgina web fluida. La conversió conserva el contingut de text, els encapçalaments, els paràgrafs i l'estil bàsic mentre s'abandona la disposició exacta de píxels del PDF a favor del flux de resposta d'HTML. Aquest és el comerç adequat per als documents que es tornen a publicar com a contingut web (articles, informes, documentació tècnica) i el comerç equivocat per a documents la disposició dels quals és essencial: formularis, factures amb un posicionament estricte, peces de màrqueting dissenyades.
Aquesta eina utilitza PDF.js per extreure text, tipus de lletra i estructura bàsica del PDF, després escriu l'etiquetatge HTML corresponent amb CSS incrustat per a la tipografia. La sortida és un fitxer .html autònom que podeu obrir en qualsevol navegador, enganxar-lo en un CMS o un estil més amb CSS personalitzat. No es produeix cap càrrega; la conversió s'executa al vostre navegador.
S'admeten dos estils de sortida. L'HTML semàntic produeix un etiquetatge net amb elements de paràgraf i encapçalament, adequats per tornar a publicar contingut en un bloc o lloc de documentació. L'HTML visual conserva més del disseny del PDF mitjançant un posicionament absolut, adequat quan l'aspecte del document importa més que la refluència.
Els PDF no funcionen bé al web. Els navegadors mòbils mostren els PDF de manera incòmode, els lectors de pantalla els gestionen de manera inconsistent, els motors de cerca els rastregen però els classifiquen per sota de l'HTML equivalent, i incrustar un PDF en una pàgina web produeix un visualitzador in-iframe maldestre en lloc d'una experiència nativa. La conversió a HTML produeix contingut que funciona com funciona la web.
HTML també és editable. Un cop el contingut d'un PDF estigui en format HTML, podeu canviar la tipografia, reestructurar seccions, afegir elements interactius i integrar el contingut amb altres pàgines web. PDF resisteix totes aquestes operacions.
Deixeu anar el PDF, trieu l'estil de sortida, genereu.
PDF.js exposa el contingut de text com a elements amb quadres delimitadors, tipus de lletra i cadenes Unicode. El convertidor ordena els elements per Y i després X per recuperar l'ordre de lectura, agrupa els elements en línies de base similars en línies i agrupa les línies en paràgrafs basant-se en l'espaiat vertical.
La detecció d'encapçalaments utilitza l'anàlisi de la mida de la font: les mides significativament més grans que la font del cos es converteixen en encapçalaments, amb el més gran assignat a h1, el següent més gran a h2, etc. La detecció de llistes busca línies que comencen amb caràcters de vinyeta o seqüències numèriques.
L'HTML de sortida és autònom: doctype, capçalera amb CSS incrustat per a la tipografia, cos amb el contingut convertit. Les imatges en línia del PDF no estan incrustades actualment; segueixen sent una limitació coneguda. La sortida es valida com a HTML5.