Convertidor gratuït

PDF a Convertidor HTML

Converteix documents PDF en fitxers HTML nets i semàntics directament al teu navegador. Ràpid, segur i conserva l'estructura del document.

Seleccioneu el fitxer PDF

o arrossega i deixa anar aquí

O

Sobre aquesta eina

La conversió de PDF a HTML transforma un document de disseny fix en una pàgina web fluida. La conversió conserva el contingut de text, els encapçalaments, els paràgrafs i l'estil bàsic mentre s'abandona la disposició exacta de píxels del PDF a favor del flux de resposta d'HTML. Aquest és el comerç adequat per als documents que es tornen a publicar com a contingut web (articles, informes, documentació tècnica) i el comerç equivocat per a documents la disposició dels quals és essencial: formularis, factures amb un posicionament estricte, peces de màrqueting dissenyades.

Aquesta eina utilitza PDF.js per extreure text, tipus de lletra i estructura bàsica del PDF, després escriu l'etiquetatge HTML corresponent amb CSS incrustat per a la tipografia. La sortida és un fitxer .html autònom que podeu obrir en qualsevol navegador, enganxar-lo en un CMS o un estil més amb CSS personalitzat. No es produeix cap càrrega; la conversió s'executa al vostre navegador.

S'admeten dos estils de sortida. L'HTML semàntic produeix un etiquetatge net amb elements de paràgraf i encapçalament, adequats per tornar a publicar contingut en un bloc o lloc de documentació. L'HTML visual conserva més del disseny del PDF mitjançant un posicionament absolut, adequat quan l'aspecte del document importa més que la refluència.

Per què convertir PDF a HTML

Els PDF no funcionen bé al web. Els navegadors mòbils mostren els PDF de manera incòmode, els lectors de pantalla els gestionen de manera inconsistent, els motors de cerca els rastregen però els classifiquen per sota de l'HTML equivalent, i incrustar un PDF en una pàgina web produeix un visualitzador in-iframe maldestre en lloc d'una experiència nativa. La conversió a HTML produeix contingut que funciona com funciona la web.

HTML també és editable. Un cop el contingut d'un PDF estigui en format HTML, podeu canviar la tipografia, reestructurar seccions, afegir elements interactius i integrar el contingut amb altres pàgines web. PDF resisteix totes aquestes operacions.

Com utilitzar-la

Deixeu anar el PDF, trieu l'estil de sortida, genereu.

  1. Carrega el teu PDF: Arrossegueu el fitxer a l'àrea de càrrega o feu clic per navegar. S'admeten fitxers de fins a 50 MB. Els PDF protegits amb contrasenya no són compatibles; primer eliminar la protecció.
  2. Trieu l'estil de sortida: L'HTML semàntic produeix contingut fluid amb etiquetes de paràgrafs i encapçalaments. Visual HTML conserva el posicionament del PDF mitjançant CSS absolut. Trieu semàntica per a la republicació, visual per a documents crítics per a la disposició.
  3. Converteix: PDF.js extreu text i disseny. El convertidor mapeja les mides de lletra als nivells d'encapçalament, identifica els salts de paràgraf i emet HTML amb estil CSS per a la tipografia. La conversió triga uns segons per als documents habituals.
  4. Descarrega l'HTML: Deseu el fitxer .html. Obriu-lo en qualsevol navegador per previsualitzar-lo. Per utilitzar el contingut en un CMS, copieu el contingut del cos interior i enganxeu-lo a l'editor.

Casos d'ús comuns

Detalls tècnics

PDF.js exposa el contingut de text com a elements amb quadres delimitadors, tipus de lletra i cadenes Unicode. El convertidor ordena els elements per Y i després X per recuperar l'ordre de lectura, agrupa els elements en línies de base similars en línies i agrupa les línies en paràgrafs basant-se en l'espaiat vertical.

La detecció d'encapçalaments utilitza l'anàlisi de la mida de la font: les mides significativament més grans que la font del cos es converteixen en encapçalaments, amb el més gran assignat a h1, el següent més gran a h2, etc. La detecció de llistes busca línies que comencen amb caràcters de vinyeta o seqüències numèriques.

L'HTML de sortida és autònom: doctype, capçalera amb CSS incrustat per a la tipografia, cos amb el contingut convertit. Les imatges en línia del PDF no estan incrustades actualment; segueixen sent una limitació coneguda. La sortida es valida com a HTML5.

Bones pràctiques

Preguntes freqüents

Convertir PDF a HTML canvia el contingut?
El contingut es conserva amb la màxima precisió possible. Tanmateix, és possible que algunes característiques específiques de format no tinguin equivalents directes, de manera que es poden produir diferències de format menors.
Per a què serveix el format HTML?
L'HTML (llenguatge de marcat d'hipertext) s'utilitza principalment per a pàgines web i contingut web.
Hi ha alguna limitació a tenir en compte?
S'admeten fitxers de fins a 50 MB. Els fitxers molt grans o complexos poden trigar més a processar-se. Totes les conversions es produeixen al vostre navegador, de manera que la velocitat de processament depèn del vostre dispositiu.
Les dades del meu document són segures?
Sí. El processament de documents s'executa completament al vostre navegador. Els vostres fitxers i el seu contingut mai es pengen a cap servidor. Això fa que sigui segur convertir documents sensibles o confidencials.
La sortida és compatible amb mòbils?
El mode semàntic produeix contingut que flueix per adaptar-se a qualsevol amplada. El mode visual utilitza un posicionament absolut que no s'adapta a les pantalles petites. Per al mòbil, utilitzeu el mode semàntic.
El meu PDF està penjat a un servidor?
No. PDF.js s'executa al vostre navegador; el fitxer no surt del vostre dispositiu.
Quina és la mida màxima del fitxer?
50 MB. Els documents més grans triguen més a analitzar-se.
Puc editar l'HTML després de la conversió?
Sí, això és part de la qüestió. La sortida és HTML senzill amb CSS incrustat, fàcil d'editar en qualsevol editor de text o enganxar en un CMS.