PDF a Convertitore HTML
Converti documenti PDF in file HTML puliti e semantici direttamente nel tuo browser. Veloce, sicuro e preserva la struttura del documento.
Seleziona il file PDF
oppure trascina e rilascia qui
Converti documenti PDF in file HTML puliti e semantici direttamente nel tuo browser. Veloce, sicuro e preserva la struttura del documento.
oppure trascina e rilascia qui
La conversione da PDF a HTML trasforma un documento a layout fisso in una pagina Web fluida. La conversione preserva il contenuto del testo, i titoli, i paragrafi e lo stile di base abbandonando l'esatto layout in pixel del PDF a favore del flusso reattivo dell'HTML. Questo è il commercio giusto per i documenti che vengono ripubblicati come contenuti web – articoli, relazioni, documentazione tecnica – e il commercio sbagliato per documenti il cui layout è essenziale – moduli, fatture con un posizionamento rigoroso, pezzi di marketing progettati.
Questo strumento utilizza PDF.js per estrarre testo, caratteri e struttura di base dal PDF, quindi scrive il markup HTML corrispondente con CSS incorporato per la tipografia. L'output è un file .html autonomo che puoi aprire in qualsiasi browser, incollare in un CMS o personalizzare ulteriormente con CSS personalizzato. Non avviene alcun caricamento; la conversione viene eseguita nel tuo browser.
Sono supportati due stili di output. L'HTML semantico produce markup pulito con elementi di paragrafo e intestazione, adatti per ripubblicare contenuti su un blog o un sito di documentazione. L'HTML visivo preserva una parte maggiore del layout del PDF tramite il posizionamento assoluto, adatto quando l'aspetto del documento è più importante della ridisposizione.
I PDF non funzionano bene sul Web. I browser mobili rendono i PDF in modo scomodo, gli screen reader li gestiscono in modo incoerente, i motori di ricerca li scansionano ma li classificano in una posizione inferiore rispetto all'HTML equivalente e l'incorporamento di un PDF in una pagina web produce un goffo visualizzatore in-iframe piuttosto che un'esperienza nativa. La conversione in HTML produce contenuti che funzionano nello stesso modo in cui funziona il Web.
Anche l'HTML è modificabile. Una volta che il contenuto di un PDF è in formato HTML, puoi modificare la tipografia, ristrutturare le sezioni, aggiungere elementi interattivi e integrare il contenuto con altre pagine web. Il PDF resiste a tutte queste operazioni.
Rilascia il PDF, scegli lo stile di output, genera.
PDF.js espone il contenuto del testo come elementi con riquadri di delimitazione, caratteri e stringhe Unicode. Il convertitore ordina gli elementi in base a Y e poi a X per ripristinare l'ordine di lettura, raggruppa gli elementi con linee di base simili in righe e raggruppa le righe in paragrafi in base alla spaziatura verticale.
Il rilevamento dell'intestazione utilizza l'analisi della dimensione del carattere: dimensioni significativamente più grandi del carattere del corpo diventano intestazioni, con la più grande mappata su h1, la successiva più grande su h2 e così via. Il rilevamento dell'elenco cerca le righe che iniziano con caratteri punto elenco o sequenze numeriche.
L'HTML di output è autonomo: doctype, head con CSS incorporato per la tipografia, body con il contenuto convertito. Le immagini in linea del PDF non sono attualmente incorporate; rimangono una limitazione nota. L'output viene convalidato come HTML5.