Convertitore gratuito

PDF a Parola (DOCX)

Estrai il testo da PDF e convertilo in formato Word modificabile interamente nel tuo browser. Veloce, sicuro e privato.

Rilascia il file PDF qui

Supporta fino a 50 MB

O

Informazioni su questo strumento

PDF e DOCX (Microsoft Word) descrivono i documenti utilizzando modelli fondamentalmente diversi. Il PDF è un formato a layout fisso: ogni glifo ha una posizione esplicita su una pagina di dimensione fissa, rendendo il documento identico ovunque venga visualizzato. DOCX è un formato con layout di flusso: paragrafi, tabelle e intestazioni sono descritti semanticamente e il motore di rendering decide dove si trovano nella pagina in base alla dimensione della pagina corrente e alla disponibilità dei caratteri. Convertire da PDF a DOCX significa decodificare il layout fisso in una struttura semantica che Word può ridisporre.

Questa conversione è intrinsecamente con perdite. Il PDF generalmente non preserva i livelli di intestazione, i limiti di paragrafo, la struttura dell'elenco o la semantica delle tabelle; il convertitore deve dedurli dalle dimensioni dei caratteri, dalle posizioni e dai caratteri dei punti elenco. I PDF semplici basati su testo vengono convertiti in modo pulito. I PDF complessi con layout a più colonne, immagini incorporate, note a piè di pagina o caratteri tipografici insoliti necessitano in genere di una pulizia manuale dopo la conversione.

Questo strumento esegue la conversione nel tuo browser utilizzando PDF.js per l'analisi e un writer personalizzato da layout a DOCX che produce output Office Open XML standard. Il risultato si apre in Microsoft Word, LibreOffice Writer, Google Docs e qualsiasi altro editor compatibile con DOCX. Non avviene alcun caricamento; il file rimane sul tuo dispositivo.

Perché convertire PDF in DOCX

La modificabilità è l'intera ragione. Il PDF è ostile alla modifica: puoi compilare campi modulo e annotare, ma non puoi ridisporre il testo, modificare gli stili di paragrafo o ristrutturare il contenuto senza editor PDF specializzati che costano denaro e producono risultati incoerenti. DOCX è progettato per la modifica. La conversione di un PDF in DOCX rende il contenuto trattabile per la revisione, la traduzione, il riutilizzo o la riprogettazione.

L’altro motivo è la collaborazione. Word e Google Docs sono la lingua franca della collaborazione documentale negli uffici, nelle scuole e nella maggior parte delle organizzazioni. I thread di commenti, le modifiche al tracciamento e le modifiche condivise presuppongono tutti DOCX o i suoi equivalenti cloud. I PDF inviati per la revisione diventano colli di bottiglia; DOCX scorre attraverso strumenti di collaborazione standard.

Come usarlo

Rilascia il PDF, genera, scarica. Aspettatevi di fare qualche pulizia in Word in seguito.

  1. Carica il tuo PDF: Trascina il file nell'area di caricamento o fai clic per sfogliarlo. Sono supportati file fino a 50 MB. I PDF protetti da password non sono supportati; rimuovere prima la password utilizzando uno strumento desktop.
  2. Attendi l'analisi: PDF.js estrae testo, informazioni sui caratteri e posizioni del layout da ogni pagina. L'analisi richiede pochi secondi per documenti brevi e più tempo per documenti con immagini incorporate o grafica complessa.
  3. Convertire: Il convertitore analizza il contenuto analizzato, deduce i limiti di paragrafo e intestazione dalle dimensioni e dalle posizioni dei caratteri e scrive Office Open XML in un file zip in memoria. Intestazioni, paragrafi ed elenchi puntati vengono mappati sugli stili DOCX equivalenti.
  4. Scarica e pulisci: Salva il file .docx e aprilo in Word o nel tuo editor preferito. Pianifica di dedicare qualche minuto alla risoluzione dei problemi residui (gerarchia delle intestazioni, formattazione dell'elenco, limiti della tabella) che il convertitore non è riuscito a dedurre perfettamente dal PDF.

Casi d'uso comuni

Dettagli tecnici

PDF.js analizza ogni pagina PDF in un flusso di operazioni di testo e grafica. L'API di estrazione del testo restituisce elementi di testo con i relativi riquadri di delimitazione, informazioni sui caratteri e stringhe decodificate Unicode. Da questi elementi il ​​convertitore ricostruisce l'ordine di lettura ordinandoli dall'alto verso il basso e da sinistra a destra, raggruppando elementi con linee di base simili in righe e righe in paragrafi.

DOCX è un archivio zip contenente file XML (document.xml, stili.xml, oltre a manifesti di tipi di contenuto e relazioni). Il convertitore crea il contenuto document.xml utilizzando una serie di elementi paragrafo (w:p) ed esecuzione (w:r), applica riferimenti di stile per le intestazioni (Intestazione 1, Intestazione 2) dove la dimensione del carattere suggerisce un'intestazione e assembla lo zip in memoria utilizzando JSZip.

Limitazioni: non sempre i layout delle colonne vengono ricostruiti correttamente. Le tabelle nel PDF vengono recuperate come paragrafi a meno che il layout non suggerisca fortemente la struttura tabellare. Intestazioni, piè di pagina e note a piè di pagina in genere finiscono in linea nel corpo anziché nelle zone DOCX corrispondenti. Le immagini incorporate nel PDF non vengono attualmente conservate nell'output DOCX.

Migliori pratiche

Domande frequenti

La conversione di PDF in DOCX cambia il contenuto?
Il contenuto viene conservato nel modo più accurato possibile. Tuttavia, alcune funzionalità specifiche del formato potrebbero non avere equivalenti diretti, pertanto potrebbero verificarsi piccole differenze di formattazione.
A cosa serve il formato DOCX?
DOCX (Microsoft Word Document) viene utilizzato principalmente per documenti di testo modificabili con formattazione.
Ci sono limitazioni di cui essere a conoscenza?
Sono supportati file fino a 50 MB. L'elaborazione di file molto grandi o complessi potrebbe richiedere più tempo. Tutta la conversione avviene nel tuo browser, quindi la velocità di elaborazione dipende dal tuo dispositivo.
I dati del mio documento sono al sicuro?
SÌ. L'elaborazione dei documenti viene eseguita interamente nel tuo browser. I tuoi file e i loro contenuti non verranno mai caricati su nessun server. Ciò rende sicura la conversione di documenti sensibili o riservati.
Le tabelle verranno conservate?
Le tabelle semplici a volte vengono convertite in tabelle Word; le tabelle complesse in genere si convertono in paragrafi formattati che necessitano di ristrutturazione manuale. Pianifica di ricreare manualmente le tabelle critiche se la precisione è importante.
Il mio PDF è caricato su un server?
No. L'analisi PDF utilizza PDF.js e la scrittura DOCX utilizza JSZip: entrambi vengono eseguiti interamente nel tuo browser.
Qual è la dimensione massima del file?
50 MB. I limiti pratici dipendono dalla complessità del documento; un PDF ricco di testo di quelle dimensioni viene convertito in pochi secondi, mentre un documento ricco di grafica della stessa dimensione potrebbe avere difficoltà.
Posso convertire PDF protetti da password?
No. PDF.js non implementa la decrittazione. Rimuovi prima la password utilizzando uno strumento desktop come qpdf o le impostazioni di sicurezza di Acrobat.