Gratis converter

PDF naar Woord (DOCX)

Extraheer tekst uit PDF en converteer deze geheel in uw browser naar een bewerkbaar Word-formaat. Snel, veilig en privé.

Zet het PDF-bestand hier neer

Ondersteunt tot 50 MB

Of

Over deze tool

PDF en DOCX (Microsoft Word) beschrijven documenten met fundamenteel verschillende modellen. PDF is een indeling met een vaste lay-out: elke glyph heeft een expliciete positie op een pagina met een vast formaat, waardoor het document er overal identiek uitziet waar het wordt weergegeven. DOCX is een flow-layout-indeling: paragrafen, tabellen en koppen worden semantisch beschreven, en de rendering-engine bepaalt waar ze op de pagina vallen op basis van de huidige paginagrootte en beschikbaarheid van lettertypen. Converteren van PDF naar DOCX betekent het reverse-engineeren van de vaste lay-out in een semantische structuur die Word opnieuw kan laten verlopen.

Deze conversie is inherent verliesgevend. PDF behoudt doorgaans geen kopniveaus, alineagrenzen, lijststructuur of tabelsemantiek; de converter moet deze afleiden uit lettergroottes, posities en opsommingstekens. Eenvoudige op tekst gebaseerde PDF's worden netjes geconverteerd. Complexe PDF's met lay-outs met meerdere kolommen, ingesloten afbeeldingen, voetnoten of ongebruikelijke typografie moeten na de conversie doorgaans handmatig worden opgeschoond.

Deze tool voert de conversie uit in uw browser met behulp van PDF.js voor parsing en een aangepaste lay-out-naar-DOCX-schrijver die standaard Office Open XML-uitvoer produceert. Het resultaat wordt geopend in Microsoft Word, LibreOffice Writer, Google Docs en elke andere DOCX-compatibele editor. Er vindt geen upload plaats; het bestand blijft op uw apparaat staan.

Waarom PDF naar DOCX converteren

Bewerkbaarheid is de hele reden. PDF staat vijandig tegenover bewerken: u kunt formuliervelden invullen en aantekeningen maken, maar u kunt de tekst niet opnieuw plaatsen, alineastijlen wijzigen of inhoud herstructureren zonder gespecialiseerde PDF-editors die geld kosten en inconsistente resultaten opleveren. DOCX is gebouwd voor bewerking. Door een PDF naar DOCX te converteren, wordt de inhoud handelbaar voor revisie, vertaling, herbestemming of herontwerp.

De andere reden is samenwerking. Word en Google Documenten zijn de lingua franca voor samenwerking aan documenten in kantoren, scholen en de meeste organisaties. Commentaarthreads, wijzigingen bijhouden en gedeelde bewerking gaan allemaal uit van DOCX of zijn cloud-equivalenten. PDF's die ter beoordeling worden verzonden, worden knelpunten; DOCX stroomt via standaard samenwerkingstools.

Hoe te gebruiken

Zet de PDF neer, genereer, download. Verwacht daarna wat opruimwerk in Word te doen.

  1. Upload uw PDF: Sleep het bestand naar het uploadgebied of klik om te bladeren. Bestanden tot 50 MB worden ondersteund. Met een wachtwoord beveiligde PDF's worden niet ondersteund; verwijder eerst het wachtwoord met behulp van een desktoptool.
  2. Wacht op het parseren: PDF.js extraheert tekst, lettertype-informatie en lay-outposities van elke pagina. Het parseren duurt seconden voor korte documenten en langer voor documenten met ingesloten afbeeldingen of complexe grafische afbeeldingen.
  3. Converteren: De converter doorloopt de geparseerde inhoud, leidt de grenzen van alinea's en kopteksten af uit lettergroottes en posities, en schrijft Office Open XML naar een zip-bestand in het geheugen. Koppen, alinea's en lijsten met opsommingstekens worden toegewezen aan de equivalente DOCX-stijlen.
  4. Downloaden en opruimen: Sla het .docx-bestand op en open het in Word of de editor van uw voorkeur. Plan een paar minuten te besteden aan het oplossen van resterende problemen (kopteksthiërarchie, lijstopmaak, tabelgrenzen) die de converter niet perfect uit de PDF kon afleiden.

Veelvoorkomende gebruiksscenario's

Technische details

PDF.js ontleedt elke PDF-pagina in een stroom tekst- en grafische bewerkingen. De tekstextractie-API retourneert tekstitems met hun selectiekaders, lettertype-informatie en Unicode-gedecodeerde tekenreeksen. Op basis van deze items reconstrueert de converter de leesvolgorde door van boven naar beneden en van links naar rechts te sorteren, waarbij items met vergelijkbare basislijnen worden gegroepeerd in regels en regels in alinea's.

DOCX is een zip-archief met XML-bestanden (document.xml, stijlen.xml, plus inhoudstype en relatiemanifesten). De converter bouwt de document.xml-inhoud op met behulp van een reeks paragraaf- (w:p) en run- (w:r)-elementen, past stijlreferenties toe voor koppen (Kop 1, Kop 2) waarbij de lettergrootte een kop suggereert, en assembleert de zip in het geheugen met behulp van JSZip.

Beperkingen: kolomindelingen worden niet altijd correct gereconstrueerd. Tabellen in de PDF worden hersteld als alinea's, tenzij de lay-out sterk de tabelstructuur suggereert. Kopteksten, voetteksten en voetnoten komen doorgaans in de hoofdtekst terecht in plaats van in de overeenkomstige DOCX-zones. Afbeeldingen die in de PDF zijn ingesloten, worden momenteel niet bewaard in de DOCX-uitvoer.

Beste praktijken

Veelgestelde vragen

Verandert het converteren van PDF naar DOCX de inhoud?
De inhoud wordt zo nauwkeurig mogelijk bewaard. Sommige formaatspecifieke functies hebben echter mogelijk geen directe equivalenten, waardoor er kleine opmaakverschillen kunnen optreden.
Waar wordt het DOCX-formaat voor gebruikt?
DOCX (Microsoft Word Document) wordt voornamelijk gebruikt voor bewerkbare tekstdocumenten met opmaak.
Zijn er beperkingen waar u rekening mee moet houden?
Bestanden tot 50 MB worden ondersteund. Het verwerken van zeer grote of complexe bestanden kan langer duren. Alle conversies vinden plaats in uw browser, dus de verwerkingssnelheid is afhankelijk van uw apparaat.
Zijn mijn documentgegevens veilig?
Ja. De documentverwerking verloopt volledig in uw browser. Uw bestanden en hun inhoud worden nooit naar een server geüpload. Dit maakt het veilig om gevoelige of vertrouwelijke documenten te converteren.
Blijven tabellen behouden?
Eenvoudige tabellen worden soms omgezet in Word-tabellen; complexe tabellen worden doorgaans omgezet in opgemaakte alinea's die handmatig moeten worden geherstructureerd. Plan om kritieke tabellen handmatig opnieuw te maken als precisie belangrijk is.
Wordt mijn PDF naar een server geüpload?
Nee. Bij het parseren van PDF's wordt gebruik gemaakt van PDF.js en bij het schrijven van DOCX wordt gebruik gemaakt van JSZip. Beide worden volledig in uw browser uitgevoerd.
Wat is de maximale bestandsgrootte?
50MB. Praktische grenzen zijn afhankelijk van de complexiteit van het document; een tekstrijke PDF van dat formaat wordt binnen enkele seconden geconverteerd, terwijl een document met veel afbeeldingen van hetzelfde formaat moeite kan hebben.
Kan ik met een wachtwoord beveiligde PDF's converteren?
Nee. PDF.js implementeert geen decodering. Verwijder eerst het wachtwoord met behulp van een desktoptool zoals qpdf of de beveiligingsinstellingen van Acrobat.