Gratis omformer

PDF til Word (DOCX)

Trekk ut tekst fra PDF og konverter den til redigerbart Word-format helt i nettleseren din. Rask, sikker og privat.

Slipp PDF-filen her

Støtter opptil 50 MB

Eller

Om dette verktøyet

PDF og DOCX (Microsoft Word) beskriver dokumenter som bruker fundamentalt forskjellige modeller. PDF er et format med fast oppsett: hver glyph har en eksplisitt plassering på en side med fast størrelse, noe som gjør at dokumentet ser identisk ut overalt hvor det gjengis. DOCX er et flyt-layout-format: avsnitt, tabeller og overskrifter beskrives semantisk, og gjengivelsesmotoren bestemmer hvor de faller på siden basert på gjeldende sidestørrelse og skrifttilgjengelighet. Konvertering fra PDF til DOCX betyr omvendt utvikling av det faste oppsettet til en semantisk struktur som Word kan re-flyte.

Denne konverteringen er iboende tapsmessig. PDF bevarer generelt ikke overskriftsnivåer, avsnittsgrenser, listestruktur eller tabellsemantikk; konverteren må utlede disse fra skriftstørrelser, posisjoner og punkttegn. Enkle tekstbaserte PDF-filer konverterer rent. Komplekse PDF-filer med flerkolonneoppsett, innebygde bilder, fotnoter eller uvanlig typografi trenger vanligvis manuell opprydding etter konvertering.

Dette verktøyet kjører konverteringen i nettleseren din ved å bruke PDF.js for parsing og en tilpasset layout-til-DOCX-skriver som produserer standard Office Open XML-utdata. Resultatet åpnes i Microsoft Word, LibreOffice Writer, Google Docs og alle andre DOCX-kompatible editorer. Ingen opplasting skjer; filen forblir på enheten din.

Hvorfor konvertere PDF til DOCX

Redigerbarhet er hele årsaken. PDF er fiendtlig mot redigering - du kan fylle ut skjemafelt og kommentere, men du kan ikke flyte tekst, endre avsnittsstiler eller omstrukturere innhold uten spesialiserte PDF-redigerere som koster penger og gir inkonsekvente resultater. DOCX er bygget for redigering. Konvertering av en PDF til DOCX gjør innholdet oversiktlig for revisjon, oversettelse, omformål eller redesign.

Den andre grunnen er samarbeid. Word og Google Docs er lingua franca for dokumentsamarbeid på kontorer, skoler og de fleste organisasjoner. Kommentartråder, spor endringer og delt redigering forutsetter alle DOCX eller skyekvivalenter. PDF-filer sendt til gjennomgang blir flaskehalser; DOCX flyter gjennom standard samarbeidsverktøy.

Slik bruker du det

Slipp PDF-en, generer, last ned. Forvent å gjøre litt opprydding i Word etterpå.

  1. Last opp PDF-en din: Dra filen til opplastingsområdet eller klikk for å bla. Filer på opptil 50 MB støttes. Passordbeskyttede PDF-filer støttes ikke; Fjern passordet først ved å bruke et skrivebordsverktøy.
  2. Vent på parsing: PDF.js trekker ut tekst, fontinformasjon og layoutposisjoner fra hver side. Parsing tar sekunder for korte dokumenter og lengre tid for dokumenter med innebygde bilder eller kompleks grafikk.
  3. Konverter: Konverteren går gjennom det analyserte innholdet, utleder paragraf- og overskriftsgrenser fra skriftstørrelser og posisjoner, og skriver Office Open XML til en zip-fil i minnet. Overskrifter, avsnitt og punktlister er tilordnet de tilsvarende DOCX-stilene.
  4. Last ned og ryd opp: Lagre .docx-filen og åpne den i Word eller ditt foretrukne redigeringsprogram. Planlegg å bruke noen minutter på å fikse gjenværende problemer - overskriftshierarki, listeformatering, tabellgrenser - som konvertereren ikke kunne utlede perfekt fra PDF-en.

Vanlige brukstilfeller

Tekniske detaljer

PDF.js analyserer hver PDF-side til en strøm av tekst- og grafikkoperasjoner. Tekstutvinnings-APIet returnerer tekstelementer med deres avgrensningsbokser, skriftinformasjon og Unicode-dekodede strenger. Fra disse elementene rekonstruerer omformeren leserekkefølgen ved å sortere topp-til-bunn og venstre til høyre, gruppere elementer med lignende grunnlinjer i linjer og linjer i avsnitt.

DOCX er et zip-arkiv som inneholder XML-filer (document.xml, styles.xml, pluss innholdstype og relasjonsmanifester). Konverteren bygger dokument.xml-innholdet ved hjelp av en serie avsnitt (w:p) og run (w:r)-elementer, bruker stilreferanser for overskrifter (Overskrift 1, Overskrift 2) der skriftstørrelsen foreslår en overskrift, og setter sammen zip-filen i minnet ved hjelp av JSZip.

Begrensninger: kolonneoppsett er ikke alltid rekonstruert riktig. Tabeller i PDF-en gjenopprettes som avsnitt med mindre oppsettet sterkt antyder tabellstruktur. Topptekster, bunntekster og fotnoter ender vanligvis inne i kroppen i stedet for i de tilsvarende DOCX-sonene. Bilder som er innebygd i PDF-en er for øyeblikket ikke bevart i DOCX-utdataene.

Beste praksis

Ofte stilte spørsmål

Endrer konvertering av PDF til DOCX innholdet?
Innholdet bevares så nøyaktig som mulig. Imidlertid kan det hende at enkelte formatspesifikke funksjoner ikke har direkte ekvivalenter, så det kan oppstå mindre formateringsforskjeller.
Hva brukes DOCX-formatet til?
DOCX (Microsoft Word Document) brukes først og fremst til redigerbare tekstdokumenter med formatering.
Er det noen begrensninger å være klar over?
Filer på opptil 50 MB støttes. Svært store eller komplekse filer kan ta lengre tid å behandle. All konvertering skjer i nettleseren din, så behandlingshastigheten avhenger av enheten din.
Er dokumentdataene mine sikre?
Ja. Dokumentbehandling kjører helt i nettleseren din. Dine filer og deres innhold blir aldri lastet opp til noen server. Dette gjør det trygt å konvertere sensitive eller konfidensielle dokumenter.
Blir bord bevart?
Enkelte tabeller konverteres noen ganger til Word-tabeller; komplekse tabeller konverteres vanligvis til formaterte avsnitt som trenger manuell omstrukturering. Planlegg å gjenskape kritiske tabeller manuelt hvis presisjon er viktig.
Er PDF-en min lastet opp til en server?
Nei. PDF-parsing bruker PDF.js og DOCX-skriving bruker JSZip – begge kjøres helt i nettleseren din.
Hva er maksimal filstørrelse?
50 MB. Praktiske grenser avhenger av dokumentets kompleksitet; en teksttung PDF av den størrelsen konverteres på sekunder, mens et grafikktungt dokument av samme størrelse kan slite.
Kan jeg konvertere passordbeskyttede PDF-filer?
Nei. PDF.js implementerer ikke dekryptering. Fjern passordet først ved å bruke et skrivebordsverktøy som qpdf eller Acrobats sikkerhetsinnstillinger.