Gratis omvandlare

PDF till Word (DOCX)

Extrahera text från PDF och konvertera den till redigerbart Word-format helt i din webbläsare. Snabbt, säkert och privat.

Släpp PDF-filen här

Stöder upp till 50MB

Eller

Om detta verktyg

PDF och DOCX (Microsoft Word) beskriver dokument som använder fundamentalt olika modeller. PDF är ett format med fast layout: varje glyf har en explicit position på en sida med fast storlek, vilket gör att dokumentet ser identiskt ut överallt där det renderas. DOCX är ett flödeslayoutformat: stycken, tabeller och rubriker beskrivs semantiskt, och renderingsmotorn bestämmer var de hamnar på sidan baserat på aktuell sidstorlek och teckensnittstillgänglighet. Att konvertera från PDF till DOCX innebär att omvända den fasta layouten till en semantisk struktur som Word kan omforma.

Denna omvandling är i sig förlustbringande. PDF bevarar i allmänhet inte rubriknivåer, styckegränser, liststruktur eller tabellsemantik; omvandlaren måste härleda dessa från teckenstorlekar, positioner och punkttecken. Enkla textbaserade PDF-filer konverterar rent. Komplexa PDF-filer med layouter med flera kolumner, inbäddade bilder, fotnoter eller ovanlig typografi behöver vanligtvis rengöras manuellt efter konvertering.

Det här verktyget kör konverteringen i din webbläsare med PDF.js för analys och en anpassad layout-till-DOCX-skrivare som producerar standard Office Open XML-utdata. Resultatet öppnas i Microsoft Word, LibreOffice Writer, Google Docs och alla andra DOCX-kompatibla redigerare. Ingen uppladdning sker; filen finns kvar på din enhet.

Varför konvertera PDF till DOCX

Redigerbarhet är hela anledningen. PDF är fientligt inställd till redigering – du kan fylla i formulärfält och kommentera, men du kan inte ändra text, ändra styckeformat eller omstrukturera innehåll utan specialiserade PDF-redigerare som kostar pengar och ger inkonsekventa resultat. DOCX är byggt för redigering. Att konvertera en PDF till DOCX gör innehållet lätt att hantera för revidering, översättning, återanvändning eller omdesign.

Den andra anledningen är samarbete. Word och Google Docs är lingua franca för dokumentsamarbete på kontor, skolor och de flesta organisationer. Kommentarstrådar, spåra ändringar och delad redigering förutsätter alla DOCX eller dess molnmotsvarigheter. PDF-filer som skickas för granskning blir flaskhalsar; DOCX flödar genom vanliga samarbetsverktyg.

Så här använder du det

Släpp PDF, generera, ladda ner. Räkna med att göra lite rengöring i Word efteråt.

  1. Ladda upp din PDF: Dra filen till uppladdningsområdet eller klicka för att bläddra. Filer upp till 50 MB stöds. Lösenordsskyddade PDF-filer stöds inte; ta bort lösenordet först med ett skrivbordsverktyg.
  2. Vänta på att analysera: PDF.js extraherar text, teckensnittsinformation och layoutpositioner från varje sida. Analysen tar sekunder för korta dokument och längre tid för dokument med inbäddade bilder eller komplex grafik.
  3. Konvertera: Omvandlaren går igenom det analyserade innehållet, härleder stycke- och rubrikgränser från teckenstorlekar och positioner och skriver Office Open XML till en zip-fil i minnet. Rubriker, stycken och punktlistor mappas till motsvarande DOCX-stilar.
  4. Ladda ner och rensa: Spara .docx-filen och öppna den i Word eller din föredragna redigerare. Planera att ägna några minuter åt att fixa kvarvarande problem - rubrikhierarki, listformatering, tabellgränser - som omvandlaren inte kunde sluta sig till perfekt från PDF:en.

Vanliga användningsfall

Tekniska detaljer

PDF.js analyserar varje PDF-sida till en ström av text- och grafikoperationer. Textextraktions-API:et returnerar textobjekt med sina begränsningsrutor, teckensnittsinformation och Unicode-avkodade strängar. Från dessa objekt rekonstruerar omvandlaren läsordningen genom att sortera uppifrån och ner och från vänster till höger, gruppera objekt med liknande baslinjer i rader och rader i stycken.

DOCX är ett zip-arkiv som innehåller XML-filer (document.xml, styles.xml, plus innehållstyp och relationsmanifest). Konverteraren bygger document.xml-innehållet med hjälp av en serie stycke- (w:p) och run (w:r)-element, tillämpar stilreferenser för rubriker (Rubrik 1, Rubrik 2) där teckenstorleken föreslår en rubrik, och sätter ihop zip-filen i minnet med JSZip.

Begränsningar: kolumnlayouter rekonstrueras inte alltid korrekt. Tabeller i PDF-filen återställs som stycken om inte layouten starkt antyder tabellstruktur. Rubriker, sidfötter och fotnoter hamnar vanligtvis inline i brödtexten snarare än i motsvarande DOCX-zoner. Bilder som är inbäddade i PDF-filen är för närvarande inte bevarade i DOCX-utdata.

Bästa metoder

Vanliga frågor

Ändrar konvertering av PDF till DOCX innehållet?
Innehållet bevaras så exakt som möjligt. Vissa formatspecifika funktioner kanske inte har direkta motsvarigheter, så mindre formateringsskillnader kan förekomma.
Vad används DOCX-formatet till?
DOCX (Microsoft Word Document) används främst för redigerbara textdokument med formatering.
Finns det några begränsningar att vara medveten om?
Filer upp till 50 MB stöds. Mycket stora eller komplexa filer kan ta längre tid att bearbeta. All konvertering sker i din webbläsare, så bearbetningshastigheten beror på din enhet.
Är mina dokumentdata säkra?
Ja. Dokumentbehandling körs helt i din webbläsare. Dina filer och deras innehåll laddas aldrig upp till någon server. Detta gör det säkert att konvertera känsliga eller konfidentiella dokument.
Kommer borden att bevaras?
Enkla tabeller konverteras ibland till Word-tabeller; komplexa tabeller konverteras vanligtvis till formaterade stycken som behöver omstruktureras manuellt. Planera att återskapa kritiska tabeller manuellt om precisionen spelar roll.
Är min PDF uppladdad till en server?
Nej. PDF-tolkning använder PDF.js och DOCX-skrivning använder JSZip – båda körs helt i din webbläsare.
Vad är den maximala filstorleken?
50 MB. Praktiska begränsningar beror på dokumentets komplexitet; en texttung PDF av den storleken konverteras på några sekunder, medan ett grafiktungt dokument av samma storlek kan kämpa.
Kan jag konvertera lösenordsskyddade PDF-filer?
Nej. PDF.js implementerar inte dekryptering. Ta bort lösenordet först med ett skrivbordsverktyg som qpdf eller Acrobats säkerhetsinställningar.