Ingyenes konverter

PDF ide Word (DOCX)

Kivonja a szöveget a PDF-ből, és konvertálja szerkeszthető Word formátumba a böngészőjében. Gyors, biztonságos és privát.

Húzza ide a PDF fájlt

50 MB-ig támogat

Vagy

Az eszközről

A PDF és a DOCX (Microsoft Word) alapvetően eltérő modellekkel ír le dokumentumokat. A PDF egy rögzített elrendezésű formátum: minden karakterjelnek van egy explicit pozíciója egy rögzített méretű oldalon, így a dokumentum mindenhol azonosnak tűnik, ahol előállítják. A DOCX egy folyamatelrendezésű formátum: a bekezdések, táblázatok és fejlécek szemantikai leírása, és a megjelenítőmotor az aktuális oldalméret és a betűkészlet rendelkezésre állása alapján dönti el, hogy hol esnek az oldalon. A PDF-ből DOCX-re konvertálás azt jelenti, hogy a rögzített elrendezést szemantikai struktúrává alakítják, amelyet a Word újra tud folyni.

Ez az átalakítás eleve veszteséges. A PDF általában nem őrzi meg a címsorszinteket, a bekezdéshatárokat, a listaszerkezetet vagy a táblázat szemantikáját; a konverternek ezekre a betűméretekből, -pozíciókból és a felsorolásjelekből kell következtetnie. Az egyszerű szöveg alapú PDF-ek tiszta konvertálása. A többoszlopos elrendezésű, beágyazott képekkel, lábjegyzetekkel vagy szokatlan tipográfiával rendelkező összetett PDF-fájlok általában kézi tisztítást igényelnek az átalakítás után.

Ez az eszköz a böngészőben futtatja a konvertálást PDF.js fájl elemzéséhez és egy egyedi elrendezés DOCX-íróhoz, amely szabványos Office Open XML kimenetet állít elő. Az eredmény megnyílik a Microsoft Wordben, a LibreOffice Writerben, a Google Docsban és bármely más DOCX-kompatibilis szerkesztőben. Nem történik feltöltés; a fájl az eszközön marad.

Miért konvertálhat PDF-et DOCX-re?

A szerkeszthetőség a teljes ok. A PDF ellenséges a szerkesztéssel szemben – kitöltheti az űrlapmezőket és megjegyzéseket fűzhet hozzá, de nem lehet áttördelni a szöveget, módosítani a bekezdésstílusokat vagy átstrukturálni a tartalmat speciális PDF-szerkesztők nélkül, amelyek pénzbe kerülnek, és következetlen eredményeket produkálnak. A DOCX szerkesztésre készült. A PDF DOCX formátumba konvertálása nyomon követhetővé teszi a tartalom átdolgozását, fordítását, újrahasznosítását vagy újratervezését.

A másik ok az együttműködés. A Word és a Google Dokumentumok az irodák, iskolák és a legtöbb szervezet dokumentum-együttműködésének nyelve. A megjegyzésszálak, a módosítások nyomon követése és a megosztott szerkesztés mind DOCX-et vagy felhőbeli megfelelőjét feltételezik. A felülvizsgálatra küldött PDF-ek szűk keresztmetszetekké válnak; A DOCX szabványos együttműködési eszközökön keresztül folyik.

Használati útmutató

Dobd el a PDF-et, generáld, töltsd le. Várhatóan utána végez egy kis takarítást a Wordben.

  1. Töltse fel PDF-jét: Húzza a fájlt a feltöltési területre, vagy kattintson a böngészéshez. 50 MB-ig terjedő fájlok támogatottak. A jelszóval védett PDF-fájlok nem támogatottak; először távolítsa el a jelszót egy asztali eszköz segítségével.
  2. Várja meg az elemzést: A PDF.js minden oldalról kivonja a szöveget, a betűtípus-információkat és az elrendezési pozíciókat. Az elemzés másodperceket vesz igénybe rövid dokumentumok esetén, és tovább tart a beágyazott képeket vagy összetett grafikát tartalmazó dokumentumoknál.
  3. Konvertálni: A konverter végigjárja az elemzett tartalmat, kikövetkezteti a bekezdés- és fejléchatárokat a betűméretek és -pozíciók alapján, és az Office Open XML-t a memóriában lévő zip fájlba írja. A címsorok, bekezdések és felsorolásjelek a megfelelő DOCX-stílusokhoz vannak leképezve.
  4. Töltse le és tisztítsa meg: Mentse el a .docx fájlt, és nyissa meg a Wordben vagy a kívánt szerkesztőben. Tervezzen néhány percet a fennmaradó problémák – címsorhierarchia, listaformázás, táblázathatárok – kijavítására, amelyeket a konverter nem tudott tökéletesen kikövetkeztetni a PDF-ből.

Gyakori használati esetek

Műszaki részletek

A PDF.js minden PDF-oldalt szöveges és grafikus műveletek folyamává elemez. A szövegkivonási API a szövegelemeket határolókeretekkel, betűtípus-információkkal és Unicode-dekódolt karakterláncokkal adja vissza. Ezekből az elemekből a konverter úgy rekonstruálja az olvasási sorrendet, hogy felülről lefelé és balról jobbra rendezi, a hasonló alapvonalú elemeket sorokba, a sorokat pedig bekezdésekbe csoportosítja.

A DOCX egy zip-archívum, amely XML-fájlokat (document.xml, styles.xml, valamint tartalomtípus- és kapcsolatjegyzékek) tartalmaz. A konverter a document.xml tartalmat egy sor bekezdés (w:p) és run (w:r) elemekkel építi fel, stílushivatkozásokat alkalmaz a címsorokhoz (Heading 1, Heading 2), ahol a betűméret címsort sugall, és összeállítja a zip-et a memóriában a JSZip segítségével.

Korlátozások: az oszlopelrendezések nem mindig vannak megfelelően rekonstruálva. A PDF-ben lévő táblázatok bekezdésként kerülnek visszaállításra, kivéve, ha az elrendezés határozottan táblázatos szerkezetre utal. A fejlécek, láblécek és lábjegyzetek általában a törzsben, nem pedig a megfelelő DOCX zónákban kerülnek sorba. A PDF-be ágyazott képek jelenleg nem őrződnek meg a DOCX kimenetben.

Legjobb gyakorlatok

Gyakran ismételt kérdések

A PDF DOCX-re konvertálása megváltoztatja a tartalmat?
A tartalom a lehető legpontosabban megőrződik. Előfordulhat azonban, hogy egyes formátum-specifikus funkciók nem rendelkeznek közvetlen megfelelőkkel, így kisebb formázási eltérések léphetnek fel.
Mire használható a DOCX formátum?
A DOCX-et (Microsoft Word Document) elsősorban formázással ellátott, szerkeszthető szöveges dokumentumokhoz használják.
Vannak-e korlátozások, amelyekkel tisztában kell lenni?
A fájlok legfeljebb 50 MB-ig támogatottak. A nagyon nagy vagy összetett fájlok feldolgozása tovább tarthat. Minden átalakítás a böngészőben történik, így a feldolgozás sebessége az eszköztől függ.
Biztonságban vannak a dokumentumaim?
Igen. A dokumentumfeldolgozás teljes egészében a böngészőben fut. A fájlok és azok tartalma soha nem töltődik fel egyetlen szerverre sem. Ez biztonságossá teszi az érzékeny vagy bizalmas dokumentumok konvertálását.
Megőrzik az asztalokat?
Az egyszerű táblázatok néha Word-táblázatokká konvertálódnak; az összetett táblázatok általában formázott bekezdésekké alakulnak, amelyek kézi átstrukturálást igényelnek. Tervezze meg a kritikus táblák manuális újralétrehozását, ha a pontosság számít.
Fel van töltve a PDF-em egy szerverre?
Nem. A PDF-elemzés PDF.js-t, a DOCX-írás pedig JSZip-et használ – mindkettő teljes egészében a böngészőben fut.
Mi a maximális fájlméret?
50 MB. A gyakorlati korlátok a dokumentum összetettségétől függenek; egy ekkora szöveges PDF-fájl másodpercek alatt konvertálódik, míg egy ugyanilyen méretű, nagy grafikát tartalmazó dokumentum nehézségekbe ütközhet.
Átalakíthatom a jelszóval védett PDF-eket?
Nem. A PDF.js nem valósítja meg a visszafejtést. Először távolítsa el a jelszót egy asztali eszköz, például a qpdf vagy az Acrobat biztonsági beállításai segítségével.