Penukar Percuma

PDF ke Word (DOCX)

Ekstrak teks daripada PDF dan tukarkannya kepada format Word boleh diedit sepenuhnya dalam penyemak imbas anda. Cepat, selamat dan peribadi.

Lepaskan fail PDF di sini

Menyokong sehingga 50MB

Ataupun

Tentang alat ini

PDF dan DOCX (Microsoft Word) menerangkan dokumen menggunakan model asas yang berbeza. PDF ialah format susun atur tetap: setiap glyph mempunyai kedudukan yang jelas pada halaman bersaiz tetap, menjadikan dokumen kelihatan sama di mana-mana sahaja ia dipaparkan. DOCX ialah format susun atur aliran: perenggan, jadual dan tajuk diterangkan secara semantik, dan enjin pemaparan menentukan tempat ia jatuh pada halaman berdasarkan saiz halaman semasa dan ketersediaan fon. Menukar daripada PDF kepada DOCX bermakna kejuruteraan terbalik reka letak tetap menjadi struktur semantik yang Word boleh mengalir semula.

Penukaran ini sememangnya lossy. PDF secara amnya tidak mengekalkan tahap tajuk, sempadan perenggan, struktur senarai atau semantik jadual; penukar perlu membuat kesimpulan ini daripada saiz fon, kedudukan dan aksara peluru. PDF berasaskan teks ringkas ditukar dengan bersih. PDF yang kompleks dengan reka letak berbilang lajur, imej terbenam, nota kaki atau tipografi yang luar biasa biasanya memerlukan pembersihan manual selepas penukaran.

Alat ini menjalankan penukaran dalam penyemak imbas anda menggunakan PDF.js untuk menghurai dan penulis reka letak-ke-DOCX tersuai yang menghasilkan output XML Office Open standard. Hasilnya dibuka dalam Microsoft Word, LibreOffice Writer, Google Docs dan mana-mana editor serasi DOCX yang lain. Tiada muat naik berlaku; fail kekal pada peranti anda.

Mengapa Tukar PDF kepada DOCX

Keboleheditan adalah sebab keseluruhannya. PDF memusuhi pengeditan — anda boleh mengisi medan borang dan memberi anotasi, tetapi anda tidak boleh mengalirkan semula teks, menukar gaya perenggan atau menstruktur semula kandungan tanpa editor PDF khusus yang memerlukan wang dan menghasilkan hasil yang tidak konsisten. DOCX dibina untuk penyuntingan. Menukar PDF kepada DOCX menjadikan kandungan itu boleh diurus untuk semakan, terjemahan, tujuan semula atau reka bentuk semula.

Sebab lain ialah kerjasama. Word dan Google Docs ialah lingua franca kerjasama dokumen di pejabat, sekolah dan kebanyakan organisasi. Urutan ulasan, perubahan jejak dan pengeditan dikongsi semuanya menganggap DOCX atau setara awannya. PDF yang dihantar untuk semakan menjadi kesesakan; DOCX mengalir melalui alat kerjasama standard.

Cara menggunakan

Lepaskan PDF, jana, muat turun. Jangkakan untuk melakukan pembersihan dalam Word selepas itu.

  1. Muat naik PDF anda: Seret fail ke dalam kawasan muat naik atau klik untuk menyemak imbas. Fail sehingga 50 MB disokong. PDF yang dilindungi kata laluan tidak disokong; alih keluar kata laluan dahulu menggunakan alat desktop.
  2. Tunggu penghuraian: PDF.js mengekstrak teks, maklumat fon dan kedudukan reka letak daripada setiap halaman. Penghuraian mengambil beberapa saat untuk dokumen pendek dan lebih lama untuk dokumen dengan imej terbenam atau grafik kompleks.
  3. Tukar: Penukar menjalankan kandungan yang dihuraikan, membuat kesimpulan perenggan dan sempadan tajuk daripada saiz dan kedudukan fon, dan menulis Office Open XML ke fail zip dalam memori. Tajuk, perenggan dan senarai titik tumpu dipetakan kepada gaya DOCX yang setara.
  4. Muat turun dan bersihkan: Simpan fail .docx dan bukanya dalam Word atau editor pilihan anda. Rancang untuk meluangkan beberapa minit untuk membetulkan isu baki — hierarki tajuk, pemformatan senarai, sempadan jadual — yang penukar tidak dapat membuat kesimpulan dengan sempurna daripada PDF.

Kes Penggunaan Biasa

Butiran Teknikal

PDF.js menghuraikan setiap halaman PDF ke dalam aliran teks dan operasi grafik. API pengekstrakan teks mengembalikan item teks dengan kotak sempadannya, maklumat fon dan rentetan dinyahkod Unikod. Daripada item ini penukar membina semula susunan bacaan dengan mengisih dari atas ke bawah dan kiri ke kanan, mengumpulkan item dengan garis dasar yang serupa ke dalam baris dan baris ke dalam perenggan.

DOCX ialah arkib zip yang mengandungi fail XML (document.xml, styles.xml, serta jenis kandungan dan manifes perhubungan). Penukar membina kandungan document.xml menggunakan satu siri elemen perenggan (w:p) dan jalankan (w:r), menggunakan rujukan gaya untuk tajuk (Tajuk 1, Tajuk 2) di mana saiz fon mencadangkan tajuk dan memasang zip dalam memori menggunakan JSZip.

Had: reka letak lajur tidak selalu dibina semula dengan betul. Jadual dalam PDF dipulihkan sebagai perenggan melainkan reka letak sangat mencadangkan struktur jadual. Pengepala, pengaki dan nota kaki biasanya berakhir sebaris dalam badan dan bukannya dalam zon DOCX yang sepadan. Imej yang dibenamkan dalam PDF tidak disimpan dalam output DOCX pada masa ini.

Amalan Terbaik

Soalan lazim

Adakah penukaran PDF kepada DOCX mengubah kandungan?
Kandungannya dipelihara setepat mungkin. Walau bagaimanapun, sesetengah ciri khusus format mungkin tidak mempunyai persamaan langsung, jadi perbezaan pemformatan kecil boleh berlaku.
Apakah format DOCX digunakan?
DOCX (Microsoft Word Document) digunakan terutamanya untuk dokumen teks boleh diedit dengan pemformatan.
Adakah terdapat sebarang batasan yang perlu diketahui?
Fail sehingga 50MB disokong. Fail yang sangat besar atau kompleks mungkin mengambil masa yang lebih lama untuk diproses. Semua penukaran berlaku dalam penyemak imbas anda, jadi kelajuan pemprosesan bergantung pada peranti anda.
Adakah data dokumen saya selamat?
ya. Pemprosesan dokumen berjalan sepenuhnya dalam penyemak imbas anda. Fail anda dan kandungannya tidak pernah dimuat naik ke mana-mana pelayan. Ini menjadikannya selamat untuk menukar dokumen sensitif atau sulit.
Adakah meja akan dipelihara?
Jadual mudah kadangkala bertukar menjadi jadual Word; jadual kompleks biasanya ditukar kepada perenggan berformat yang memerlukan penstrukturan semula manual. Rancang untuk mencipta semula jadual kritikal secara manual jika ketepatan penting.
Adakah PDF saya dimuat naik ke pelayan?
Tidak. Penghuraian PDF menggunakan PDF.js dan penulisan DOCX menggunakan JSZip — kedua-duanya dijalankan sepenuhnya dalam penyemak imbas anda.
Apakah saiz fail maksimum?
50 MB. Had praktikal bergantung pada kerumitan dokumen; PDF seberat teks dengan saiz itu bertukar dalam beberapa saat, manakala dokumen berat grafik dengan saiz yang sama mungkin sukar.
Bolehkah saya menukar PDF yang dilindungi kata laluan?
Tidak. PDF.js tidak melaksanakan penyahsulitan. Alih keluar kata laluan dahulu menggunakan alat desktop seperti qpdf atau tetapan keselamatan Acrobat.