แปลงฟรี

PDF ไปที่ เวิร์ด (DOCX)

แยกข้อความจาก PDF และแปลงเป็นรูปแบบ Word ที่แก้ไขได้ทั้งหมดในเบราว์เซอร์ของคุณ รวดเร็ว ปลอดภัย และเป็นส่วนตัว

วางไฟล์ PDF ที่นี่

รองรับได้ถึง 50MB

หรือ

เกี่ยวกับเครื่องมือนี้

PDF และ DOCX (Microsoft Word) อธิบายเอกสารโดยใช้โมเดลที่แตกต่างกันโดยพื้นฐาน PDF เป็นรูปแบบเค้าโครงคงที่: สัญลักษณ์ทุกอันมีตำแหน่งที่ชัดเจนบนหน้าที่มีขนาดคงที่ ทำให้เอกสารดูเหมือนกันทุกที่ที่แสดงผล DOCX เป็นรูปแบบเค้าโครงโฟลว์: ย่อหน้า ตาราง และส่วนหัวได้รับการอธิบายตามความหมาย และกลไกการเรนเดอร์จะตัดสินใจว่าจะอยู่ตรงไหนบนหน้าตามขนาดหน้าปัจจุบันและความพร้อมใช้งานของแบบอักษร การแปลงจาก PDF เป็น DOCX หมายถึงการทำวิศวกรรมย้อนกลับเค้าโครงคงที่ให้เป็นโครงสร้างความหมายที่ Word สามารถปรับเปลี่ยนได้

การแปลงนี้มีการสูญเสียโดยธรรมชาติ โดยทั่วไป PDF จะไม่รักษาระดับหัวเรื่อง ขอบเขตของย่อหน้า โครงสร้างรายการ หรือความหมายของตาราง ตัวแปลงจะต้องอนุมานสิ่งเหล่านี้จากขนาดตัวอักษร ตำแหน่ง และอักขระสัญลักษณ์แสดงหัวข้อย่อย PDF แบบข้อความธรรมดาแปลงได้อย่างหมดจด PDF ที่ซับซ้อนซึ่งมีเค้าโครงหลายคอลัมน์ รูปภาพที่ฝัง เชิงอรรถ หรือการพิมพ์ที่ผิดปกติ มักจะต้องมีการล้างข้อมูลด้วยตนเองหลังการแปลง

เครื่องมือนี้เรียกใช้การแปลงในเบราว์เซอร์ของคุณโดยใช้ PDF.js สำหรับการแยกวิเคราะห์และตัวเขียนเค้าโครงเป็น DOCX แบบกำหนดเองที่สร้างเอาต์พุต Office Open XML มาตรฐาน ผลลัพธ์จะเปิดขึ้นใน Microsoft Word, LibreOffice Writer, Google Docs และโปรแกรมแก้ไขอื่นๆ ที่เข้ากันได้กับ DOCX ไม่มีการอัปโหลดเกิดขึ้น ไฟล์จะยังคงอยู่ในอุปกรณ์ของคุณ

ทำไมต้องแปลง PDF เป็น DOCX

ความสามารถในการแก้ไขคือเหตุผลทั้งหมด PDF ไม่เป็นมิตรต่อการแก้ไข คุณสามารถกรอกข้อมูลในฟิลด์แบบฟอร์มและใส่คำอธิบายประกอบได้ แต่คุณไม่สามารถจัดวางข้อความ เปลี่ยนรูปแบบย่อหน้า หรือปรับโครงสร้างเนื้อหาใหม่ได้ หากไม่มีโปรแกรมแก้ไข PDF พิเศษที่เสียค่าใช้จ่ายและให้ผลลัพธ์ที่ไม่สอดคล้องกัน DOCX สร้างขึ้นเพื่อการแก้ไข การแปลง PDF เป็น DOCX ทำให้เนื้อหาง่ายต่อการแก้ไข แปล ปรับใช้ใหม่ หรือออกแบบใหม่

อีกเหตุผลหนึ่งคือการทำงานร่วมกัน Word และ Google Docs เป็นภาษากลางของการทำงานร่วมกันในเอกสารในสำนักงาน โรงเรียน และองค์กรส่วนใหญ่ เธรดความคิดเห็น ติดตามการเปลี่ยนแปลง และการแก้ไขที่แชร์ ล้วนถือว่า DOCX หรือระบบคลาวด์ที่เทียบเท่ากัน ไฟล์ PDF ที่ส่งเพื่อตรวจสอบจะกลายเป็นปัญหาคอขวด DOCX ไหลผ่านเครื่องมือการทำงานร่วมกันมาตรฐาน

วิธีใช้งาน

วาง PDF สร้าง ดาวน์โหลด คาดว่าจะทำการล้างข้อมูลใน Word ในภายหลัง

  1. อัปโหลด PDF ของคุณ: ลากไฟล์ไปไว้ในพื้นที่อัพโหลดหรือคลิกเพื่อเรียกดู รองรับไฟล์ขนาดสูงสุด 50 MB ไม่รองรับ PDF ที่มีการป้องกันด้วยรหัสผ่าน ลบรหัสผ่านก่อนโดยใช้เครื่องมือเดสก์ท็อป
  2. รอการแยกวิเคราะห์: PDF.js แยกข้อความ ข้อมูลแบบอักษร และตำแหน่งเค้าโครงจากแต่ละหน้า การแยกวิเคราะห์ใช้เวลาไม่กี่วินาทีสำหรับเอกสารขนาดสั้น และนานกว่าสำหรับเอกสารที่มีรูปภาพฝังหรือกราฟิกที่ซับซ้อน
  3. แปลง: ตัวแปลงจะเดินเนื้อหาที่แยกวิเคราะห์ อนุมานย่อหน้าและขอบเขตส่วนหัวจากขนาดแบบอักษรและตำแหน่ง และเขียน Office Open XML ลงในไฟล์ zip ในหน่วยความจำ หัวเรื่อง ย่อหน้า และรายการหัวข้อย่อยจะถูกแมปกับสไตล์ DOCX ที่เทียบเท่ากัน
  4. ดาวน์โหลดและทำความสะอาด: บันทึกไฟล์ .docx และเปิดใน Word หรือโปรแกรมแก้ไขที่คุณต้องการ วางแผนที่จะใช้เวลาสองสามนาทีในการแก้ไขปัญหาที่เหลือ เช่น ลำดับชั้นของส่วนหัว การจัดรูปแบบรายการ ขอบเขตของตาราง ซึ่งตัวแปลงไม่สามารถสรุปจาก PDF ได้อย่างสมบูรณ์

กรณีการใช้งานทั่วไป

รายละเอียดทางเทคนิค

PDF.js แยกวิเคราะห์หน้า PDF แต่ละหน้าเป็นสตรีมการดำเนินการข้อความและกราฟิก API การแยกข้อความส่งคืนรายการข้อความพร้อมกล่องขอบ ข้อมูลแบบอักษร และสตริงที่ถอดรหัส Unicode จากรายการเหล่านี้ ตัวแปลงจะสร้างลำดับการอ่านใหม่โดยการเรียงลำดับจากบนลงล่างและจากซ้ายไปขวา จัดกลุ่มรายการที่มีเส้นพื้นฐานที่คล้ายกันเป็นบรรทัดและบรรทัดเป็นย่อหน้า

DOCX เป็นไฟล์ ZIP ที่ประกอบด้วยไฟล์ XML (document.xml, styles.xml รวมถึงประเภทเนื้อหาและรายการความสัมพันธ์) ตัวแปลงสร้างเนื้อหา document.xml โดยใช้ชุดขององค์ประกอบย่อหน้า (w:p) และเรียกใช้ (w:r) ใช้การอ้างอิงสไตล์สำหรับส่วนหัว (ส่วนหัว 1, ส่วนหัว 2) โดยที่ขนาดแบบอักษรแนะนำส่วนหัว และประกอบ zip ในหน่วยความจำโดยใช้ JSZip

ข้อจำกัด: เค้าโครงคอลัมน์ไม่ได้ถูกสร้างขึ้นใหม่อย่างถูกต้องเสมอไป ตารางใน PDF จะถูกกู้คืนเป็นย่อหน้า เว้นแต่เค้าโครงจะแนะนำโครงสร้างตารางอย่างยิ่ง โดยทั่วไปแล้วส่วนหัว ส่วนท้าย และเชิงอรรถจะอยู่ในบรรทัดเนื้อหา แทนที่จะอยู่ในโซน DOCX ที่สอดคล้องกัน ขณะนี้รูปภาพที่ฝังอยู่ใน PDF จะไม่ถูกเก็บรักษาไว้ในเอาต์พุต DOCX

แนวทางปฏิบัติที่ดีที่สุด

คำถามที่พบบ่อย

การแปลง PDF เป็น DOCX เปลี่ยนแปลงเนื้อหาหรือไม่
เนื้อหาจะถูกเก็บรักษาไว้อย่างถูกต้องที่สุด อย่างไรก็ตาม คุณลักษณะเฉพาะบางรูปแบบอาจไม่เทียบเท่าโดยตรง ดังนั้นการจัดรูปแบบเล็กน้อยจึงอาจเกิดขึ้นได้
รูปแบบ DOCX ใช้ทำอะไร?
DOCX (เอกสาร Microsoft Word) ใช้สำหรับเอกสารข้อความที่แก้ไขได้ด้วยการจัดรูปแบบเป็นหลัก
มีข้อจำกัดที่ต้องทราบหรือไม่?
รองรับไฟล์ขนาดสูงสุด 50MB ไฟล์ที่มีขนาดใหญ่มากหรือซับซ้อนอาจใช้เวลาในการประมวลผลนานกว่า การแปลงทั้งหมดเกิดขึ้นในเบราว์เซอร์ของคุณ ดังนั้นความเร็วในการประมวลผลจึงขึ้นอยู่กับอุปกรณ์ของคุณ
ข้อมูลเอกสารของฉันปลอดภัยหรือไม่?
ใช่. การประมวลผลเอกสารทำงานได้อย่างสมบูรณ์ในเบราว์เซอร์ของคุณ ไฟล์และเนื้อหาของคุณจะไม่ถูกอัปโหลดไปยังเซิร์ฟเวอร์ใดๆ ทำให้ปลอดภัยในการแปลงเอกสารที่ละเอียดอ่อนหรือเป็นความลับ
ตารางจะถูกเก็บรักษาไว้หรือไม่?
บางครั้งตารางแบบธรรมดาจะแปลงเป็นตาราง Word; โดยทั่วไปตารางที่ซับซ้อนจะแปลงเป็นย่อหน้าที่จัดรูปแบบซึ่งต้องมีการปรับโครงสร้างใหม่ด้วยตนเอง วางแผนที่จะสร้างตารางที่สำคัญขึ้นใหม่ด้วยตนเองหากความแม่นยำมีความสำคัญ
PDF ของฉันถูกอัพโหลดไปยังเซิร์ฟเวอร์หรือไม่?
ไม่ การแยกวิเคราะห์ PDF ใช้ PDF.js และการเขียน DOCX ใช้ JSZip — ทั้งสองทำงานทั้งหมดในเบราว์เซอร์ของคุณ
ขนาดไฟล์สูงสุดคือเท่าไร?
50 เมกะไบต์ ข้อจำกัดในทางปฏิบัติขึ้นอยู่กับความซับซ้อนของเอกสาร PDF ที่มีข้อความหนักขนาดนั้นจะแปลงเป็นวินาที ในขณะที่เอกสารที่มีกราฟิกหนักๆ ที่มีขนาดเท่ากันอาจประสบปัญหาได้
ฉันสามารถแปลง PDF ที่มีการป้องกันด้วยรหัสผ่านได้หรือไม่
ไม่ PDF.js ไม่ได้ใช้การถอดรหัส ลบรหัสผ่านก่อนโดยใช้เครื่องมือเดสก์ท็อป เช่น qpdf หรือการตั้งค่าความปลอดภัยของ Acrobat