PDF ไปที่ เวิร์ด (DOCX)
แยกข้อความจาก PDF และแปลงเป็นรูปแบบ Word ที่แก้ไขได้ทั้งหมดในเบราว์เซอร์ของคุณ รวดเร็ว ปลอดภัย และเป็นส่วนตัว
วางไฟล์ PDF ที่นี่
รองรับได้ถึง 50MB
แยกข้อความจาก PDF และแปลงเป็นรูปแบบ Word ที่แก้ไขได้ทั้งหมดในเบราว์เซอร์ของคุณ รวดเร็ว ปลอดภัย และเป็นส่วนตัว
รองรับได้ถึง 50MB
PDF และ DOCX (Microsoft Word) อธิบายเอกสารโดยใช้โมเดลที่แตกต่างกันโดยพื้นฐาน PDF เป็นรูปแบบเค้าโครงคงที่: สัญลักษณ์ทุกอันมีตำแหน่งที่ชัดเจนบนหน้าที่มีขนาดคงที่ ทำให้เอกสารดูเหมือนกันทุกที่ที่แสดงผล DOCX เป็นรูปแบบเค้าโครงโฟลว์: ย่อหน้า ตาราง และส่วนหัวได้รับการอธิบายตามความหมาย และกลไกการเรนเดอร์จะตัดสินใจว่าจะอยู่ตรงไหนบนหน้าตามขนาดหน้าปัจจุบันและความพร้อมใช้งานของแบบอักษร การแปลงจาก PDF เป็น DOCX หมายถึงการทำวิศวกรรมย้อนกลับเค้าโครงคงที่ให้เป็นโครงสร้างความหมายที่ Word สามารถปรับเปลี่ยนได้
การแปลงนี้มีการสูญเสียโดยธรรมชาติ โดยทั่วไป PDF จะไม่รักษาระดับหัวเรื่อง ขอบเขตของย่อหน้า โครงสร้างรายการ หรือความหมายของตาราง ตัวแปลงจะต้องอนุมานสิ่งเหล่านี้จากขนาดตัวอักษร ตำแหน่ง และอักขระสัญลักษณ์แสดงหัวข้อย่อย PDF แบบข้อความธรรมดาแปลงได้อย่างหมดจด PDF ที่ซับซ้อนซึ่งมีเค้าโครงหลายคอลัมน์ รูปภาพที่ฝัง เชิงอรรถ หรือการพิมพ์ที่ผิดปกติ มักจะต้องมีการล้างข้อมูลด้วยตนเองหลังการแปลง
เครื่องมือนี้เรียกใช้การแปลงในเบราว์เซอร์ของคุณโดยใช้ PDF.js สำหรับการแยกวิเคราะห์และตัวเขียนเค้าโครงเป็น DOCX แบบกำหนดเองที่สร้างเอาต์พุต Office Open XML มาตรฐาน ผลลัพธ์จะเปิดขึ้นใน Microsoft Word, LibreOffice Writer, Google Docs และโปรแกรมแก้ไขอื่นๆ ที่เข้ากันได้กับ DOCX ไม่มีการอัปโหลดเกิดขึ้น ไฟล์จะยังคงอยู่ในอุปกรณ์ของคุณ
ความสามารถในการแก้ไขคือเหตุผลทั้งหมด PDF ไม่เป็นมิตรต่อการแก้ไข คุณสามารถกรอกข้อมูลในฟิลด์แบบฟอร์มและใส่คำอธิบายประกอบได้ แต่คุณไม่สามารถจัดวางข้อความ เปลี่ยนรูปแบบย่อหน้า หรือปรับโครงสร้างเนื้อหาใหม่ได้ หากไม่มีโปรแกรมแก้ไข PDF พิเศษที่เสียค่าใช้จ่ายและให้ผลลัพธ์ที่ไม่สอดคล้องกัน DOCX สร้างขึ้นเพื่อการแก้ไข การแปลง PDF เป็น DOCX ทำให้เนื้อหาง่ายต่อการแก้ไข แปล ปรับใช้ใหม่ หรือออกแบบใหม่
อีกเหตุผลหนึ่งคือการทำงานร่วมกัน Word และ Google Docs เป็นภาษากลางของการทำงานร่วมกันในเอกสารในสำนักงาน โรงเรียน และองค์กรส่วนใหญ่ เธรดความคิดเห็น ติดตามการเปลี่ยนแปลง และการแก้ไขที่แชร์ ล้วนถือว่า DOCX หรือระบบคลาวด์ที่เทียบเท่ากัน ไฟล์ PDF ที่ส่งเพื่อตรวจสอบจะกลายเป็นปัญหาคอขวด DOCX ไหลผ่านเครื่องมือการทำงานร่วมกันมาตรฐาน
วาง PDF สร้าง ดาวน์โหลด คาดว่าจะทำการล้างข้อมูลใน Word ในภายหลัง
PDF.js แยกวิเคราะห์หน้า PDF แต่ละหน้าเป็นสตรีมการดำเนินการข้อความและกราฟิก API การแยกข้อความส่งคืนรายการข้อความพร้อมกล่องขอบ ข้อมูลแบบอักษร และสตริงที่ถอดรหัส Unicode จากรายการเหล่านี้ ตัวแปลงจะสร้างลำดับการอ่านใหม่โดยการเรียงลำดับจากบนลงล่างและจากซ้ายไปขวา จัดกลุ่มรายการที่มีเส้นพื้นฐานที่คล้ายกันเป็นบรรทัดและบรรทัดเป็นย่อหน้า
DOCX เป็นไฟล์ ZIP ที่ประกอบด้วยไฟล์ XML (document.xml, styles.xml รวมถึงประเภทเนื้อหาและรายการความสัมพันธ์) ตัวแปลงสร้างเนื้อหา document.xml โดยใช้ชุดขององค์ประกอบย่อหน้า (w:p) และเรียกใช้ (w:r) ใช้การอ้างอิงสไตล์สำหรับส่วนหัว (ส่วนหัว 1, ส่วนหัว 2) โดยที่ขนาดแบบอักษรแนะนำส่วนหัว และประกอบ zip ในหน่วยความจำโดยใช้ JSZip
ข้อจำกัด: เค้าโครงคอลัมน์ไม่ได้ถูกสร้างขึ้นใหม่อย่างถูกต้องเสมอไป ตารางใน PDF จะถูกกู้คืนเป็นย่อหน้า เว้นแต่เค้าโครงจะแนะนำโครงสร้างตารางอย่างยิ่ง โดยทั่วไปแล้วส่วนหัว ส่วนท้าย และเชิงอรรถจะอยู่ในบรรทัดเนื้อหา แทนที่จะอยู่ในโซน DOCX ที่สอดคล้องกัน ขณะนี้รูปภาพที่ฝังอยู่ใน PDF จะไม่ถูกเก็บรักษาไว้ในเอาต์พุต DOCX