PDF ไปที่ ตัวแปลง HTML
แปลงเอกสาร PDF เป็นไฟล์ HTML ที่สะอาดและมีความหมายได้โดยตรงในเบราว์เซอร์ของคุณ รวดเร็ว ปลอดภัย และรักษาโครงสร้างเอกสาร
เลือกไฟล์ PDF
หรือลากและวางที่นี่
แปลงเอกสาร PDF เป็นไฟล์ HTML ที่สะอาดและมีความหมายได้โดยตรงในเบราว์เซอร์ของคุณ รวดเร็ว ปลอดภัย และรักษาโครงสร้างเอกสาร
หรือลากและวางที่นี่
การแปลง PDF เป็น HTML จะแปลงเอกสารที่มีรูปแบบตายตัวให้เป็นหน้าเว็บที่ลื่นไหล การแปลงจะรักษาเนื้อหาข้อความ ส่วนหัว ย่อหน้า และการจัดรูปแบบพื้นฐาน ในขณะที่ละทิ้งเค้าโครงพิกเซลที่แน่นอนของ PDF และหันไปใช้โฟลว์แบบตอบสนองของ HTML นี่คือการแลกเปลี่ยนที่ถูกต้องสำหรับเอกสารที่เผยแพร่ซ้ำในรูปแบบเนื้อหาเว็บ — บทความ รายงาน เอกสารทางเทคนิค — และการแลกเปลี่ยนที่ไม่ถูกต้องสำหรับเอกสารที่มีเค้าโครงที่จำเป็น — แบบฟอร์ม ใบแจ้งหนี้ที่มีจุดยืนที่เข้มงวด ชิ้นส่วนทางการตลาดที่ออกแบบมา
เครื่องมือนี้ใช้ PDF.js เพื่อแยกข้อความ แบบอักษร และโครงสร้างพื้นฐานจาก PDF จากนั้นเขียนมาร์กอัป HTML ที่เกี่ยวข้องด้วย CSS ที่ฝังไว้สำหรับการพิมพ์ ผลลัพธ์จะเป็นไฟล์ .html แบบสแตนด์อโลนที่คุณสามารถเปิดในเบราว์เซอร์ใดก็ได้ วางใน CMS หรือจัดรูปแบบเพิ่มเติมด้วย CSS ที่กำหนดเอง ไม่มีการอัปโหลดเกิดขึ้น การแปลงทำงานในเบราว์เซอร์ของคุณ
รองรับเอาต์พุตสองสไตล์ Semantic HTML สร้างมาร์กอัปที่ชัดเจนพร้อมองค์ประกอบย่อหน้าและส่วนหัว เหมาะสำหรับการเผยแพร่เนื้อหาซ้ำในบล็อกหรือไซต์เอกสารประกอบ Visual HTML จะรักษาเค้าโครงของ PDF ไว้มากขึ้นผ่านการวางตำแหน่งที่แน่นอน ซึ่งเหมาะสมเมื่อรูปลักษณ์ของเอกสารมีความสำคัญมากกว่าความสามารถในการไหลซ้ำ
PDF ทำงานได้ไม่ดีบนเว็บ เบราว์เซอร์มือถือแสดงผล PDF อย่างเชื่องช้า โปรแกรมอ่านหน้าจอจัดการไฟล์เหล่านั้นอย่างไม่สอดคล้องกัน โปรแกรมค้นหารวบรวมข้อมูล แต่จัดอันดับไฟล์ PDF ไว้ต่ำกว่า HTML ที่เทียบเท่า และการฝัง PDF ในหน้าเว็บจะสร้างโปรแกรมดูใน iframe ที่ดูเทอะทะ แทนที่จะเป็นประสบการณ์ดั้งเดิม การแปลงเป็น HTML จะสร้างเนื้อหาที่ทำงานในลักษณะเดียวกับเว็บ
HTML ก็สามารถแก้ไขได้เช่นกัน เมื่อเนื้อหาของ PDF อยู่ในรูปแบบ HTML คุณสามารถเปลี่ยนการพิมพ์ ปรับโครงสร้างส่วน เพิ่มองค์ประกอบแบบโต้ตอบ และรวมเนื้อหาเข้ากับหน้าเว็บอื่น ๆ ได้ PDF ต่อต้านการดำเนินการเหล่านั้นทั้งหมด
วาง PDF เลือกรูปแบบเอาต์พุต สร้าง
PDF.js เปิดเผยเนื้อหาข้อความเป็นรายการที่มีกล่องล้อมรอบ แบบอักษร และสตริง Unicode ตัวแปลงจะจัดเรียงรายการตาม Y จากนั้น X เพื่อกู้คืนลำดับการอ่าน จัดกลุ่มรายการที่บรรทัดฐานที่คล้ายกันให้เป็นบรรทัด และจัดกลุ่มบรรทัดเป็นย่อหน้าตามระยะห่างในแนวตั้ง
การตรวจจับส่วนหัวใช้การวิเคราะห์ขนาดแบบอักษร: ขนาดที่ใหญ่กว่าแบบอักษรเนื้อหาจะกลายเป็นส่วนหัว โดยขนาดที่ใหญ่ที่สุดจะจับคู่กับ h1 ขนาดที่ใหญ่ที่สุดรองลงมาคือ h2 และอื่นๆ การตรวจหารายการจะค้นหาบรรทัดที่ขึ้นต้นด้วยอักขระสัญลักษณ์แสดงหัวข้อย่อยหรือลำดับตัวเลข
HTML เอาต์พุตมีอยู่ในตัวเอง: ประเภทเอกสาร, ส่วนหัวพร้อม CSS สำหรับการพิมพ์, เนื้อหาพร้อมเนื้อหาที่แปลงแล้ว รูปภาพอินไลน์จาก PDF ไม่ได้ถูกฝังอยู่ในขณะนี้ มันยังคงเป็นข้อจำกัดที่ทราบกันดีอยู่แล้ว ผลลัพธ์จะตรวจสอบเป็น HTML5