PDF ל ממיר HTML
המר מסמכי PDF לקובצי HTML נקיים וסמנטיים ישירות בדפדפן שלך. מהיר, מאובטח ושומר על מבנה המסמך.
בחר קובץ PDF
או גרור ושחרר כאן
המר מסמכי PDF לקובצי HTML נקיים וסמנטיים ישירות בדפדפן שלך. מהיר, מאובטח ושומר על מבנה המסמך.
או גרור ושחרר כאן
המרת PDF ל-HTML הופכת מסמך בפריסה קבועה לדף אינטרנט זורם. ההמרה שומרת על תוכן טקסט, כותרות, פסקאות וסגנון בסיסי תוך נטישת פריסת הפיקסלים המדויקת של ה-PDF לטובת הזרימה הרספונסיבית של HTML. זהו הסחר הנכון עבור מסמכים המתפרסמים מחדש כתוכן אינטרנט - מאמרים, דוחות, תיעוד טכני - והמסחר השגוי עבור מסמכים שהפריסה שלהם חיונית - טפסים, חשבוניות עם מיקום קפדני, יצירות שיווק מעוצבות.
כלי זה משתמש ב-PDF.js כדי לחלץ טקסט, גופנים ומבנה בסיסי מה-PDF, ולאחר מכן כותב סימון HTML מתאים עם CSS משובץ לטיפוגרפיה. הפלט הוא קובץ html עצמאי שאתה יכול לפתוח בכל דפדפן, להדביק לתוך CMS, או סגנון נוסף עם CSS מותאם אישית. לא מתרחשת העלאה; ההמרה פועלת בדפדפן שלך.
שני סגנונות פלט נתמכים. HTML סמנטי מייצר סימון נקי עם אלמנטים של פסקה וכותרת, המתאים לפרסום מחדש של תוכן בבלוג או באתר תיעוד. HTML חזותי משמר יותר מהפריסה של ה-PDF באמצעות מיקום מוחלט, מתאים כאשר מראה המסמך חשוב יותר מאשר יכולת זרימה מחדש.
קובצי PDF לא עובדים טוב באינטרנט. דפדפנים ניידים מציגים קובצי PDF בצורה מביכה, קוראי מסך מטפלים בהם בצורה לא עקבית, מנועי חיפוש סורקים אותם אך מדרגים אותם נמוך מ-HTML מקביל, והטמעת PDF בדף אינטרנט מייצרת צופה מגושם בתוך iframe ולא חוויה מקורית. המרה ל-HTML מייצרת תוכן שעובד כמו שהרשת עובדת.
HTML ניתן גם לעריכה. ברגע שהתוכן של PDF הוא בצורת HTML, אתה יכול לשנות טיפוגרפיה, לבנות מחדש חלקים, להוסיף אלמנטים אינטראקטיביים ולשלב את התוכן עם דפי אינטרנט אחרים. PDF מתנגד לכל הפעולות הללו.
שחרר את ה-PDF, בחר סגנון פלט, הפק.
PDF.js חושף תוכן טקסט כפריטים עם תיבות תוחמות, גופנים ומחרוזות Unicode. הממיר ממיין פריטים לפי Y ואז X כדי לשחזר סדר קריאה, מקבץ פריטים בקווי בסיס דומים לשורות, ומקבץ שורות לפסקאות על סמך מרווח אנכי.
זיהוי כותרות משתמש בניתוח גודל גופן: גדלים גדולים משמעותית מגופן הגוף הופכים לכותרות, כאשר הגדולים ממופים ל-h1, הגדולים הבאים ל-h2, וכן הלאה. זיהוי רשימה מחפש שורות המתחילות בתווי תבליט או ברצפים מספריים.
הפלט HTML הוא עצמאי: doctype, ראש עם CSS מוטבע לטיפוגרפיה, גוף עם התוכן שהומר. תמונות מוטבעות מ-PDF אינן מוטמעות כעת; הם נשארים מגבלה ידועה. הפלט מאמת כ-HTML5.