PDF to HTML कनवर्टर
पीडीएफ दस्तऐवज थेट तुमच्या ब्राउझरमध्ये स्वच्छ, अर्थपूर्ण HTML फाइल्समध्ये रूपांतरित करा. जलद, सुरक्षित आणि दस्तऐवज संरचना संरक्षित करते.
पीडीएफ फाइल निवडा
किंवा येथे ड्रॅग आणि ड्रॉप करा
पीडीएफ दस्तऐवज थेट तुमच्या ब्राउझरमध्ये स्वच्छ, अर्थपूर्ण HTML फाइल्समध्ये रूपांतरित करा. जलद, सुरक्षित आणि दस्तऐवज संरचना संरक्षित करते.
किंवा येथे ड्रॅग आणि ड्रॉप करा
पीडीएफला एचटीएमएलमध्ये रूपांतरित केल्याने निश्चित लेआउट दस्तऐवज प्रवाहित वेब पृष्ठामध्ये रूपांतरित होते. रूपांतरण HTML च्या प्रतिसादात्मक प्रवाहाच्या बाजूने PDF च्या अचूक पिक्सेल लेआउटचा त्याग करताना मजकूर सामग्री, शीर्षके, परिच्छेद आणि मूलभूत शैली जतन करते. वेब सामग्री — लेख, अहवाल, तांत्रिक दस्तऐवज — आणि ज्या कागदपत्रांची मांडणी आवश्यक आहे — फॉर्म, कडक पोझिशनिंगसह पावत्या, डिझाइन केलेले मार्केटिंग तुकडे — म्हणून पुनर्प्रकाशित केल्या जाणाऱ्या दस्तऐवजांसाठी हा योग्य व्यापार आहे.
हे साधन PDF मधून मजकूर, फॉन्ट आणि मूलभूत रचना काढण्यासाठी PDF.js वापरते, त्यानंतर टायपोग्राफीसाठी एम्बेडेड CSS सह संबंधित HTML मार्कअप लिहिते. आउटपुट ही एक स्वतंत्र .html फाईल आहे जी तुम्ही कोणत्याही ब्राउझरमध्ये उघडू शकता, CMS मध्ये पेस्ट करू शकता किंवा कस्टम CSS सह पुढील शैली करू शकता. अपलोड होत नाही; रूपांतरण आपल्या ब्राउझरमध्ये चालते.
दोन आउटपुट शैली समर्थित आहेत. सिमेंटिक HTML परिच्छेद आणि शीर्षक घटकांसह स्वच्छ मार्कअप तयार करते, ब्लॉग किंवा दस्तऐवजीकरण साइटवर सामग्री पुनर्प्रकाशित करण्यासाठी योग्य. व्हिज्युअल एचटीएमएल पीडीएफचे अधिक लेआउट परिपूर्ण पोझिशनिंगद्वारे संरक्षित करते, जेव्हा दस्तऐवजाचे स्वरूप पुन्हा-प्रवाहक्षमतेपेक्षा अधिक महत्त्वाचे असते तेव्हा योग्य असते.
PDF वेबवर चांगले काम करत नाहीत. मोबाइल ब्राउझर पीडीएफ अस्ताव्यस्तपणे रेंडर करतात, स्क्रीन रीडर त्यांना विसंगतपणे हाताळतात, शोध इंजिन त्यांना क्रॉल करतात परंतु त्यांना समतुल्य HTML पेक्षा कमी रँक देतात आणि वेबपृष्ठामध्ये PDF एम्बेड केल्याने मूळ अनुभवाऐवजी एक क्लंकी इन-इफ्रेम दर्शक तयार होतो. HTML मध्ये रूपांतरित केल्याने आशय तयार होतो जो वेब प्रमाणे कार्य करते.
HTML देखील संपादन करण्यायोग्य आहे. एकदा PDF ची सामग्री HTML फॉर्ममध्ये आली की, तुम्ही टायपोग्राफी बदलू शकता, विभागांची पुनर्रचना करू शकता, परस्परसंवादी घटक जोडू शकता आणि सामग्री इतर वेब पृष्ठांसह समाकलित करू शकता. पीडीएफ त्या सर्व ऑपरेशन्सचा प्रतिकार करते.
पीडीएफ ड्रॉप करा, आउटपुट शैली निवडा, जनरेट करा.
PDF.js मजकूर सामग्री बाउंडिंग बॉक्स, फॉन्ट आणि युनिकोड स्ट्रिंगसह आयटम म्हणून उघड करते. कनव्हर्टर वाचन क्रम पुनर्प्राप्त करण्यासाठी Y नंतर X नुसार आयटमची क्रमवारी लावतो, समान आधाररेषेवरील आयटमचे रेषांमध्ये गट करतो आणि उभ्या अंतरावर आधारित परिच्छेदांमध्ये रेषा क्लस्टर करतो.
हेडिंग डिटेक्शन फॉन्ट-आकार विश्लेषण वापरते: बॉडी फॉन्टपेक्षा लक्षणीय मोठे आकार हेडिंग बनतात, सर्वात मोठे h1 वर मॅप केलेले, पुढील-सर्वात मोठे h2 आणि असेच. सूची शोध बुलेट वर्ण किंवा अंकीय अनुक्रमांपासून सुरू होणाऱ्या रेषा शोधते.
आउटपुट HTML स्वयं-समाविष्ट आहे: doctype, टायपोग्राफीसाठी एम्बेडेड CSS सह हेड, रूपांतरित सामग्रीसह मुख्य भाग. PDF मधील इनलाइन प्रतिमा सध्या एम्बेड केलेल्या नाहीत; ते ज्ञात मर्यादा राहतात. आउटपुट HTML5 म्हणून प्रमाणित होते.