मुफ्त कनवर्टर

PDF से HTML कनवर्टर

ब्राउज़र में सीधे PDF दस्तावेज़ों को स्वच्छ, सिमेंटिक HTML फ़ाइलों में बदलें। तेज़, सुरक्षित और दस्तावेज़ संरचना को सुरक्षित रखता है।

PDF फ़ाइल चुनें

या यहाँ खींचें और छोड़ें

या

इस टूल के बारे में

पीडीएफ को HTML में परिवर्तित करने से एक निश्चित-लेआउट दस्तावेज़ एक प्रवाहित वेब पेज में बदल जाता है। रूपांतरण HTML के प्रतिक्रियाशील प्रवाह के पक्ष में पीडीएफ के सटीक पिक्सेल लेआउट को त्यागते हुए पाठ सामग्री, शीर्षकों, पैराग्राफ और बुनियादी स्टाइल को संरक्षित करता है। यह वेब सामग्री के रूप में पुनः प्रकाशित किए जा रहे दस्तावेज़ों के लिए सही व्यापार है - लेख, रिपोर्ट, तकनीकी दस्तावेज़ीकरण - और उन दस्तावेज़ों के लिए ग़लत व्यापार है जिनका लेआउट आवश्यक है - फॉर्म, सख्त स्थिति वाले चालान, डिज़ाइन किए गए विपणन टुकड़े।

यह टूल पीडीएफ से टेक्स्ट, फ़ॉन्ट और बुनियादी संरचना निकालने के लिए पीडीएफ.जेएस का उपयोग करता है, फिर टाइपोग्राफी के लिए एम्बेडेड सीएसएस के साथ संबंधित HTML मार्कअप लिखता है। आउटपुट एक स्टैंडअलोन .html फ़ाइल है जिसे आप किसी भी ब्राउज़र में खोल सकते हैं, सीएमएस में पेस्ट कर सकते हैं, या कस्टम सीएसएस के साथ आगे स्टाइल कर सकते हैं। कोई अपलोड नहीं होता; रूपांतरण आपके ब्राउज़र में चलता है.

दो आउटपुट शैलियाँ समर्थित हैं। सिमेंटिक HTML पैराग्राफ और शीर्षक तत्वों के साथ स्वच्छ मार्कअप तैयार करता है, जो ब्लॉग या दस्तावेज़ीकरण साइट पर सामग्री को पुनः प्रकाशित करने के लिए उपयुक्त है। विज़ुअल HTML पूर्ण स्थिति के माध्यम से पीडीएफ के अधिक लेआउट को संरक्षित करता है, यह तब उपयुक्त होता है जब दस्तावेज़ की उपस्थिति पुन: प्रवाह क्षमता से अधिक मायने रखती है।

पीडीएफ को HTML में क्यों बदलें?

पीडीएफ़ वेब पर ठीक से काम नहीं करते। मोबाइल ब्राउज़र पीडीएफ को अजीब तरीके से प्रस्तुत करते हैं, स्क्रीन रीडर उन्हें असंगत तरीके से संभालते हैं, खोज इंजन उन्हें क्रॉल करते हैं लेकिन समकक्ष HTML से कम रैंक करते हैं, और एक वेबपेज में पीडीएफ को एम्बेड करने से मूल अनुभव के बजाय एक भद्दा इन-आईफ्रेम व्यूअर उत्पन्न होता है। HTML में कनवर्ट करने से ऐसी सामग्री उत्पन्न होती है जो वेब के काम करने के तरीके से काम करती है।

HTML भी संपादन योग्य है. एक बार पीडीएफ की सामग्री HTML फॉर्म में हो जाने पर, आप टाइपोग्राफी बदल सकते हैं, अनुभागों का पुनर्गठन कर सकते हैं, इंटरैक्टिव तत्व जोड़ सकते हैं और सामग्री को अन्य वेब पेजों के साथ एकीकृत कर सकते हैं। पीडीएफ उन सभी परिचालनों का विरोध करता है।

कैसे उपयोग करें

पीडीएफ छोड़ें, आउटपुट शैली चुनें, जेनरेट करें।

  1. अपना पीडीएफ अपलोड करें: फ़ाइल को अपलोड क्षेत्र में खींचें या ब्राउज़ करने के लिए क्लिक करें। 50 एमबी तक की फ़ाइलें समर्थित हैं। पासवर्ड से सुरक्षित पीडीएफ़ समर्थित नहीं हैं; पहले सुरक्षा हटाएँ.
  2. आउटपुट शैली चुनें: सिमेंटिक HTML पैराग्राफ और शीर्षक टैग के साथ प्रवाहपूर्ण सामग्री तैयार करता है। विज़ुअल HTML पूर्ण CSS के माध्यम से PDF की स्थिति को सुरक्षित रखता है। पुनर्प्रकाशन के लिए सिमेंटिक चुनें, लेआउट-महत्वपूर्ण दस्तावेज़ों के लिए विज़ुअल चुनें।
  3. कनवर्ट करें: PDF.js टेक्स्ट और लेआउट निकालता है। कनवर्टर फ़ॉन्ट आकार को शीर्षक स्तरों पर मैप करता है, पैराग्राफ ब्रेक की पहचान करता है, और टाइपोग्राफी के लिए सीएसएस स्टाइल के साथ HTML उत्सर्जित करता है। सामान्य दस्तावेज़ों के लिए रूपांतरण में कुछ सेकंड लगते हैं।
  4. HTML डाउनलोड करें: .html फ़ाइल सहेजें. पूर्वावलोकन करने के लिए इसे किसी भी ब्राउज़र में खोलें। सीएमएस में सामग्री का उपयोग करने के लिए, आंतरिक सामग्री की प्रतिलिपि बनाएँ और संपादक में पेस्ट करें।

सामान्य उपयोग के मामले

तकनीकी विवरण

PDF.js टेक्स्ट सामग्री को बाउंडिंग बॉक्स, फ़ॉन्ट और यूनिकोड स्ट्रिंग वाले आइटम के रूप में प्रदर्शित करता है। कनवर्टर पढ़ने के क्रम को पुनर्प्राप्त करने के लिए वस्तुओं को Y और फिर X के आधार पर क्रमबद्ध करता है, समान आधार रेखाओं पर वस्तुओं को पंक्तियों में समूहित करता है, और ऊर्ध्वाधर रिक्ति के आधार पर पंक्तियों को पैराग्राफ में समूहित करता है।

शीर्षक पहचान फ़ॉन्ट-आकार विश्लेषण का उपयोग करती है: मुख्य फ़ॉन्ट की तुलना में काफी बड़े आकार शीर्षक बन जाते हैं, सबसे बड़े को h1 में मैप किया जाता है, अगले सबसे बड़े को h2 में मैप किया जाता है, और इसी तरह। सूची पहचान बुलेट वर्णों या संख्यात्मक अनुक्रमों से शुरू होने वाली पंक्तियों की तलाश करती है।

आउटपुट HTML स्व-निहित है: डॉकटाइप, टाइपोग्राफी के लिए एम्बेडेड सीएसएस के साथ हेड, परिवर्तित सामग्री के साथ बॉडी। पीडीएफ से इनलाइन छवियां वर्तमान में एम्बेडेड नहीं हैं; वे एक ज्ञात सीमा बने हुए हैं। आउटपुट HTML5 के रूप में मान्य होता है।

सर्वोत्तम प्रथाएँ

अक्सर पूछे जाने वाले प्रश्न

क्या पीडीएफ को एचटीएमएल में बदलने से सामग्री बदल जाती है?
सामग्री को यथासंभव सटीकता से संरक्षित किया गया है। हालाँकि, कुछ प्रारूप-विशिष्ट सुविधाओं में प्रत्यक्ष समकक्ष नहीं हो सकते हैं, इसलिए मामूली स्वरूपण अंतर हो सकते हैं।
HTML फॉर्मेट का उपयोग किसके लिए किया जाता है?
HTML (हाइपरटेक्स्ट मार्कअप लैंग्वेज) का उपयोग मुख्य रूप से वेब पेजों और वेब सामग्री के लिए किया जाता है।
क्या जागरूक होने के लिए कोई सीमाएँ हैं?
50एमबी तक की फ़ाइलें समर्थित हैं। बहुत बड़ी या जटिल फ़ाइलों को संसाधित होने में अधिक समय लग सकता है। सभी रूपांतरण आपके ब्राउज़र में होते हैं, इसलिए प्रसंस्करण गति आपके डिवाइस पर निर्भर करती है।
क्या मेरा दस्तावेज़ डेटा सुरक्षित है?
हाँ। दस्तावेज़ प्रसंस्करण पूरी तरह से आपके ब्राउज़र में चलता है। आपकी फ़ाइलें और उनकी सामग्री कभी भी किसी सर्वर पर अपलोड नहीं की जाती हैं। इससे संवेदनशील या गोपनीय दस्तावेज़ों को परिवर्तित करना सुरक्षित हो जाता है।
क्या आउटपुट मोबाइल-अनुकूल है?
सिमेंटिक मोड ऐसी सामग्री उत्पन्न करता है जो किसी भी चौड़ाई में फिट होने के लिए प्रवाहित होती है। विज़ुअल मोड पूर्ण स्थिति का उपयोग करता है जो छोटी स्क्रीन के अनुकूल नहीं होता है। मोबाइल के लिए, सिमेंटिक मोड का उपयोग करें.
क्या मेरा पीडीएफ सर्वर पर अपलोड किया गया है?
नहीं, PDF.js आपके ब्राउज़र में चलता है; फ़ाइल आपके डिवाइस को नहीं छोड़ती है.
अधिकतम फ़ाइल आकार क्या है?
50 एमबी. बड़े दस्तावेज़ों को पार्स करने में अधिक समय लगता है।
क्या मैं रूपांतरण के बाद HTML को संपादित कर सकता हूँ?
हाँ - यह मुद्दे का हिस्सा है। आउटपुट एम्बेडेड सीएसएस के साथ सादा HTML है, जिसे किसी भी टेक्स्ट एडिटर में संपादित करना या सीएमएस में पेस्ट करना आसान है।