मोफत कनवर्टर

PDF to एक्सेल (XLSX) कनवर्टर

PDF मधून सारण्या आणि मजकूर काढा आणि त्यांना तुमच्या ब्राउझरमध्ये सुरक्षितपणे Excel XLSX स्प्रेडशीटमध्ये रूपांतरित करा.

PDF फाईल इथे टाका

किंवा फाइल निवडण्यासाठी क्लिक करा

किंवा

या साधनाबद्दल

टॅब्युलर डेटा PDF मधून बाहेर काढणे आणि स्प्रेडशीटमध्ये काढणे हे इनव्हॉइस, आर्थिक अहवाल, वैज्ञानिक कागदपत्रे आणि सरकारी डेटा हाताळणाऱ्या कार्यालयांमध्ये सर्वात सामान्य दस्तऐवज कार्यप्रवाहांपैकी एक आहे. पीडीएफ फॉरमॅट नेटिव्हली टेबल्स समजत नाही — ते फक्त पेजवरील ग्लिफ पोझिशन्सचे वर्णन करते — म्हणून एक्सेलमध्ये रुपांतरित करण्यासाठी मजकुराच्या भूमितीवरून टेबल स्ट्रक्चर काढणे आवश्यक आहे. एक सेल कोठे संपतो आणि दुसरा सुरू होतो याचा अंदाज क्षैतिज व्हाईटस्पेसवरून केला पाहिजे; जिथे एक पंक्ती संपते आणि दुसरी सुरू होते, उभ्या व्हाइटस्पेसमधून.

हे टूल PDF.js वापरून पीडीएफचे विश्लेषण करते, मजकूर आयटम त्यांच्या बाउंडिंग बॉक्ससह काढते आणि स्थानाच्या आधारावर आयटमला पंक्ती आणि स्तंभांमध्ये क्लस्टर करते. शोधलेले टेबल शीटजेएस xlsx लायब्ररी वापरून एक्सेल वर्कबुकमध्ये लिहिलेले आहे. आउटपुट ही एक मानक .xlsx फाईल आहे जी Excel, Google Sheets, Numbers किंवा इतर कोणत्याही स्प्रेडशीट ऍप्लिकेशनमध्ये उघडते.

पीडीएफ सारणी काढणे खरोखर कठीण आहे आणि कोणताही एक्स्ट्रॅक्टर प्रत्येक पीडीएफवर परिपूर्ण परिणाम देत नाही. सुसंगत स्तंभ सीमा, कोणतेही विलीन केलेले सेल आणि स्पष्ट अनुलंब संरेखन असलेली सारण्या स्वच्छपणे रूपांतरित होतात. विलीन केलेले सेल, मल्टी-लाइन एंट्री, तळटीप किंवा असामान्य मांडणी असलेल्या टेबल्सना विशेषत: एक्सट्रॅक्शन नंतर मॅन्युअल क्लीनअपची आवश्यकता असते. पुनरावलोकनासाठी योजना.

पीडीएफ एक्सेलमध्ये का रूपांतरित करा

कारण जवळजवळ नेहमीच विश्लेषण असते. PDF मध्ये अडकलेला डेटा क्रमवारी, फिल्टर, बेरीज, चार्ट किंवा पिव्होटेड केला जाऊ शकत नाही. एकदा ते एक्सेलमध्ये आले की, प्रत्येक मानक स्प्रेडशीट ऑपरेशन उपलब्ध होते — आणि ते स्थिर अहवालाकडे टक लावून पाहणे आणि त्यातील संख्यांसह प्रत्यक्षात काम करणे यामधील फरक उघडते.

पीडीएफमध्ये मोठ्या प्रमाणात डेटा काम करणे अशक्य आहे. एकाधिक पीडीएफ अहवालांमध्ये त्रैमासिक आकडे एकत्रित करणे, विक्रेत्यांमधील लाइन आयटमची तुलना करणे किंवा डाउनस्ट्रीम विश्लेषणासाठी विशिष्ट स्तंभ खेचणे या सर्वांसाठी त्या ऑपरेशन्सना समर्थन देणाऱ्या फॉरमॅटमध्ये डेटा मिळणे आवश्यक आहे. Excel आणि CSV हे ते स्वरूप आहेत. धर्मांतर हा पूल आहे.

कसे वापरावे

टॅब्युलर डेटा असलेली पीडीएफ ड्रॉप करा, प्रत्येक टेबलसह त्याच्या स्वतःच्या शीटवर एक वर्कबुक मिळवा.

  1. तुमची PDF अपलोड करा: फाइल अपलोड क्षेत्रात ड्रॅग करा किंवा ब्राउझ करण्यासाठी क्लिक करा. 50 MB पर्यंतच्या फायली समर्थित आहेत. पीडीएफमध्ये वास्तविक मजकूर असणे आवश्यक आहे; स्कॅन केलेल्या PDF ला प्रथम OCR आवश्यक आहे.
  2. टेबल शोधण्याची प्रतीक्षा करा: PDF.js मजकूर आयटम आणि त्यांची स्थिती काढते. कनव्हर्टर क्षैतिज आणि अनुलंब संरेखनाचे विश्लेषण करून पंक्ती आणि स्तंभांमध्ये आयटम क्लस्टर करतो. लहान दस्तऐवजांसाठी काही सेकंद आणि बहु-पृष्ठ सारण्यांसाठी जास्त वेळ लागतो.
  3. आढळलेल्या सारण्यांचे पुनरावलोकन करा: डाऊनलोड करण्यापूर्वी आढळलेल्या सारण्यांचे पूर्वावलोकन केले जाते. स्तंभ आणि पंक्ती तुमच्या अपेक्षेशी जुळत असल्याची पुष्टी करा; येथे चुकीचे संरेखन नंतर एक्सेल क्लीनअप बनतात.
  4. XLSX म्हणून डाउनलोड करा: कनव्हर्टर प्रत्येक शोधलेले टेबल शीटजेएस वापरून .xlsx वर्कबुकमध्ये वेगळ्या शीटवर लिहितो. निकाल Excel किंवा Google Sheets मध्ये उघडा आणि कोणत्याही उरलेल्या समस्या साफ करा.

सामान्य वापर प्रकरणे

तांत्रिक तपशील

PDF.js एक getTextContent API उघड करते जे मजकूर आयटम त्यांच्या बाउंडिंग बॉक्ससह परत करते. प्रत्येक आयटममध्ये एक स्ट्रिंग, ट्रान्सफॉर्म मॅट्रिक्स (स्थिती आणि रोटेशनसाठी) आणि रुंदी/उंची असते. कनव्हर्टर रेषा ओळखण्यासाठी Y- समन्वयानुसार आयटमची क्रमवारी लावतो, नंतर प्रत्येक ओळीत X- समन्वयाने. अगदी समान Y स्थानावरील आयटम एक पंक्ती तयार करतात.

कॉलम डिटेक्शन गॅप ॲनालिसिसचा वापर करते: एका ओळीतील एकापाठोपाठ आयटममधील X-अंतर ते एकाच सेलचे किंवा समीप सेलचे आहेत की नाही हे सूचित करते. थ्रेशोल्डपेक्षा मोठे अंतर (सामान्यत: 1-2 वर्ण रुंदी) स्तंभ सीमा दर्शवते. थ्रेशोल्ड ट्यूनिंग समीप स्तंभ विलीन करणे आणि एकल स्तंभ विभाजित करणे दरम्यान व्यवहार करते.

एक्सेल आउटपुट मेमरीमध्ये वर्कबुक तयार करण्यासाठी SheetJS चा वापर करते, प्रत्येक डिटेक्ट केलेले टेबल शीट1, शीट2, इ. नावाच्या स्वतःच्या शीटवर असते. वर्कबुक .xlsx (ऑफिस ओपन XML) फॉरमॅटमध्ये अनुक्रमित केले जाते आणि डाउनलोड म्हणून ऑफर केले जाते. निकाल Excel 2007+, Google Sheets, LibreOffice Calc आणि Apple Numbers मध्ये उघडतो.

सर्वोत्तम पद्धती

वारंवार विचारले जाणारे प्रश्न

पीडीएफला एक्सेलमध्ये रूपांतरित केल्याने सामग्री बदलते का?
सामग्री शक्य तितक्या अचूकपणे जतन केली जाते. तथापि, काही स्वरूप-विशिष्ट वैशिष्ट्यांमध्ये थेट समतुल्य असू शकत नाही, म्हणून किरकोळ स्वरूपन फरक येऊ शकतात.
EXCEL फॉरमॅट कशासाठी वापरला जातो?
XLSX (मायक्रोसॉफ्ट एक्सेल स्प्रेडशीट) प्रामुख्याने सूत्रे, चार्ट आणि डेटा विश्लेषणासह स्प्रेडशीटसाठी वापरली जाते.
जाणीव ठेवण्यासाठी काही मर्यादा आहेत का?
50MB पर्यंत फायली समर्थित आहेत. खूप मोठ्या किंवा जटिल फायलींवर प्रक्रिया करण्यासाठी जास्त वेळ लागू शकतो. सर्व रूपांतरण तुमच्या ब्राउझरमध्ये होते, त्यामुळे प्रक्रियेचा वेग तुमच्या डिव्हाइसवर अवलंबून असतो.
माझा दस्तऐवज डेटा सुरक्षित आहे का?
होय. दस्तऐवज प्रक्रिया पूर्णपणे तुमच्या ब्राउझरमध्ये चालते. तुमच्या फायली आणि त्यांची सामग्री कधीही कोणत्याही सर्व्हरवर अपलोड केली जात नाही. हे संवेदनशील किंवा गोपनीय दस्तऐवज रूपांतरित करणे सुरक्षित करते.
कोणते आउटपुट स्वरूप तयार केले जाते?
.xlsx (Office Open XML), आधुनिक एक्सेल फॉरमॅट. फाईल Excel 2007+, Google Sheets, LibreOffice Calc, Apple Numbers आणि इतर कोणत्याही आधुनिक स्प्रेडशीटमध्ये उघडते.
माझी पीडीएफ सर्व्हरवर अपलोड केली आहे का?
नाही. PDF.js आणि SheetJS वापरून तुमच्या ब्राउझरमध्ये पार्सिंग आणि एक्सेल निर्मिती होते.
कमाल फाइल आकार किती आहे?
50 MB रूपांतरण वेळ केवळ फाइल आकारापेक्षा दस्तऐवजाच्या जटिलतेवर अवलंबून असते — ग्राफिक्स-हेवी 50 MB PDF ला मजकूर-हेवीपेक्षा काढण्यासाठी जास्त वेळ लागू शकतो.
माझे नंबर चुकीच्या कॉलममध्ये का आहेत?
जवळजवळ नेहमीच कारण कनवर्टरचा स्तंभ शोध थ्रेशोल्ड PDF च्या वास्तविक लेआउटशी जुळत नाही. स्रोत पीडीएफ उघडा, स्तंभ दृष्यदृष्ट्या कुठे तुटतात ते पहा आणि आवश्यकतेनुसार एक्सेलमधील सेल मॅन्युअली शिफ्ट करा.