PDF க்கு எக்செல் (XLSX) மாற்றி
PDF இலிருந்து அட்டவணைகள் மற்றும் உரையைப் பிரித்தெடுத்து அவற்றை உங்கள் உலாவியில் பாதுகாப்பாக Excel XLSX விரிதாள்களாக மாற்றவும்.
PDF கோப்பை இங்கே விடுங்கள்
அல்லது கோப்பைத் தேர்ந்தெடுக்க கிளிக் செய்யவும்
PDF இலிருந்து அட்டவணைகள் மற்றும் உரையைப் பிரித்தெடுத்து அவற்றை உங்கள் உலாவியில் பாதுகாப்பாக Excel XLSX விரிதாள்களாக மாற்றவும்.
அல்லது கோப்பைத் தேர்ந்தெடுக்க கிளிக் செய்யவும்
அட்டவணைத் தரவை PDF இலிருந்து வெளியே இழுப்பது மற்றும் ஒரு விரிதாளில் இன்வாய்ஸ்கள், நிதி அறிக்கைகள், அறிவியல் ஆவணங்கள் மற்றும் அரசாங்கத் தரவுகளைக் கையாளும் அலுவலகங்களில் மிகவும் பொதுவான ஆவணப் பணிப்பாய்வுகளில் ஒன்றாகும். PDF வடிவமானது அட்டவணைகளைப் புரிந்து கொள்ளவில்லை - இது ஒரு பக்கத்தில் உள்ள கிளிஃப் நிலைகளை விவரிக்கிறது - எனவே எக்செல் ஆக மாற்றுவதற்கு உரையின் வடிவவியலில் இருந்து அட்டவணை அமைப்பை ஊகிக்க வேண்டும். ஒரு செல் முடிந்து அடுத்தது தொடங்கும் இடத்தில் கிடைமட்ட இடைவெளியில் இருந்து யூகிக்கப்பட வேண்டும்; செங்குத்து இடைவெளியில் இருந்து ஒரு வரிசை முடிந்து அடுத்தது தொடங்கும் இடத்தில்.
இந்தக் கருவி PDF.jsஐப் பயன்படுத்தி PDFஐப் பாகுபடுத்துகிறது, உரை உருப்படிகளை அவற்றின் எல்லைப் பெட்டிகளுடன் பிரித்தெடுக்கிறது, மேலும் நிலையின் அடிப்படையில் உருப்படிகளை வரிசைகள் மற்றும் நெடுவரிசைகளாகக் கொத்தாக அமைக்கிறது. கண்டறியப்பட்ட அட்டவணை SheetJS xlsx நூலகத்தைப் பயன்படுத்தி Excel பணிப்புத்தகத்தில் எழுதப்பட்டது. வெளியீடு என்பது எக்செல், கூகுள் தாள்கள், எண்கள் அல்லது வேறு ஏதேனும் விரிதாள் பயன்பாட்டில் திறக்கும் நிலையான .xlsx கோப்பாகும்.
PDF அட்டவணையைப் பிரித்தெடுப்பது மிகவும் கடினமானது, மேலும் எந்தப் பிரித்தெடுத்தலும் ஒவ்வொரு PDFகளிலும் சரியான முடிவுகளைத் தருவதில்லை. நிலையான நெடுவரிசை எல்லைகள், இணைக்கப்பட்ட கலங்கள் இல்லை மற்றும் தெளிவான செங்குத்து சீரமைப்பு கொண்ட அட்டவணைகள் சுத்தமாக மாற்றப்படும். இணைக்கப்பட்ட கலங்கள், பல வரி உள்ளீடுகள், அடிக்குறிப்புகள் அல்லது அசாதாரண தளவமைப்புகள் கொண்ட அட்டவணைகள் பொதுவாக பிரித்தெடுத்த பிறகு கைமுறையாக சுத்தம் செய்ய வேண்டும். மதிப்பாய்வுக்கான திட்டம்.
காரணம் கிட்டத்தட்ட எப்போதும் பகுப்பாய்வு ஆகும். PDF இல் சிக்கியுள்ள தரவை வரிசைப்படுத்தவோ, வடிகட்டவோ, சுருக்கவோ, பட்டியலிடவோ அல்லது மையப்படுத்தவோ முடியாது. இது எக்செல் இல் இருந்தால், ஒவ்வொரு நிலையான விரிதாள் செயல்பாடும் கிடைக்கும் - மேலும் இது நிலையான அறிக்கையை உற்று நோக்குவதற்கும் அதில் உள்ள எண்களுடன் உண்மையில் வேலை செய்வதற்கும் உள்ள வித்தியாசத்தைத் திறக்கிறது.
மொத்த தரவு வேலை PDF இல் சாத்தியமற்றது. பல PDF அறிக்கைகள் முழுவதும் காலாண்டு புள்ளிவிவரங்களை ஒருங்கிணைத்தல், விற்பனையாளர்கள் முழுவதும் வரி உருப்படிகளை ஒப்பிடுதல் அல்லது கீழ்நிலை பகுப்பாய்விற்காக குறிப்பிட்ட நெடுவரிசைகளை இழுத்தல் ஆகிய அனைத்திற்கும் அந்த செயல்பாடுகளை ஆதரிக்கும் வடிவமைப்பிற்கு தரவைப் பெற வேண்டும். எக்செல் மற்றும் சிஎஸ்வி ஆகியவை அந்த வடிவங்கள். மாற்றமே பாலம்.
அட்டவணைத் தரவைக் கொண்ட PDFஐ விடுங்கள், ஒவ்வொரு அட்டவணையுடனும் அதன் சொந்த தாளில் பணிப்புத்தகத்தைப் பெறுங்கள்.
PDF.js ஒரு getTextContent API ஐ அம்பலப்படுத்துகிறது, இது உரை உருப்படிகளை அவற்றின் எல்லைப் பெட்டிகளுடன் வழங்குகிறது. ஒவ்வொரு பொருளுக்கும் ஒரு சரம், ஒரு உருமாற்ற அணி (நிலை மற்றும் சுழற்சிக்கு) மற்றும் அகலம்/உயரம் உள்ளது. மாற்றி, கோடுகளை அடையாளம் காண Y-கோர்டினேட் மூலம் உருப்படிகளை வரிசைப்படுத்துகிறது, பின்னர் ஒவ்வொரு வரியிலும் எக்ஸ்-கோஆர்டினேட் மூலம் வரிசைப்படுத்துகிறது. மிகவும் ஒத்த Y நிலைகளில் உள்ள உருப்படிகள் ஒரு வரிசையை உருவாக்குகின்றன.
நெடுவரிசை கண்டறிதல் இடைவெளி பகுப்பாய்வைப் பயன்படுத்துகிறது: ஒரு வரிசையில் உள்ள தொடர்ச்சியான உருப்படிகளுக்கு இடையிலான X- தூரம் அவை ஒரே செல் அல்லது அருகிலுள்ள கலங்களைச் சேர்ந்ததா என்பதைக் குறிக்கிறது. வாசலை விட பெரிய இடைவெளி (பொதுவாக 1-2 எழுத்து அகலங்கள்) ஒரு நெடுவரிசை எல்லையைக் குறிக்கிறது. த்ரெஷோல்ட் ட்யூனிங் அருகிலுள்ள நெடுவரிசைகளை ஒன்றிணைப்பதற்கும் ஒற்றை நெடுவரிசைகளைப் பிரிப்பதற்கும் இடையில் வர்த்தகம் செய்கிறது.
Excel வெளியீடு SheetJS ஐப் பயன்படுத்தி நினைவகத்தில் பணிப்புத்தகத்தை உருவாக்குகிறது, ஒவ்வொரு கண்டறியப்பட்ட அட்டவணையும் அதன் சொந்த தாளில் Sheet1, Sheet2, முதலியன பெயரிடப்பட்டுள்ளது. பணிப்புத்தகம் .xlsx (Office Open XML) வடிவத்தில் வரிசைப்படுத்தப்பட்டு பதிவிறக்கமாக வழங்கப்படுகிறது. முடிவு Excel 2007+, Google Sheets, LibreOffice Calc மற்றும் Apple எண்களில் திறக்கப்படும்.