ఉచిత కన్వర్టర్

PDF కు ఎక్సెల్ (XLSX) కన్వర్టర్

PDF నుండి పట్టికలు మరియు వచనాన్ని సంగ్రహించి, వాటిని మీ బ్రౌజర్‌లో సురక్షితంగా Excel XLSX స్ప్రెడ్‌షీట్‌లకు మార్చండి.

PDF ఫైల్‌ను ఇక్కడ వదలండి

లేదా ఫైల్‌ని ఎంచుకోవడానికి క్లిక్ చేయండి

లేదా

ఈ సాధనం గురించి

ఇన్‌వాయిస్‌లు, ఆర్థిక నివేదికలు, శాస్త్రీయ పత్రాలు మరియు ప్రభుత్వ డేటాను నిర్వహించే కార్యాలయాలలో అత్యంత సాధారణ డాక్యుమెంట్ వర్క్‌ఫ్లోలలో PDF నుండి మరియు స్ప్రెడ్‌షీట్‌లోకి టేబుల్ డేటాను లాగడం ఒకటి. PDF ఆకృతి పట్టికలను స్థానికంగా అర్థం చేసుకోదు - ఇది కేవలం పేజీలోని గ్లిఫ్ స్థానాలను వివరిస్తుంది - కాబట్టి Excelకి మార్చడానికి టెక్స్ట్ యొక్క జ్యామితి నుండి పట్టిక నిర్మాణాన్ని ఊహించడం అవసరం. ఒక కణం ఎక్కడ ముగుస్తుంది మరియు తదుపరిది ఎక్కడ ప్రారంభమవుతుంది అనేది క్షితిజ సమాంతర ఖాళీ స్థలం నుండి ఊహించబడాలి; నిలువు ఖాళీ స్థలం నుండి ఒక అడ్డు వరుస ముగుస్తుంది మరియు తదుపరిది ప్రారంభమవుతుంది.

ఈ సాధనం PDF.jsని ఉపయోగించి PDFని అన్వయిస్తుంది, టెక్స్ట్ ఐటెమ్‌లను వాటి సరిహద్దు పెట్టెలతో సంగ్రహిస్తుంది మరియు స్థానం ఆధారంగా అంశాలను వరుసలు మరియు నిలువు వరుసలుగా క్లస్టర్ చేస్తుంది. కనుగొనబడిన పట్టిక SheetJS xlsx లైబ్రరీని ఉపయోగించి Excel వర్క్‌బుక్‌కి వ్రాయబడింది. అవుట్‌పుట్ అనేది Excel, Google షీట్‌లు, నంబర్‌లు లేదా ఏదైనా ఇతర స్ప్రెడ్‌షీట్ అప్లికేషన్‌లో తెరవబడే ప్రామాణిక .xlsx ఫైల్.

PDF పట్టిక వెలికితీత నిజంగా కష్టం, మరియు ప్రతి PDFలో ఏ ఎక్స్‌ట్రాక్టర్ ఖచ్చితమైన ఫలితాలను అందించదు. స్థిరమైన నిలువు వరుస సరిహద్దులు, విలీనమైన సెల్‌లు లేవు మరియు స్పష్టమైన నిలువు సమలేఖనంతో పట్టికలు శుభ్రంగా మార్చబడతాయి. విలీనమైన సెల్‌లు, బహుళ-లైన్ ఎంట్రీలు, ఫుట్‌నోట్‌లు లేదా అసాధారణ లేఅవుట్‌లతో కూడిన పట్టికలు సాధారణంగా వెలికితీసిన తర్వాత మాన్యువల్ క్లీనప్ అవసరం. సమీక్ష కోసం ప్లాన్ చేయండి.

PDF ను ఎక్సెల్‌గా ఎందుకు మార్చాలి

కారణం దాదాపు ఎల్లప్పుడూ విశ్లేషణ. PDFలో చిక్కుకున్న డేటాను క్రమబద్ధీకరించడం, ఫిల్టర్ చేయడం, సంగ్రహించడం, చార్ట్ చేయడం లేదా పైవట్ చేయడం సాధ్యం కాదు. ఇది ఎక్సెల్‌లో ఉన్న తర్వాత, ప్రతి స్టాండర్డ్ స్ప్రెడ్‌షీట్ ఆపరేషన్ అందుబాటులోకి వస్తుంది - మరియు అది స్టాటిక్ రిపోర్ట్‌ను చూస్తూ దానిలోని సంఖ్యలతో పని చేయడం మధ్య వ్యత్యాసాన్ని తెరుస్తుంది.

PDFలో బల్క్ డేటా పని అసాధ్యం. బహుళ PDF నివేదికలలో త్రైమాసిక గణాంకాలను సమగ్రపరచడం, విక్రేతల అంతటా లైన్ ఐటెమ్‌లను సరిపోల్చడం లేదా దిగువ విశ్లేషణ కోసం నిర్దిష్ట నిలువు వరుసలను లాగడం వంటివి ఆ కార్యకలాపాలకు మద్దతు ఇచ్చే ఫార్మాట్‌లోకి డేటాను పొందడం అవసరం. Excel మరియు CSV ఆ ఫార్మాట్‌లు. మార్పిడి వంతెన.

ఎలా ఉపయోగించాలి

పట్టిక డేటాను కలిగి ఉన్న PDFని వదలండి, ప్రతి పట్టికతో దాని స్వంత షీట్‌లో వర్క్‌బుక్‌ను పొందండి.

  1. మీ PDFని అప్‌లోడ్ చేయండి: ఫైల్‌ను అప్‌లోడ్ చేసే ప్రదేశంలోకి లాగండి లేదా బ్రౌజ్ చేయడానికి క్లిక్ చేయండి. 50 MB వరకు ఉన్న ఫైల్‌లకు మద్దతు ఉంది. PDF తప్పనిసరిగా వాస్తవ వచనాన్ని కలిగి ఉండాలి; స్కాన్ చేసిన PDFలకు ముందుగా OCR అవసరం.
  2. పట్టిక గుర్తింపు కోసం వేచి ఉండండి: PDF.js వచన అంశాలు మరియు వాటి స్థానాలను సంగ్రహిస్తుంది. కన్వర్టర్ క్షితిజ సమాంతర మరియు నిలువు సమలేఖనాన్ని విశ్లేషించడం ద్వారా అంశాలను అడ్డు వరుసలు మరియు నిలువు వరుసలుగా చేస్తుంది. చిన్న పత్రాలను గుర్తించడానికి సెకన్లు మరియు బహుళ-పేజీ పట్టికల కోసం ఎక్కువ సమయం పడుతుంది.
  3. కనుగొనబడిన పట్టికలను సమీక్షించండి: కనుగొనబడిన పట్టికలు డౌన్‌లోడ్ చేయడానికి ముందు ప్రివ్యూ చేయబడతాయి. నిలువు వరుసలు మరియు అడ్డు వరుసలు మీరు ఆశించిన దానికి సరిపోలినట్లు నిర్ధారించండి; ఇక్కడ తప్పుగా అమర్చడం తర్వాత Excel క్లీనప్ అవుతుంది.
  4. XLSX వలె డౌన్‌లోడ్ చేయండి: కన్వర్టర్ కనుగొనబడిన ప్రతి పట్టికను షీట్‌జేఎస్‌ని ఉపయోగించి .xlsx వర్క్‌బుక్‌లో ప్రత్యేక షీట్‌కి వ్రాస్తుంది. Excel లేదా Google Sheetsలో ఫలితాన్ని తెరిచి, ఏవైనా అవశేష సమస్యలను క్లీన్ చేయండి.

సాధారణ వినియోగ కేసులు

సాంకేతిక వివరాలు

PDF.js ఒక getTextContent APIని బహిర్గతం చేస్తుంది, అది టెక్స్ట్ ఐటెమ్‌లను వాటి బౌండింగ్ బాక్స్‌లతో అందిస్తుంది. ప్రతి అంశానికి స్ట్రింగ్, ట్రాన్స్‌ఫార్మ్ మ్యాట్రిక్స్ (స్థానం మరియు భ్రమణానికి) మరియు వెడల్పు/ఎత్తు ఉంటుంది. కన్వర్టర్ పంక్తులను గుర్తించడానికి Y-కోఆర్డినేట్ ద్వారా అంశాలను క్రమబద్ధీకరిస్తుంది, ఆపై ప్రతి పంక్తిలో X-కోఆర్డినేట్ ద్వారా. చాలా సారూప్యమైన Y స్థానాల్లో ఉన్న అంశాలు వరుసను ఏర్పరుస్తాయి.

కాలమ్ డిటెక్షన్ గ్యాప్ అనాలిసిస్‌ని ఉపయోగిస్తుంది: వరుసలో ఉన్న వరుస అంశాల మధ్య X-దూరం అవి ఒకే సెల్ లేదా ప్రక్కనే ఉన్న సెల్‌లకు చెందినవా అని సూచిస్తుంది. థ్రెషోల్డ్ (సాధారణంగా 1–2 అక్షరాలు వెడల్పు) కంటే పెద్ద గ్యాప్ కాలమ్ సరిహద్దును సూచిస్తుంది. ప్రక్కనే ఉన్న నిలువు వరుసలను విలీనం చేయడం మరియు ఒకే నిలువు వరుసలను విభజించడం మధ్య థ్రెషోల్డ్ ట్యూనింగ్ ట్రేడ్ అవుతుంది.

Excel అవుట్‌పుట్ మెమరీలో వర్క్‌బుక్‌ను రూపొందించడానికి SheetJSని ఉపయోగిస్తుంది, షీట్1, షీట్2, మొదలైన వాటి పేర్లతో గుర్తించబడిన ప్రతి టేబుల్‌ను కలిగి ఉంటుంది. వర్క్‌బుక్ .xlsx (ఆఫీస్ ఓపెన్ XML) ఫార్మాట్‌కు సీరియల్‌గా మార్చబడింది మరియు డౌన్‌లోడ్‌గా అందించబడుతుంది. ఫలితం Excel 2007+, Google Sheets, LibreOffice Calc మరియు Apple నంబర్‌లలో తెరవబడుతుంది.

ఉత్తమ పద్ధతులు

తరచుగా అడిగే ప్రశ్నలు

PDFని EXCELకి మార్చడం వల్ల కంటెంట్ మారుతుందా?
కంటెంట్ సాధ్యమైనంత ఖచ్చితంగా భద్రపరచబడుతుంది. అయితే, కొన్ని ఫార్మాట్-నిర్దిష్ట లక్షణాలు ప్రత్యక్ష సమానమైన వాటిని కలిగి ఉండకపోవచ్చు, కాబట్టి చిన్న ఫార్మాటింగ్ తేడాలు సంభవించవచ్చు.
EXCEL ఫార్మాట్ దేనికి ఉపయోగించబడుతుంది?
XLSX (Microsoft Excel స్ప్రెడ్‌షీట్) ప్రాథమికంగా ఫార్ములాలు, చార్ట్‌లు మరియు డేటా విశ్లేషణతో కూడిన స్ప్రెడ్‌షీట్‌ల కోసం ఉపయోగించబడుతుంది.
తెలుసుకోవలసిన పరిమితులు ఏమైనా ఉన్నాయా?
50MB వరకు ఉన్న ఫైల్‌లకు మద్దతు ఉంది. చాలా పెద్ద లేదా సంక్లిష్టమైన ఫైల్‌లను ప్రాసెస్ చేయడానికి ఎక్కువ సమయం పట్టవచ్చు. అన్ని మార్పిడి మీ బ్రౌజర్‌లో జరుగుతుంది, కాబట్టి ప్రాసెసింగ్ వేగం మీ పరికరంపై ఆధారపడి ఉంటుంది.
నా డాక్యుమెంట్ డేటా సురక్షితంగా ఉందా?
అవును. డాక్యుమెంట్ ప్రాసెసింగ్ పూర్తిగా మీ బ్రౌజర్‌లో నడుస్తుంది. మీ ఫైల్‌లు మరియు వాటి కంటెంట్‌లు ఏ సర్వర్‌కి అప్‌లోడ్ చేయబడవు. ఇది సున్నితమైన లేదా రహస్య పత్రాలను మార్చడాన్ని సురక్షితంగా చేస్తుంది.
ఏ అవుట్‌పుట్ ఫార్మాట్ ఉత్పత్తి చేయబడింది?
.xlsx (ఆఫీస్ ఓపెన్ XML), ఆధునిక Excel ఫార్మాట్. ఫైల్ Excel 2007+, Google షీట్‌లు, LibreOffice Calc, Apple నంబర్‌లు మరియు ఏదైనా ఇతర ఆధునిక స్ప్రెడ్‌షీట్‌లో తెరవబడుతుంది.
నా PDF సర్వర్‌కి అప్‌లోడ్ చేయబడిందా?
లేదు. PDF.js మరియు SheetJSని ఉపయోగించి మీ బ్రౌజర్‌లో పార్సింగ్ మరియు ఎక్సెల్ ఉత్పత్తి జరుగుతుంది.
గరిష్ట ఫైల్ పరిమాణం ఎంత?
50 MB. మార్పిడి సమయం ఫైల్ పరిమాణం మాత్రమే కాకుండా పత్రం సంక్లిష్టతపై ఆధారపడి ఉంటుంది - గ్రాఫిక్స్-భారీ 50 MB PDF టెక్స్ట్-హెవీ కంటే సంగ్రహించడానికి ఎక్కువ సమయం పట్టవచ్చు.
నా నంబర్లు ఎందుకు తప్పు నిలువు వరుసలలో ఉన్నాయి?
దాదాపు ఎల్లప్పుడూ ఎందుకంటే కన్వర్టర్ యొక్క నిలువు గుర్తింపు థ్రెషోల్డ్ PDF యొక్క వాస్తవ లేఅవుట్‌తో సరిపోలలేదు. మూలాధార PDFని తెరిచి, నిలువు వరుసలు దృశ్యమానంగా ఎక్కడ విరిగిపోతాయో చూడండి మరియు అవసరమైన విధంగా Excelలోని సెల్‌లను మాన్యువల్‌గా మార్చండి.