PDF ಗೆ ಎಕ್ಸೆಲ್ (XLSX) ಪರಿವರ್ತಕ
PDF ನಿಂದ ಕೋಷ್ಟಕಗಳು ಮತ್ತು ಪಠ್ಯವನ್ನು ಹೊರತೆಗೆಯಿರಿ ಮತ್ತು ಅವುಗಳನ್ನು ನಿಮ್ಮ ಬ್ರೌಸರ್ನಲ್ಲಿ ಸುರಕ್ಷಿತವಾಗಿ Excel XLSX ಸ್ಪ್ರೆಡ್ಶೀಟ್ಗಳಿಗೆ ಪರಿವರ್ತಿಸಿ.
PDF ಫೈಲ್ ಅನ್ನು ಇಲ್ಲಿ ಬಿಡಿ
ಅಥವಾ ಫೈಲ್ ಆಯ್ಕೆ ಮಾಡಲು ಕ್ಲಿಕ್ ಮಾಡಿ
PDF ನಿಂದ ಕೋಷ್ಟಕಗಳು ಮತ್ತು ಪಠ್ಯವನ್ನು ಹೊರತೆಗೆಯಿರಿ ಮತ್ತು ಅವುಗಳನ್ನು ನಿಮ್ಮ ಬ್ರೌಸರ್ನಲ್ಲಿ ಸುರಕ್ಷಿತವಾಗಿ Excel XLSX ಸ್ಪ್ರೆಡ್ಶೀಟ್ಗಳಿಗೆ ಪರಿವರ್ತಿಸಿ.
ಅಥವಾ ಫೈಲ್ ಆಯ್ಕೆ ಮಾಡಲು ಕ್ಲಿಕ್ ಮಾಡಿ
ಕೋಷ್ಟಕ ಡೇಟಾವನ್ನು PDF ನಿಂದ ಮತ್ತು ಸ್ಪ್ರೆಡ್ಶೀಟ್ಗೆ ಎಳೆಯುವುದು ಇನ್ವಾಯ್ಸ್ಗಳು, ಹಣಕಾಸು ವರದಿಗಳು, ವೈಜ್ಞಾನಿಕ ಪತ್ರಿಕೆಗಳು ಮತ್ತು ಸರ್ಕಾರಿ ಡೇಟಾವನ್ನು ನಿರ್ವಹಿಸುವ ಕಚೇರಿಗಳಲ್ಲಿನ ಸಾಮಾನ್ಯ ಡಾಕ್ಯುಮೆಂಟ್ ವರ್ಕ್ಫ್ಲೋಗಳಲ್ಲಿ ಒಂದಾಗಿದೆ. PDF ಸ್ವರೂಪವು ಕೋಷ್ಟಕಗಳನ್ನು ಸ್ಥಳೀಯವಾಗಿ ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವುದಿಲ್ಲ - ಇದು ಕೇವಲ ಪುಟದಲ್ಲಿ ಗ್ಲಿಫ್ ಸ್ಥಾನಗಳನ್ನು ವಿವರಿಸುತ್ತದೆ - ಆದ್ದರಿಂದ Excel ಗೆ ಪರಿವರ್ತಿಸಲು ಪಠ್ಯದ ರೇಖಾಗಣಿತದಿಂದ ಟೇಬಲ್ ರಚನೆಯನ್ನು ಊಹಿಸುವ ಅಗತ್ಯವಿದೆ. ಒಂದು ಕೋಶವು ಎಲ್ಲಿ ಕೊನೆಗೊಳ್ಳುತ್ತದೆ ಮತ್ತು ಮುಂದಿನದು ಪ್ರಾರಂಭವಾಗುತ್ತದೆ ಎಂಬುದನ್ನು ಸಮತಲವಾದ ವೈಟ್ಸ್ಪೇಸ್ನಿಂದ ಊಹಿಸಬೇಕು; ಅಲ್ಲಿ ಒಂದು ಸಾಲು ಕೊನೆಗೊಳ್ಳುತ್ತದೆ ಮತ್ತು ಮುಂದಿನದು ಲಂಬವಾದ ಜಾಗದಿಂದ ಪ್ರಾರಂಭವಾಗುತ್ತದೆ.
ಈ ಉಪಕರಣವು PDF.js ಅನ್ನು ಬಳಸಿಕೊಂಡು PDF ಅನ್ನು ಪಾರ್ಸ್ ಮಾಡುತ್ತದೆ, ಪಠ್ಯ ಐಟಂಗಳನ್ನು ಅವುಗಳ ಬೌಂಡಿಂಗ್ ಬಾಕ್ಸ್ಗಳೊಂದಿಗೆ ಹೊರತೆಗೆಯುತ್ತದೆ ಮತ್ತು ಸ್ಥಾನದ ಆಧಾರದ ಮೇಲೆ ಐಟಂಗಳನ್ನು ಸಾಲುಗಳು ಮತ್ತು ಕಾಲಮ್ಗಳಾಗಿ ಕ್ಲಸ್ಟರ್ ಮಾಡುತ್ತದೆ. ಪತ್ತೆಯಾದ ಟೇಬಲ್ ಅನ್ನು SheetJS xlsx ಲೈಬ್ರರಿಯನ್ನು ಬಳಸಿಕೊಂಡು Excel ವರ್ಕ್ಬುಕ್ಗೆ ಬರೆಯಲಾಗಿದೆ. ಔಟ್ಪುಟ್ ಪ್ರಮಾಣಿತ .xlsx ಫೈಲ್ ಆಗಿದ್ದು ಅದು ಎಕ್ಸೆಲ್, ಗೂಗಲ್ ಶೀಟ್ಗಳು, ಸಂಖ್ಯೆಗಳು ಅಥವಾ ಯಾವುದೇ ಇತರ ಸ್ಪ್ರೆಡ್ಶೀಟ್ ಅಪ್ಲಿಕೇಶನ್ನಲ್ಲಿ ತೆರೆಯುತ್ತದೆ.
PDF ಟೇಬಲ್ ಹೊರತೆಗೆಯುವಿಕೆ ಪ್ರಾಮಾಣಿಕವಾಗಿ ಕಠಿಣವಾಗಿದೆ ಮತ್ತು ಪ್ರತಿ PDF ನಲ್ಲಿ ಯಾವುದೇ ಎಕ್ಸ್ಟ್ರಾಕ್ಟರ್ ಪರಿಪೂರ್ಣ ಫಲಿತಾಂಶಗಳನ್ನು ನೀಡುವುದಿಲ್ಲ. ಸ್ಥಿರವಾದ ಕಾಲಮ್ ಗಡಿಗಳನ್ನು ಹೊಂದಿರುವ ಕೋಷ್ಟಕಗಳು, ವಿಲೀನಗೊಂಡ ಸೆಲ್ಗಳಿಲ್ಲ ಮತ್ತು ಸ್ಪಷ್ಟವಾದ ಲಂಬವಾದ ಜೋಡಣೆಯನ್ನು ಸ್ವಚ್ಛವಾಗಿ ಪರಿವರ್ತಿಸುತ್ತದೆ. ವಿಲೀನಗೊಂಡ ಸೆಲ್ಗಳು, ಬಹು-ಸಾಲಿನ ನಮೂದುಗಳು, ಅಡಿಟಿಪ್ಪಣಿಗಳು ಅಥವಾ ಅಸಾಮಾನ್ಯ ಲೇಔಟ್ಗಳನ್ನು ಹೊಂದಿರುವ ಕೋಷ್ಟಕಗಳು ಸಾಮಾನ್ಯವಾಗಿ ಹೊರತೆಗೆದ ನಂತರ ಹಸ್ತಚಾಲಿತವಾಗಿ ಸ್ವಚ್ಛಗೊಳಿಸುವ ಅಗತ್ಯವಿದೆ. ಪರಿಶೀಲನೆಗಾಗಿ ಯೋಜನೆ.
ಕಾರಣ ಯಾವಾಗಲೂ ವಿಶ್ಲೇಷಣೆಯಾಗಿದೆ. PDF ನಲ್ಲಿ ಸಿಕ್ಕಿಬಿದ್ದ ಡೇಟಾವನ್ನು ವಿಂಗಡಿಸಲು, ಫಿಲ್ಟರ್ ಮಾಡಲು, ಸಂಕ್ಷಿಪ್ತಗೊಳಿಸಲು, ಚಾರ್ಟ್ ಮಾಡಲು ಅಥವಾ ಪಿವೋಟ್ ಮಾಡಲು ಸಾಧ್ಯವಿಲ್ಲ. ಒಮ್ಮೆ ಅದು ಎಕ್ಸೆಲ್ನಲ್ಲಿದ್ದರೆ, ಪ್ರತಿ ಸ್ಟ್ಯಾಂಡರ್ಡ್ ಸ್ಪ್ರೆಡ್ಶೀಟ್ ಕಾರ್ಯಾಚರಣೆಯು ಲಭ್ಯವಾಗುತ್ತದೆ - ಮತ್ತು ಅದು ಸ್ಥಿರ ವರದಿಯನ್ನು ನೋಡುವುದು ಮತ್ತು ಅದರಲ್ಲಿರುವ ಸಂಖ್ಯೆಗಳೊಂದಿಗೆ ಕೆಲಸ ಮಾಡುವ ನಡುವಿನ ವ್ಯತ್ಯಾಸವನ್ನು ತೆರೆಯುತ್ತದೆ.
PDF ನಲ್ಲಿ ಬಲ್ಕ್ ಡೇಟಾ ಕೆಲಸ ಅಸಾಧ್ಯ. ಬಹು PDF ವರದಿಗಳಾದ್ಯಂತ ತ್ರೈಮಾಸಿಕ ಅಂಕಿಅಂಶಗಳನ್ನು ಒಟ್ಟುಗೂಡಿಸುವುದು, ಮಾರಾಟಗಾರರಾದ್ಯಂತ ಲೈನ್ ಐಟಂಗಳನ್ನು ಹೋಲಿಸುವುದು ಅಥವಾ ಡೌನ್ಸ್ಟ್ರೀಮ್ ವಿಶ್ಲೇಷಣೆಗಾಗಿ ನಿರ್ದಿಷ್ಟ ಕಾಲಮ್ಗಳನ್ನು ಎಳೆಯುವುದು ಇವೆಲ್ಲವೂ ಆ ಕಾರ್ಯಾಚರಣೆಗಳನ್ನು ಬೆಂಬಲಿಸುವ ಸ್ವರೂಪಕ್ಕೆ ಡೇಟಾವನ್ನು ಪಡೆಯುವ ಅಗತ್ಯವಿದೆ. ಎಕ್ಸೆಲ್ ಮತ್ತು CSV ಆ ಸ್ವರೂಪಗಳಾಗಿವೆ. ಪರಿವರ್ತನೆಯೇ ಸೇತುವೆ.
ಕೋಷ್ಟಕ ಡೇಟಾವನ್ನು ಹೊಂದಿರುವ PDF ಅನ್ನು ಬಿಡಿ, ಅದರ ಸ್ವಂತ ಹಾಳೆಯಲ್ಲಿ ಪ್ರತಿ ಟೇಬಲ್ನೊಂದಿಗೆ ವರ್ಕ್ಬುಕ್ ಪಡೆಯಿರಿ.
PDF.js ಪಠ್ಯ ಐಟಂಗಳನ್ನು ಅವುಗಳ ಬೌಂಡಿಂಗ್ ಬಾಕ್ಸ್ಗಳೊಂದಿಗೆ ಹಿಂತಿರುಗಿಸುವ getTextContent API ಅನ್ನು ಬಹಿರಂಗಪಡಿಸುತ್ತದೆ. ಪ್ರತಿಯೊಂದು ಐಟಂ ಸ್ಟ್ರಿಂಗ್, ರೂಪಾಂತರದ ಮ್ಯಾಟ್ರಿಕ್ಸ್ (ಸ್ಥಾನ ಮತ್ತು ತಿರುಗುವಿಕೆಗಾಗಿ) ಮತ್ತು ಅಗಲ/ಎತ್ತರವನ್ನು ಹೊಂದಿರುತ್ತದೆ. ಪರಿವರ್ತಕವು ರೇಖೆಗಳನ್ನು ಗುರುತಿಸಲು Y- ನಿರ್ದೇಶಾಂಕದಿಂದ ಐಟಂಗಳನ್ನು ವಿಂಗಡಿಸುತ್ತದೆ, ನಂತರ ಪ್ರತಿ ಸಾಲಿನೊಳಗೆ X- ನಿರ್ದೇಶಾಂಕದಿಂದ. ಒಂದೇ ರೀತಿಯ Y ಸ್ಥಾನದಲ್ಲಿರುವ ಐಟಂಗಳು ಸಾಲನ್ನು ರೂಪಿಸುತ್ತವೆ.
ಕಾಲಮ್ ಪತ್ತೆಯು ಅಂತರ ವಿಶ್ಲೇಷಣೆಯನ್ನು ಬಳಸುತ್ತದೆ: ಸತತ ಐಟಂಗಳ ನಡುವಿನ X- ಅಂತರವು ಒಂದೇ ಕೋಶ ಅಥವಾ ಪಕ್ಕದ ಕೋಶಗಳಿಗೆ ಸೇರಿದೆಯೇ ಎಂದು ಸೂಚಿಸುತ್ತದೆ. ಮಿತಿಗಿಂತ ದೊಡ್ಡದಾದ ಅಂತರವು (ಸಾಮಾನ್ಯವಾಗಿ 1-2 ಅಕ್ಷರ ಅಗಲಗಳು) ಕಾಲಮ್ ಗಡಿಯನ್ನು ಸಂಕೇತಿಸುತ್ತದೆ. ಥ್ರೆಶೋಲ್ಡ್ ಟ್ಯೂನಿಂಗ್ ಪಕ್ಕದ ಕಾಲಮ್ಗಳನ್ನು ವಿಲೀನಗೊಳಿಸುವ ಮತ್ತು ಏಕ ಕಾಲಮ್ಗಳನ್ನು ವಿಭಜಿಸುವ ನಡುವೆ ವಹಿವಾಟು ನಡೆಸುತ್ತದೆ.
Excel ಔಟ್ಪುಟ್ ಮೆಮೊರಿಯಲ್ಲಿ ವರ್ಕ್ಬುಕ್ ಅನ್ನು ನಿರ್ಮಿಸಲು SheetJS ಅನ್ನು ಬಳಸುತ್ತದೆ, ಹಾಳೆ1, ಶೀಟ್2, ಇತ್ಯಾದಿ ಹೆಸರಿನ ಅದರ ಸ್ವಂತ ಶೀಟ್ನಲ್ಲಿ ಪತ್ತೆಯಾದ ಪ್ರತಿ ಟೇಬಲ್ನೊಂದಿಗೆ. ವರ್ಕ್ಬುಕ್ ಅನ್ನು .xlsx (ಆಫೀಸ್ ಓಪನ್ XML) ಫಾರ್ಮ್ಯಾಟ್ಗೆ ಧಾರಾವಾಹಿ ಮಾಡಲಾಗಿದೆ ಮತ್ತು ಡೌನ್ಲೋಡ್ನಂತೆ ನೀಡಲಾಗುತ್ತದೆ. ಫಲಿತಾಂಶವು Excel 2007+, Google Sheets, LibreOffice Calc ಮತ್ತು Apple ಸಂಖ್ಯೆಗಳಲ್ಲಿ ತೆರೆಯುತ್ತದೆ.