Δωρεάν μετατροπέας

PDF σε Μετατροπέας Excel (XLSX).

Εξαγωγή πινάκων και κειμένου από PDF και μετατροπή τους σε υπολογιστικά φύλλα Excel XLSX με ασφάλεια στο πρόγραμμα περιήγησής σας.

Αποθέστε το αρχείο PDF εδώ

ή κάντε κλικ για να επιλέξετε αρχείο

Ή

Σχετικά με αυτό το εργαλείο

Η εξαγωγή δεδομένων σε πίνακα από ένα PDF και σε ένα υπολογιστικό φύλλο είναι μία από τις πιο κοινές ροές εργασίας εγγράφων σε γραφεία που χειρίζονται τιμολόγια, οικονομικές εκθέσεις, επιστημονικές εργασίες και κρατικά δεδομένα. Η μορφή PDF δεν κατανοεί εγγενώς τους πίνακες — περιγράφει απλώς θέσεις γλυφών σε μια σελίδα — επομένως η μετατροπή σε Excel απαιτεί συμπέρασμα της δομής του πίνακα από τη γεωμετρία του κειμένου. Το πού τελειώνει το ένα κελί και αρχίζει το επόμενο πρέπει να μαντέψετε από οριζόντιο κενό διάστημα. όπου τελειώνει η μία σειρά και αρχίζει η επόμενη, από κάθετο κενό διάστημα.

Αυτό το εργαλείο αναλύει το PDF χρησιμοποιώντας το PDF.js, εξάγει στοιχεία κειμένου με τα πλαίσια οριοθέτησής τους και ομαδοποιεί τα στοιχεία σε σειρές και στήλες με βάση τη θέση. Ο πίνακας που εντοπίστηκε εγγράφεται σε ένα βιβλίο εργασίας του Excel χρησιμοποιώντας τη βιβλιοθήκη SheetJS xlsx. Η έξοδος είναι ένα τυπικό αρχείο .xlsx που ανοίγει σε Excel, Φύλλα Google, Numbers ή οποιαδήποτε άλλη εφαρμογή υπολογιστικού φύλλου.

Η εξαγωγή πίνακα PDF είναι πραγματικά δύσκολη και κανένας εξαγωγέας δεν παράγει τέλεια αποτελέσματα σε κάθε PDF. Οι πίνακες με σταθερά όρια στηλών, χωρίς συγχωνευμένα κελιά και σαφή κατακόρυφη στοίχιση μετατρέπονται καθαρά. Οι πίνακες με συγχωνευμένα κελιά, καταχωρίσεις πολλών γραμμών, υποσημειώσεις ή ασυνήθιστες διατάξεις συνήθως χρειάζονται μη αυτόματο καθαρισμό μετά την εξαγωγή. Σχέδιο για αναθεώρηση.

Γιατί να μετατρέψετε PDF σε Excel

Ο λόγος είναι σχεδόν πάντα η ανάλυση. Τα δεδομένα που παγιδεύονται σε ένα PDF δεν μπορούν να ταξινομηθούν, να φιλτραριστούν, να αθροιστούν, να γραφτούν ή να συγκεντρωθούν. Μόλις είναι στο Excel, κάθε τυπική λειτουργία υπολογιστικού φύλλου γίνεται διαθέσιμη — και αυτό ανοίγει τη διαφορά μεταξύ του κοιτάζοντας επίμονα μια στατική αναφορά και της πραγματικής εργασίας με τους αριθμούς σε αυτήν.

Η μαζική εργασία δεδομένων είναι αδύνατη σε PDF. Η συγκέντρωση τριμηνιαίων αριθμών σε πολλές αναφορές PDF, η σύγκριση στοιχείων γραμμής μεταξύ προμηθευτών ή η άντληση συγκεκριμένων στηλών για ανάλυση κατάντη απαιτούν τη μεταφορά των δεδομένων σε μια μορφή που να υποστηρίζει αυτές τις λειτουργίες. Το Excel και το CSV είναι αυτές οι μορφές. Η μετατροπή είναι η γέφυρα.

Πώς να το χρησιμοποιήσετε

Ρίξτε ένα PDF που περιέχει δεδομένα πίνακα, λάβετε ένα βιβλίο εργασίας με κάθε πίνακα στο δικό του φύλλο.

  1. Ανεβάστε το PDF σας: Σύρετε το αρχείο στην περιοχή μεταφόρτωσης ή κάντε κλικ για περιήγηση. Υποστηρίζονται αρχεία έως 50 MB. Το PDF πρέπει να περιέχει πραγματικό κείμενο. Τα σαρωμένα PDF χρειάζονται πρώτα OCR.
  2. Περιμένετε για ανίχνευση πίνακα: Το PDF.js εξάγει στοιχεία κειμένου και τις θέσεις τους. Ο μετατροπέας ομαδοποιεί τα στοιχεία σε σειρές και στήλες αναλύοντας την οριζόντια και κάθετη στοίχιση. Η ανίχνευση διαρκεί δευτερόλεπτα για σύντομα έγγραφα και περισσότερο για πίνακες πολλών σελίδων.
  3. Ελέγξτε τους πίνακες που εντοπίστηκαν: Οι πίνακες που έχουν εντοπιστεί γίνεται προεπισκόπηση πριν από τη λήψη. Επιβεβαιώστε ότι οι στήλες και οι σειρές αντιστοιχούν σε αυτό που περιμένετε. Οι λανθασμένες ευθυγραμμίσεις εδώ γίνονται εκκαθάριση του Excel αργότερα.
  4. Λήψη ως XLSX: Ο μετατροπέας γράφει κάθε πίνακα που έχει εντοπιστεί σε ένα ξεχωριστό φύλλο σε ένα βιβλίο εργασίας .xlsx χρησιμοποιώντας το SheetJS. Ανοίξτε το αποτέλεσμα σε Excel ή Φύλλα Google και καθαρίστε τυχόν προβλήματα που απομένουν.

Κοινές περιπτώσεις χρήσης

Τεχνικές λεπτομέρειες

Το PDF.js εκθέτει ένα getTextContent API που επιστρέφει στοιχεία κειμένου με τα πλαίσια οριοθέτησής τους. Κάθε στοιχείο έχει μια συμβολοσειρά, έναν πίνακα μετασχηματισμού (για θέση και περιστροφή) και πλάτος/ύψος. Ο μετατροπέας ταξινομεί τα στοιχεία κατά συντεταγμένη Υ για να προσδιορίσει τις γραμμές και, στη συνέχεια, εντός κάθε γραμμής κατά συντεταγμένη Χ. Τα στοιχεία σε πολύ παρόμοιες θέσεις Υ σχηματίζουν μια σειρά.

Η ανίχνευση στηλών χρησιμοποιεί ανάλυση κενού: η απόσταση Χ μεταξύ διαδοχικών στοιχείων σε μια σειρά υποδεικνύει εάν ανήκουν στο ίδιο κελί ή σε γειτονικά κελιά. Ένα κενό μεγαλύτερο από ένα όριο (συνήθως πλάτη 1–2 χαρακτήρων) σηματοδοτεί ένα όριο στήλης. Ο συντονισμός κατωφλίου ανταλλάσσεται μεταξύ της συγχώνευσης γειτονικών στηλών και του διαχωρισμού μεμονωμένων στηλών.

Η έξοδος του Excel χρησιμοποιεί το SheetJS για τη δημιουργία ενός βιβλίου εργασίας στη μνήμη, με κάθε πίνακα που ανιχνεύεται στο δικό του φύλλο που ονομάζεται Sheet1, Sheet2, κ.λπ. Το βιβλίο εργασίας είναι σειριοποιημένο σε μορφή .xlsx (Office Open XML) και προσφέρεται ως λήψη. Το αποτέλεσμα ανοίγει σε Excel 2007+, Φύλλα Google, LibreOffice Calc και Apple Numbers.

Βέλτιστες Πρακτικές

Συχνές ερωτήσεις

Η μετατροπή PDF σε EXCEL αλλάζει το περιεχόμενο;
Το περιεχόμενο διατηρείται όσο το δυνατόν ακριβέστερα. Ωστόσο, ορισμένες λειτουργίες που σχετίζονται με τη μορφή ενδέχεται να μην έχουν άμεσα ισοδύναμα, επομένως ενδέχεται να προκύψουν μικρές διαφορές μορφοποίησης.
Σε τι χρησιμοποιείται η μορφή EXCEL;
Το XLSX (Microsoft Excel Spreadsheet) χρησιμοποιείται κυρίως για υπολογιστικά φύλλα με τύπους, γραφήματα και ανάλυση δεδομένων.
Υπάρχουν κάποιοι περιορισμοί που πρέπει να γνωρίζετε;
Υποστηρίζονται αρχεία έως 50MB. Η επεξεργασία πολύ μεγάλων ή πολύπλοκων αρχείων μπορεί να χρειαστεί περισσότερο χρόνο. Όλες οι μετατροπές γίνονται στο πρόγραμμα περιήγησής σας, επομένως η ταχύτητα επεξεργασίας εξαρτάται από τη συσκευή σας.
Είναι ασφαλή τα δεδομένα του εγγράφου μου;
Ναι. Η επεξεργασία εγγράφων εκτελείται εξ ολοκλήρου στο πρόγραμμα περιήγησής σας. Τα αρχεία σας και τα περιεχόμενά τους δεν μεταφορτώνονται ποτέ σε κανένα διακομιστή. Αυτό καθιστά ασφαλή τη μετατροπή ευαίσθητων ή εμπιστευτικών εγγράφων.
Τι μορφή εξόδου παράγεται;
.xlsx (Office Open XML), η σύγχρονη μορφή Excel. Το αρχείο ανοίγει στο Excel 2007+, στο Google Sheets, στο LibreOffice Calc, στο Apple Numbers και σε οποιοδήποτε άλλο σύγχρονο υπολογιστικό φύλλο.
Το PDF μου μεταφορτώνεται σε διακομιστή;
Όχι. Η ανάλυση και η δημιουργία Excel πραγματοποιούνται στο πρόγραμμα περιήγησής σας χρησιμοποιώντας PDF.js και SheetJS.
Ποιο είναι το μέγιστο μέγεθος αρχείου;
50 MB. Ο χρόνος μετατροπής εξαρτάται από την πολυπλοκότητα του εγγράφου και όχι μόνο από το μέγεθος του αρχείου — ένα PDF 50 MB με βαριά γραφικά μπορεί να χρειαστεί περισσότερο χρόνο για να εξαχθεί από ένα βαρύ κείμενο.
Γιατί οι αριθμοί μου βρίσκονται σε λάθος στήλες;
Σχεδόν πάντα επειδή το όριο ανίχνευσης στήλης του μετατροπέα δεν ταιριάζει με την πραγματική διάταξη του PDF. Ανοίξτε το αρχείο προέλευσης PDF, δείτε πού σπάνε οπτικά οι στήλες και μετακινήστε μη αυτόματα κελιά στο Excel, όπως απαιτείται.