PDF σε Μετατροπέας HTML
Μετατρέψτε έγγραφα PDF σε καθαρά, σημασιολογικά αρχεία HTML απευθείας στο πρόγραμμα περιήγησής σας. Γρήγορο, ασφαλές και διατηρεί τη δομή του εγγράφου.
Επιλέξτε αρχείο PDF
ή σύρετε και αποθέστε εδώ
Μετατρέψτε έγγραφα PDF σε καθαρά, σημασιολογικά αρχεία HTML απευθείας στο πρόγραμμα περιήγησής σας. Γρήγορο, ασφαλές και διατηρεί τη δομή του εγγράφου.
ή σύρετε και αποθέστε εδώ
Η μετατροπή PDF σε HTML μετατρέπει ένα έγγραφο σταθερής διάταξης σε μια ρέουσα ιστοσελίδα. Η μετατροπή διατηρεί το περιεχόμενο κειμένου, τις επικεφαλίδες, τις παραγράφους και το βασικό στυλ, ενώ εγκαταλείπει την ακριβή διάταξη εικονοστοιχείων του PDF υπέρ της αποκριτικής ροής του HTML. Αυτό είναι το σωστό εμπόριο για έγγραφα που αναδημοσιεύονται ως περιεχόμενο ιστού — άρθρα, αναφορές, τεχνική τεκμηρίωση — και λάθος εμπόριο για έγγραφα των οποίων η διάταξη είναι απαραίτητη — φόρμες, τιμολόγια με αυστηρή τοποθέτηση, σχεδιασμένα κομμάτια μάρκετινγκ.
Αυτό το εργαλείο χρησιμοποιεί το PDF.js για να εξάγει κείμενο, γραμματοσειρές και βασική δομή από το PDF και, στη συνέχεια, γράφει την αντίστοιχη σήμανση HTML με ενσωματωμένο CSS για τυπογραφία. Η έξοδος είναι ένα αυτόνομο αρχείο .html που μπορείτε να ανοίξετε σε οποιοδήποτε πρόγραμμα περιήγησης, να επικολλήσετε σε ένα CMS ή να δημιουργήσετε περαιτέρω στυλ με προσαρμοσμένο CSS. Δεν γίνεται μεταφόρτωση. η μετατροπή εκτελείται στο πρόγραμμα περιήγησής σας.
Υποστηρίζονται δύο στυλ εξόδου. Η σημασιολογική HTML παράγει καθαρή σήμανση με στοιχεία παραγράφου και επικεφαλίδας, κατάλληλα για αναδημοσίευση περιεχομένου σε ιστολόγιο ή ιστότοπο τεκμηρίωσης. Το Visual HTML διατηρεί μεγαλύτερο μέρος της διάταξης του PDF μέσω απόλυτης τοποθέτησης, κατάλληλο όταν η εμφάνιση του εγγράφου έχει μεγαλύτερη σημασία από τη δυνατότητα εκ νέου ροής.
Τα PDF δεν λειτουργούν καλά στον Ιστό. Τα προγράμματα περιήγησης για κινητά αποδίδουν τα PDF άβολα, τα προγράμματα ανάγνωσης οθόνης τα χειρίζονται με ασυνέπεια, οι μηχανές αναζήτησης τα ανιχνεύουν αλλά τα κατατάσσουν χαμηλότερα από το αντίστοιχο HTML και η ενσωμάτωση ενός PDF σε μια ιστοσελίδα παράγει ένα άβολο πρόγραμμα προβολής in-iframe και όχι μια εγγενή εμπειρία. Η μετατροπή σε HTML παράγει περιεχόμενο που λειτουργεί όπως λειτουργεί ο ιστός.
Το HTML είναι επίσης επεξεργάσιμο. Μόλις το περιεχόμενο ενός PDF είναι σε μορφή HTML, μπορείτε να αλλάξετε την τυπογραφία, να αναδιαρθρώσετε ενότητες, να προσθέσετε διαδραστικά στοιχεία και να ενσωματώσετε το περιεχόμενο με άλλες ιστοσελίδες. Το PDF αντιστέκεται σε όλες αυτές τις λειτουργίες.
Ρίξτε το PDF, επιλέξτε στυλ εξόδου, δημιουργήστε.
Το PDF.js εκθέτει το περιεχόμενο κειμένου ως στοιχεία με πλαίσια οριοθέτησης, γραμματοσειρές και συμβολοσειρές Unicode. Ο μετατροπέας ταξινομεί τα στοιχεία κατά Y και μετά X για να ανακτήσει τη σειρά ανάγνωσης, ομαδοποιεί στοιχεία σε παρόμοιες γραμμές βάσης σε γραμμές και ομαδοποιεί γραμμές σε παραγράφους με βάση την κάθετη απόσταση.
Η ανίχνευση επικεφαλίδων χρησιμοποιεί ανάλυση μεγέθους γραμματοσειράς: μεγέθη σημαντικά μεγαλύτερα από τη γραμματοσειρά σώματος γίνονται επικεφαλίδες, με το μεγαλύτερο να αντιστοιχίζεται στο h1, το επόμενο μεγαλύτερο στο h2 κ.λπ. Η ανίχνευση λίστας αναζητά γραμμές που ξεκινούν με χαρακτήρες κουκκίδων ή αριθμητικές ακολουθίες.
Το HTML εξόδου είναι αυτόνομο: doctype, κεφαλή με ενσωματωμένο CSS για τυπογραφία, σώμα με το περιεχόμενο που έχει μετατραπεί. Οι ενσωματωμένες εικόνες από το PDF δεν είναι προς το παρόν ενσωματωμένες. παραμένουν ένας γνωστός περιορισμός. Η έξοδος επικυρώνεται ως HTML5.