PDF an HTML-Konverter
Konvertieren Sie PDF-Dokumente direkt in Ihrem Browser in saubere, semantische HTML-Dateien. Schnell, sicher und unter Beibehaltung der Dokumentenstruktur.
PDF-Datei auswählen
oder per Drag & Drop hierher ziehen
Konvertieren Sie PDF-Dokumente direkt in Ihrem Browser in saubere, semantische HTML-Dateien. Schnell, sicher und unter Beibehaltung der Dokumentenstruktur.
oder per Drag & Drop hierher ziehen
Durch die Konvertierung von PDF in HTML wird ein Dokument mit festem Layout in eine fließende Webseite umgewandelt. Bei der Konvertierung bleiben Textinhalte, Überschriften, Absätze und der grundlegende Stil erhalten, während das exakte Pixellayout der PDF zugunsten des reaktionsfähigen HTML-Flusses aufgegeben wird. Dies ist der richtige Handel für Dokumente, die als Webinhalte erneut veröffentlicht werden – Artikel, Berichte, technische Dokumentation – und der falsche Handel für Dokumente, deren Layout von entscheidender Bedeutung ist – Formulare, Rechnungen mit strenger Positionierung, gestaltete Marketingartikel.
Dieses Tool verwendet PDF.js, um Text, Schriftarten und die Grundstruktur aus der PDF-Datei zu extrahieren, und schreibt dann entsprechendes HTML-Markup mit eingebettetem CSS für die Typografie. Die Ausgabe ist eine eigenständige HTML-Datei, die Sie in jedem Browser öffnen, in ein CMS einfügen oder mit benutzerdefiniertem CSS weiter formatieren können. Es findet kein Upload statt. Die Konvertierung läuft in Ihrem Browser.
Es werden zwei Ausgabestile unterstützt. Semantisches HTML erzeugt sauberes Markup mit Absatz- und Überschriftenelementen, das sich für die erneute Veröffentlichung von Inhalten auf einem Blog oder einer Dokumentationsseite eignet. Visuelles HTML bewahrt einen größeren Teil des PDF-Layouts durch absolute Positionierung, was geeignet ist, wenn das Erscheinungsbild des Dokuments wichtiger ist als die Fließfähigkeit.
PDFs funktionieren im Web nicht gut. Mobile Browser rendern PDFs umständlich, Screenreader verarbeiten sie inkonsistent, Suchmaschinen crawlen sie, stufen sie aber niedriger ein als entsprechendes HTML, und das Einbetten einer PDF-Datei in eine Webseite führt eher zu einem klobigen In-Iframe-Viewer als zu einem nativen Erlebnis. Durch die Konvertierung in HTML entstehen Inhalte, die genauso funktionieren wie das Web.
HTML ist ebenfalls editierbar. Sobald der Inhalt einer PDF-Datei im HTML-Format vorliegt, können Sie die Typografie ändern, Abschnitte neu strukturieren, interaktive Elemente hinzufügen und den Inhalt in andere Webseiten integrieren. PDF widersteht all diesen Vorgängen.
Legen Sie die PDF-Datei ab, wählen Sie den Ausgabestil und generieren Sie sie.
PDF.js stellt Textinhalte als Elemente mit Begrenzungsrahmen, Schriftarten und Unicode-Zeichenfolgen bereit. Der Konverter sortiert Elemente nach Y und dann nach X, um die Lesereihenfolge wiederherzustellen, gruppiert Elemente an ähnlichen Grundlinien in Zeilen und gruppiert Zeilen basierend auf dem vertikalen Abstand in Absätzen.
Bei der Überschriftenerkennung wird eine Analyse der Schriftgröße verwendet: Deutlich größere Größen als die Hauptschriftart werden zu Überschriften, wobei die größte h1, die nächstgrößere h2 usw. zugeordnet wird. Die Listenerkennung sucht nach Zeilen, die mit Aufzählungszeichen oder numerischen Sequenzen beginnen.
Der ausgegebene HTML-Code ist in sich geschlossen: Doctype, Head mit eingebettetem CSS für Typografie, Body mit dem konvertierten Inhalt. Inline-Bilder aus dem PDF sind derzeit nicht eingebettet; Sie bleiben eine bekannte Einschränkung. Die Ausgabe wird als HTML5 validiert.