PDF を HTML に 変換
PDFドキュメントをブラウザ上で直接、クリーンでセマンティックなHTMLファイルに変換します。高速、安全で、文章構造を維持します。
PDFファイルを選択
またはここにドラッグ&ドロップ
PDFドキュメントをブラウザ上で直接、クリーンでセマンティックなHTMLファイルに変換します。高速、安全で、文章構造を維持します。
またはここにドラッグ&ドロップ
PDF を HTML に変換すると、固定レイアウトのドキュメントが流れるような Web ページに変換されます。変換では、HTML の応答性の高いフローを優先して PDF の正確なピクセル レイアウトを放棄しながら、テキスト コンテンツ、見出し、段落、および基本的なスタイルを保持します。これは、Web コンテンツとして再公開されるドキュメント (記事、レポート、技術文書) にとっては正しい取引ですが、レイアウトが重要なドキュメント (フォーム、厳密な位置を指定した請求書、デザインされたマーケティング資料) にとっては間違った取引です。
このツールは、PDF.js を使用して PDF からテキスト、フォント、基本構造を抽出し、タイポグラフィ用の CSS が埋め込まれた対応する HTML マークアップを書き込みます。出力はスタンドアロンの .html ファイルで、任意のブラウザで開いたり、CMS に貼り付けたり、カスタム CSS でさらにスタイルを適用したりできます。アップロードは行われません。変換はブラウザで実行されます。
2 つの出力スタイルがサポートされています。セマンティック HTML は、ブログやドキュメント サイトでコンテンツを再公開するのに適した、段落要素と見出し要素を含むクリーンなマークアップを生成します。 Visual HTML は、絶対配置によって PDF のレイアウトの大部分を保持します。これは、リフロー性よりもドキュメントの外観が重要な場合に適しています。
PDF は Web 上ではうまく機能しません。モバイル ブラウザは PDF をぎこちなくレンダリングし、スクリーン リーダーは PDF を一貫性なく処理し、検索エンジンは PDF をクロールしますが、同等の HTML よりもランクが低くなり、Web ページに PDF を埋め込むと、ネイティブ エクスペリエンスではなく、不格好な iframe 内ビューアが生成されます。 HTML に変換すると、Web と同じように動作するコンテンツが生成されます。
HTMLも編集可能です。 PDF のコンテンツが HTML 形式になると、タイポグラフィの変更、セクションの再構成、インタラクティブな要素の追加、コンテンツを他の Web ページと統合することができます。 PDF はこれらすべての操作に耐えます。
PDF をドロップし、出力スタイルを選択して生成します。
PDF.js は、テキスト コンテンツを境界ボックス、フォント、Unicode 文字列を含むアイテムとして公開します。コンバーターは項目を Y、次に X で並べ替えて読み取り順序を復元し、同様のベースラインにある項目を行にグループ化し、垂直方向の間隔に基づいて行を段落にクラスター化します。
見出しの検出ではフォント サイズ分析が使用されます。本文のフォントよりも大幅に大きいサイズが見出しになり、最大のものは h1 にマッピングされ、次に大きいものは h2 にマッピングされます。リスト検出では、箇条書き文字または数値シーケンスで始まる行を検索します。
出力 HTML は自己完結型です。doctype、タイポグラフィ用の CSS が埋め込まれた head、変換されたコンテンツを含む body です。 PDF のインライン画像は現在埋め込まれていません。これらは既知の制限のままです。出力は HTML5 として検証されます。