完全無料

PDF を HTML に 変換

PDFドキュメントをブラウザ上で直接、クリーンでセマンティックなHTMLファイルに変換します。高速、安全で、文章構造を維持します。

PDFファイルを選択

またはここにドラッグ&ドロップ

または

このツールについて

PDF を HTML に変換すると、固定レイアウトのドキュメントが流れるような Web ページに変換されます。変換では、HTML の応答性の高いフローを優先して PDF の正確なピクセル レイアウトを放棄しながら、テキスト コンテンツ、見出し、段落、および基本的なスタイルを保持します。これは、Web コンテンツとして再公開されるドキュメント (記事、レポート、技術文書) ​​にとっては正しい取引ですが、レイアウトが重要なドキュメント (フォーム、厳密な位置を指定した請求書、デザインされたマーケティング資料) にとっては間違った取引です。

このツールは、PDF.js を使用して PDF からテキスト、フォント、基本構造を抽出し、タイポグラフィ用の CSS が埋め込まれた対応する HTML マークアップを書き込みます。出力はスタンドアロンの .html ファイルで、任意のブラウザで開いたり、CMS に貼り付けたり、カスタム CSS でさらにスタイルを適用したりできます。アップロードは行われません。変換はブラウザで実行されます。

2 つの出力スタイルがサポートされています。セマンティック HTML は、ブログやドキュメント サイトでコンテンツを再公開するのに適した、段落要素と見出し要素を含むクリーンなマークアップを生成します。 Visual HTML は、絶対配置によって PDF のレイアウトの大部分を保持します。これは、リフロー性よりもドキュメントの外観が重要な場合に適しています。

PDF を HTML に変換する理由

PDF は Web 上ではうまく機能しません。モバイル ブラウザは PDF をぎこちなくレンダリングし、スクリーン リーダーは PDF を一貫性なく処理し、検索エンジンは PDF をクロールしますが、同等の HTML よりもランクが低くなり、Web ページに PDF を埋め込むと、ネイティブ エクスペリエンスではなく、不格好な iframe 内ビューアが生成されます。 HTML に変換すると、Web と同じように動作するコンテンツが生成されます。

HTMLも編集可能です。 PDF のコンテンツが HTML 形式になると、タイポグラフィの変更、セクションの再構成、インタラクティブな要素の追加、コンテンツを他の Web ページと統合することができます。 PDF はこれらすべての操作に耐えます。

使い方

PDF をドロップし、出力スタイルを選択して生成します。

  1. PDF をアップロードする: ファイルをアップロード領域にドラッグするか、クリックして参照します。最大 50 MB のファイルがサポートされます。パスワードで保護された PDF はサポートされていません。まず保護を解除してください。
  2. 出力スタイルの選択: セマンティック HTML は、段落タグと見出しタグを備えた流れるようなコンテンツを生成します。 Visual HTML は、絶対 CSS を介して PDF の位置を保持します。再発行にはセマンティックを選択し、レイアウトが重要なドキュメントにはビジュアルを選択します。
  3. 変換する: PDF.js はテキストとレイアウトを抽出します。コンバーターは、フォント サイズを見出しレベルにマッピングし、段落区切りを識別し、タイポグラフィー用の CSS スタイルを使用して HTML を出力します。一般的なドキュメントの場合、変換には数秒かかります。
  4. HTMLをダウンロードする: .html ファイルを保存します。任意のブラウザで開いてプレビューします。 CMS でコンテンツを使用するには、内部本文のコンテンツをコピーしてエディターに貼り付けます。

一般的な使用例

技術的な詳細

PDF.js は、テキスト コンテンツを境界ボックス、フォント、Unicode 文字列を含むアイテムとして公開します。コンバーターは項目を Y、次に X で並べ替えて読み取り順序を復元し、同様のベースラインにある項目を行にグループ化し、垂直方向の間隔に基づいて行を段落にクラスター化します。

見出しの検出ではフォント サイズ分析が使用されます。本文のフォントよりも大幅に大きいサイズが見出しになり、最大のものは h1 にマッピングされ、次に大きいものは h2 にマッピングされます。リスト検出では、箇条書き文字または数値シーケンスで始まる行を検索します。

出力 HTML は自己完結型です。doctype、タイポグラフィ用の CSS が埋め込まれた head、変換されたコンテンツを含む body です。 PDF のインライン画像は現在埋め込まれていません。これらは既知の制限のままです。出力は HTML5 として検証されます。

ベストプラクティス

よくある質問

PDF を HTML に変換すると内容は変わりますか?
内容は可能な限り正確に保存されます。ただし、一部の形式固有の機能には直接同等の機能がない場合があるため、形式に若干の違いが発生する可能性があります。
HTML 形式は何に使用されますか?
HTML (HyperText Markup Language) は主に Web ページと Web コンテンツに使用されます。
注意すべき制限はありますか?
最大 50MB のファイルがサポートされます。非常に大きいファイルや複雑なファイルの処理には時間がかかる場合があります。すべての変換はブラウザーで行われるため、処理速度はデバイスによって異なります。
私の文書データは安全ですか?
はい。ドキュメント処理は完全にブラウザ内で実行されます。ファイルとそのコンテンツがサーバーにアップロードされることはありません。これにより、機密文書や機密文書を安全に変換できます。
出力はモバイル対応ですか?
セマンティック モードでは、任意の幅に合わせて流れるコンテンツが生成されます。ビジュアル モードでは、小さな画面には適応しない絶対位置が使用されます。モバイルの場合は、セマンティック モードを使用します。
私の PDF はサーバーにアップロードされていますか?
いいえ、PDF.js はブラウザーで実行されます。ファイルはデバイスから流出しません。
最大ファイルサイズはどれくらいですか?
50MB。ドキュメントが大きいと、解析に時間がかかります。
変換後にHTMLを編集することはできますか?
はい、それは重要な点の一部です。出力は CSS が埋め込まれたプレーン HTML で、テキスト エディターで簡単に編集したり、CMS に貼り付けたりできます。