完全無料

PDF を Word (DOCX) に 変換

ブラウザでPDFからテキストを抽出し、編集可能なWord形式に変換します。高速で安全・プライベートなツールです。

ここに PDF ファイルをドロップ

最大 50MB までサポート

または

このツールについて

PDF と DOCX (Microsoft Word) は、根本的に異なるモデルを使用してドキュメントを記述します。 PDF は固定レイアウト形式です。すべてのグリフは固定サイズのページ上に明示的に配置されているため、ドキュメントはどこでレンダリングされても同じように見えます。 DOCX はフロー レイアウト形式です。段落、表、見出しは意味論的に記述され、レンダリング エンジンは現在のページ サイズと利用可能なフォントに基づいて、それらがページ上のどこに配置されるかを決定します。 PDF から DOCX への変換は、固定レイアウトをリバース エンジニアリングして、Word が再フローできるセマンティック構造にすることを意味します。

この変換には本質的に損失が伴います。 PDF は通常、見出しレベル、段落境界、リスト構造、またはテーブルのセマンティクスを保持しません。コンバータは、フォント サイズ、位置、箇条書き文字からこれらを推測する必要があります。単純なテキストベースの PDF はきれいに変換されます。複数列のレイアウト、埋め込み画像、脚注、または珍しいタイポグラフィーを含む複雑な PDF は通常、変換後に手動でクリーンアップする必要があります。

このツールは、解析用の PDF.js と、標準の Office Open XML 出力を生成するカスタムのレイアウトから DOCX へのライターを使用して、ブラウザーで変換を実行します。結果は、Microsoft Word、LibreOffice Writer、Google Docs、およびその他の DOCX 互換エディターで開きます。アップロードは行われません。ファイルはデバイス上に残ります。

PDF を DOCX に変換する理由

編集しやすさがすべての理由です。 PDF は編集に敵対的です。フォーム フィールドに入力したり、注釈を付けたりすることはできますが、テキストのリフロー、段落スタイルの変更、コンテンツの再構築は、費用がかかり一貫性のない結果を生み出す専用の PDF エディターなしでは行えません。 DOCX は編集用に構築されています。 PDF を DOCX に変換すると、コンテンツが改訂、翻訳、再利用、または再設計しやすくなります。

もう一つの理由はコラボレーションです。 Word と Google ドキュメントは、オフィス、学校、およびほとんどの組織におけるドキュメント コラボレーションの共通言語です。コメント スレッド、変更の追跡、および共有編集はすべて、DOCX またはそのクラウド同等のものを前提としています。レビューのために送信された PDF がボトルネックになります。 DOCX は標準のコラボレーション ツールを通じて動作します。

使い方

PDF をドロップし、生成し、ダウンロードします。その後、Word でクリーンアップを行う予定です。

  1. PDF をアップロードする: ファイルをアップロード領域にドラッグするか、クリックして参照します。最大 50 MB のファイルがサポートされます。パスワードで保護された PDF はサポートされていません。まずデスクトップ ツールを使用してパスワードを削除します。
  2. 解析を待ちます: PDF.js は各ページからテキスト、フォント情報、レイアウト位置を抽出します。解析には短いドキュメントの場合は数秒かかりますが、埋め込まれた画像や複雑なグラフィックスが含まれるドキュメントの場合はさらに時間がかかります。
  3. 変換する: コンバーターは、解析されたコンテンツを調べ、フォント サイズと位置から段落と見出しの境界を推測し、Office Open XML をメモリ内の zip ファイルに書き込みます。見出し、段落、箇条書きリストは、同等の DOCX スタイルにマップされます。
  4. ダウンロードしてクリーンアップする: .docx ファイルを保存し、Word または任意のエディターで開きます。コンバーターが PDF から完全に推測できなかった残りの問題 (見出し階層、リストの書式設定、テーブルの境界) を修正するのに数分を費やす予定です。

一般的な使用例

技術的な詳細

PDF.js は、各 PDF ページをテキストおよびグラフィックス操作のストリームに解析します。テキスト抽出 API は、テキスト項目とその境界ボックス、フォント情報、および Unicode でデコードされた文字列を返します。これらの項目から、コンバータは上から下、左から右に並べ替えることによって読み取り順序を再構築し、同様のベースラインを持つ項目を行に、行を段落にグループ化します。

DOCX は、XML ファイル (document.xml、styles.xml、およびコンテンツ タイプと関係マニフェスト) を含む zip アーカイブです。コンバーターは、一連の段落 (w:p) 要素と run (w:r) 要素を使用して document.xml コンテンツを構築し、フォント サイズが見出しを示唆する見出し (見出し 1、見出し 2) のスタイル参照を適用し、JSZip を使用してメモリ内で zip をアセンブルします。

制限事項: 列のレイアウトが常に正しく再構築されるとは限りません。 PDF 内の表は、レイアウトが表構造を強く示唆しない限り、段落として復元されます。ヘッダー、フッター、脚注は通常、対応する DOCX ゾーンではなく本文のインラインになります。 PDF に埋め込まれた画像は、現在 DOCX 出力には保存されません。

ベストプラクティス

よくある質問

PDFをDOCXに変換すると内容は変わりますか?
内容は可能な限り正確に保存されます。ただし、一部の形式固有の機能には直接同等の機能がない場合があるため、形式に若干の違いが発生する可能性があります。
DOCX フォーマットは何に使用されますか?
DOCX (Microsoft Word Document) は主に、書式設定された編集可能なテキスト ドキュメントに使用されます。
注意すべき制限はありますか?
最大 50MB のファイルがサポートされます。非常に大きいファイルや複雑なファイルの処理には時間がかかる場合があります。すべての変換はブラウザーで行われるため、処理速度はデバイスによって異なります。
私の文書データは安全ですか?
はい。ドキュメント処理は完全にブラウザ内で実行されます。ファイルとそのコンテンツがサーバーにアップロードされることはありません。これにより、機密文書や機密文書を安全に変換できます。
テーブルは保存されますか?
単純な表が Word の表に変換されることがあります。複雑なテーブルは通常、手動で再構築する必要がある書式設定された段落に変換されます。精度が重要な場合は、重要なテーブルを手動で再作成することを計画してください。
私の PDF はサーバーにアップロードされていますか?
いいえ。PDF の解析には PDF.js が使用され、DOCX の書き込みには JSZip が使用されます。どちらも完全にブラウザ内で実行されます。
最大ファイルサイズはどれくらいですか?
50MB。実際の制限はドキュメントの複雑さによって異なります。そのサイズのテキストの多い PDF は数秒で変換されますが、同じサイズのグラフィックの多いドキュメントは変換に苦労する可能性があります。
パスワードで保護された PDF を変換できますか?
いいえ、PDF.js は復号化を実装していません。まず、qpdf などのデスクトップ ツールや Acrobat のセキュリティ設定を使用してパスワードを削除します。