Word (DOCX) を PDF に 変換
ブラウザ上でWord(DOCX)からテキストを抽出し、PDF形式に無料で安全に変換します。
ここに DOCX ファイルをドロップ
またはクリックしてファイルを選択
ブラウザ上でWord(DOCX)からテキストを抽出し、PDF形式に無料で安全に変換します。
またはクリックしてファイルを選択
DOCX (Word) ドキュメントから PDF への変換は、オフィスで最も一般的なドキュメント変換の 1 つです。この 2 つの形式はそれぞれ異なる目的を持っています。DOCX は段落と段落の境界、コメント、変更の追跡、ライブ改ページなどの編集用であり、PDF は配布用であり、どのマシンでもまったく同じレンダリングが必要です。ドキュメントが完成したら、PDF に変換するとレイアウトが固定され、編集アーティファクトが削除され、どこでも同じように印刷、表示、アーカイブできるファイルが生成されます。
このコンバータは、mammoth.js を使用してブラウザ内の DOCX を解析し、セマンティック コンテンツ (段落、見出し、リスト、表、画像) を抽出し、ドキュメントによって暗示されるスタイルを適用し、jsPDF を使用して結果を PDF にレンダリングします。出力は標準の PDF/1.4 ファイルであり、追加の依存関係なしに任意の PDF リーダーで開くことができます。
変換では、テキストの内容、基本的なスタイル (太字、斜体、見出し)、箇条書きと番号付きリスト、および埋め込み画像が保持されます。 Word の複雑な機能 (変更履歴、コメント、脚注、フィールド コード付きのヘッダーとフッター、高度なタイポグラフィー) は、クライアント側で生成されるときに単純な PDF 類似物がないため、簡素化または削除されます。これらの機能に依存するドキュメントの場合、標準的な Word から PDF へのパスは、独自の形式を完全に理解する Word 自体からエクスポートされます。
PDF は完成したドキュメントに適した形式です。受信者は、DOCX を編集する場合と同じように誤って PDF を編集することができません。ページ レイアウトが固定されているため、ドキュメントは Mac、Windows、Linux、モバイルでも印刷しても同じように見えます。フォントは埋め込まれているため、受信者が適切な書体をインストールしているかどうかにレンダリングは依存しません。 PDF は、ほとんどのアーカイブ システムや法的ワークフローが期待する形式でもあります。
配布も簡単になります。 .pdf というラベルが付いた電子メールの添付ファイルは、すべてのメール クライアント、すべてのオペレーティング システム、すべてのドキュメント管理システムで認識されます。 .docx 添付ファイルは、互換性に関する警告を表示したり、古い Office バージョンで一貫性なく表示されたり、Word 互換リーダーのないデバイスで開くことを拒否したりする場合があります。 PDF はそのすべてを回避します。
DOCX をドロップし、PDF を生成します。
DOCX は、ドキュメントを説明する XML ファイルを含む zip アーカイブです。メインコンテンツは word/document.xml にあり、スタイルは word/styles.xml で定義され、埋め込まれたメディアは word/media/ にあります。 Mammoth.js は、ブラウザーで zip を開き、XML を解析し、段落、ラン、テーブル、および画像の構造化表現を生成します。
jsPDF は、一連の PDF 演算子 (setFont、setFontSize、テキスト コンテンツの場合は text) を出力バッファーに書き込むことによって、JavaScript で PDF を生成します。埋め込み画像の場合は addImage。改ページの場合は addPage。結果として得られるバッファは、application/pdf タイプの BLOB としてラップされ、ダウンロードとして提供されます。
このクライアント側アプローチの制限: Word の複雑な機能 (変更の追跡、コメント、高度なタイポグラフィ、標準ファミリーを超えたカスタム フォント、フィールド コードを含むページ ヘッダーとフッター) は簡素化されるか削除されます。標準的な完全忠実度の Word から PDF への変換は Word 自体によって実行されます。このツールは、Word を必要とせずに、単純な文書を十分にレンダリングすることを目的としています。