Word (DOCX) 转 PDF
在您的浏览器中安全地将Word DOCX 文档免费转换为PDF格式。
将 DOCX 文件拖放到此处
或单击以选择文件
在您的浏览器中安全地将Word DOCX 文档免费转换为PDF格式。
或单击以选择文件
将 DOCX (Word) 文档转换为 PDF 是任何办公室中最常见的文档转换之一。这两种格式有不同的用途:DOCX 用于编辑 - 段落和运行边界、注释、轨道更改和实时分页符 - 而 PDF 用于分发,您希望在每台计算机上获得完全相同的渲染。文档完成后,转换为 PDF 会冻结布局、消除编辑痕迹,并生成一个在任何地方都可以相同地打印、显示和存档的文件。
该转换器使用 mammoth.js 解析浏览器中的 DOCX 以提取语义内容(段落、标题、列表、表格、图像),应用文档隐含的样式,并使用 jsPDF 将结果呈现为 PDF。输出是标准 PDF/1.4 文件,可以在任何 PDF 阅读器中打开,无需进一步依赖。
转换保留文本内容、基本样式(粗体、斜体、标题)、项目符号和编号列表以及嵌入图像。复杂的 Word 功能(跟踪更改、注释、脚注、带有字段代码的页眉和页脚、高级排版)被简化或删除,因为它们在客户端生成时没有简单的 PDF 模拟。对于依赖这些功能的文档,规范的 Word 到 PDF 路径是从 Word 本身导出,Word 完全理解自己的格式。
PDF 是成品文档的正确格式。收件人不会像编辑 DOCX 那样意外地编辑 PDF。页面布局是固定的,因此文档在 Mac、Windows、Linux、移动设备和打印版上看起来相同。字体是嵌入的,因此渲染不依赖于接收者安装了正确的字体。 PDF 也是大多数档案系统和法律工作流程所期望的格式。
分配也更简单。每个邮件客户端、每个操作系统、每个文档管理系统都可以识别标记为 .pdf 的电子邮件附件。 .docx 附件有时会触发兼容性警告,在旧版 Office 版本中呈现不一致,或者拒绝在没有 Word 兼容阅读器的设备上打开。 PDF 避免了这一切。
拖放 DOCX,生成 PDF。
DOCX 是一个 zip 存档,其中包含描述文档的 XML 文件。主要内容位于 word/document.xml 中,样式在 word/styles.xml 中定义,嵌入媒体在 word/media/ 中。 Mammoth.js 在浏览器中打开 zip,解析 XML,并生成段落、运行、表格和图像的结构化表示。
jsPDF 通过将一系列 PDF 运算符写入输出缓冲区来在 JavaScript 中生成 PDF:setFont、setFontSize、文本文本; addImage 用于嵌入图像; addPage 用于分页符。生成的缓冲区被包装为类型为 application/pdf 的 Blob 并提供下载。
这种客户端方法的局限性:复杂的 Word 功能(跟踪的更改、注释、高级排版、超出标准系列的自定义字体、带有字段代码的页眉和页脚)被简化或删除。规范的全保真 Word 到 PDF 转换由 Word 本身执行;该工具的目的是在不需要 Word 的情况下足够好地渲染简单的文档。