무료 변환기

PDF로 워드(DOCX)

PDF에서 텍스트를 추출하고 브라우저에서 편집 가능한 Word 형식으로 완전히 변환하세요. 빠르고 안전하며 비공개입니다.

PDF 파일을 여기에 드롭하세요.

최대 50MB까지 지원

또는

이 도구에 대하여

PDF와 DOCX(Microsoft Word)는 근본적으로 다른 모델을 사용하여 문서를 설명합니다. PDF는 고정 레이아웃 형식입니다. 모든 글리프는 고정 크기 페이지에서 명시적인 위치를 가지므로 문서가 렌더링되는 모든 곳에서 동일하게 보입니다. DOCX는 흐름 레이아웃 형식입니다. 단락, 표 및 제목은 의미론적으로 설명되며 렌더링 엔진은 현재 페이지 크기 및 글꼴 가용성을 기반으로 페이지 내 위치를 결정합니다. PDF에서 DOCX로 변환한다는 것은 고정 레이아웃을 Word가 다시 흐름할 수 있는 의미 구조로 리버스 엔지니어링하는 것을 의미합니다.

이 변환은 본질적으로 손실이 있습니다. PDF는 일반적으로 제목 수준, 단락 경계, 목록 구조 또는 테이블 의미를 유지하지 않습니다. 변환기는 글꼴 크기, 위치 및 글머리 기호 문자를 통해 이를 추론해야 합니다. 간단한 텍스트 기반 PDF는 깔끔하게 변환됩니다. 다중 열 레이아웃, 포함된 이미지, 각주 또는 특이한 인쇄술이 포함된 복잡한 PDF는 일반적으로 변환 후 수동으로 정리해야 합니다.

이 도구는 구문 분석을 위해 PDF.js를 사용하고 표준 Office Open XML 출력을 생성하는 사용자 정의 레이아웃-DOCX 작성기를 사용하여 브라우저에서 변환을 실행합니다. 결과는 Microsoft Word, LibreOffice Writer, Google Docs 및 기타 DOCX 호환 편집기에서 열립니다. 업로드가 발생하지 않습니다. 파일은 장치에 남아 있습니다.

PDF를 DOCX로 변환하는 이유

편집 가능성이 전체 이유입니다. PDF는 편집에 적합하지 않습니다. 양식 필드를 채우고 주석을 달 수는 있지만 비용이 많이 들고 일관되지 않은 결과를 생성하는 전문 PDF 편집기 없이는 텍스트 재배치, 단락 스타일 변경 또는 콘텐츠 재구성이 불가능합니다. DOCX는 편집을 위해 만들어졌습니다. PDF를 DOCX로 변환하면 콘텐츠의 수정, 번역, 용도 변경 또는 재설계가 용이해집니다.

또 다른 이유는 협업이다. Word와 Google Docs는 사무실, 학교 및 대부분의 조직에서 문서 공동 작업을 위한 공용어입니다. 댓글 스레드, 변경 사항 추적 및 공유 편집은 모두 DOCX 또는 이에 상응하는 클라우드 기능을 가정합니다. 검토를 위해 보낸 PDF에 병목 현상이 발생합니다. DOCX는 표준 협업 도구를 통해 흐릅니다.

사용 방법

PDF를 드롭하고, 생성하고, 다운로드하세요. 나중에 Word에서 일부 정리 작업을 수행할 것으로 예상됩니다.

  1. PDF 업로드: 파일을 업로드 영역으로 드래그하거나 클릭하여 찾아보세요. 최대 50MB의 파일이 지원됩니다. 비밀번호로 보호된 PDF는 지원되지 않습니다. 먼저 데스크탑 도구를 사용하여 비밀번호를 제거하십시오.
  2. 파싱을 기다립니다: PDF.js는 각 페이지에서 텍스트, 글꼴 정보 및 레이아웃 위치를 추출합니다. 짧은 문서의 경우 구문 분석에 몇 초가 걸리고 이미지나 복잡한 그래픽이 포함된 문서의 경우 더 오랜 시간이 걸립니다.
  3. 변환: 변환기는 구문 분석된 콘텐츠를 탐색하고, 글꼴 크기와 위치에서 단락 및 제목 경계를 유추하고, Office Open XML을 메모리 내 zip 파일에 작성합니다. 제목, 단락 및 글머리 기호 목록은 해당 DOCX 스타일에 매핑됩니다.
  4. 다운로드하고 정리하세요: .docx 파일을 저장하고 Word나 원하는 편집기에서 엽니다. 변환기가 PDF에서 완벽하게 추론할 수 없는 제목 계층 구조, 목록 형식, 표 경계 등의 잔여 문제를 해결하는 데 몇 분 정도 시간을 할애할 계획을 세우십시오.

일반적인 사용 사례

기술적인 세부사항

PDF.js는 각 PDF 페이지를 텍스트 및 그래픽 작업 스트림으로 구문 분석합니다. 텍스트 추출 API는 경계 상자, 글꼴 정보 및 유니코드로 디코딩된 문자열이 포함된 텍스트 항목을 반환합니다. 이러한 항목에서 변환기는 위에서 아래로, 왼쪽에서 오른쪽으로 정렬하고 비슷한 기준선을 가진 항목을 줄로, 줄을 단락으로 그룹화하여 읽기 순서를 재구성합니다.

DOCX는 XML 파일(document.xml, styles.xml, 콘텐츠 유형 및 관계 매니페스트 포함)이 포함된 zip 아카이브입니다. 변환기는 일련의 단락(w:p) 및 실행(w:r) 요소를 사용하여 document.xml 컨텐츠를 작성하고 글꼴 크기가 제목을 제안하는 제목(제목 1, 제목 2)에 대한 스타일 참조를 적용하고 JSZip을 사용하여 메모리에 zip을 어셈블합니다.

제한 사항: 열 레이아웃이 항상 올바르게 재구성되는 것은 아닙니다. 레이아웃이 표 형식 구조를 강력히 제안하지 않는 한 PDF의 표는 단락으로 복구됩니다. 머리글, 바닥글 및 각주는 일반적으로 해당 DOCX 영역이 아닌 본문에서 인라인으로 끝납니다. PDF에 포함된 이미지는 현재 DOCX 출력에 보존되지 않습니다.

모범 사례

자주 묻는 질문

PDF를 DOCX로 변환하면 내용이 변경됩니까?
내용은 최대한 정확하게 보존됩니다. 그러나 일부 형식별 기능에는 직접적인 상응 기능이 없을 수 있으므로 사소한 형식 차이가 발생할 수 있습니다.
DOCX 형식은 무엇에 사용됩니까?
DOCX(Microsoft Word 문서)는 주로 서식이 있는 편집 가능한 텍스트 문서에 사용됩니다.
알아야 할 제한 사항이 있나요?
최대 50MB의 파일이 지원됩니다. 매우 크거나 복잡한 파일은 처리하는 데 시간이 더 오래 걸릴 수 있습니다. 모든 변환은 브라우저에서 이루어지므로 처리 속도는 장치에 따라 다릅니다.
내 문서 데이터는 안전한가요?
예. 문서 처리는 전적으로 브라우저에서 실행됩니다. 귀하의 파일과 그 내용은 어떤 서버에도 업로드되지 않습니다. 이렇게 하면 민감하거나 기밀인 문서를 안전하게 변환할 수 있습니다.
테이블이 보존되나요?
간단한 표는 때때로 Word 표로 변환됩니다. 복잡한 표는 일반적으로 수동 재구성이 필요한 서식 있는 단락으로 변환됩니다. 정밀도가 중요한 경우 중요한 테이블을 수동으로 다시 생성하도록 계획하세요.
내 PDF가 서버에 업로드됩니까?
아니요. PDF 구문 분석은 PDF.js를 사용하고 DOCX 작성은 JSZip을 사용합니다. 둘 다 브라우저에서 완전히 실행됩니다.
최대 파일 크기는 얼마입니까?
50MB. 실제 제한은 문서 복잡성에 따라 다릅니다. 해당 크기의 텍스트가 많은 PDF는 몇 초 안에 변환되는 반면, 같은 크기의 그래픽이 많은 문서는 어려움을 겪을 수 있습니다.
비밀번호로 보호된 PDF를 변환할 수 있나요?
아니요. PDF.js는 암호 해독을 구현하지 않습니다. 먼저 qpdf 또는 Acrobat의 보안 설정과 같은 데스크탑 도구를 사용하여 비밀번호를 제거하십시오.