무료 변환기

PDF로 HTML 변환기

PDF 문서를 브라우저에서 직접 깔끔하고 의미 있는 HTML 파일로 변환하세요. 빠르고 안전하며 문서 구조를 보존합니다.

PDF 파일 선택

아니면 여기로 드래그 앤 드롭하세요.

또는

이 도구에 대하여

PDF를 HTML로 변환하면 고정 레이아웃 문서가 흐르는 웹 페이지로 변환됩니다. 변환에서는 HTML의 반응 흐름을 위해 PDF의 정확한 픽셀 레이아웃을 버리고 텍스트 내용, 제목, 단락 및 기본 스타일을 유지합니다. 이는 웹 콘텐츠(기사, 보고서, 기술 문서)로 재출판되는 문서에 대한 올바른 거래이며 레이아웃이 필수적인 문서(양식, 엄격한 위치가 지정된 송장, 디자인된 마케팅 자료)에 대한 잘못된 거래입니다.

이 도구는 PDF.js를 사용하여 PDF에서 텍스트, 글꼴 및 기본 구조를 추출한 다음 인쇄술용 CSS가 포함된 해당 HTML 마크업을 작성합니다. 출력은 모든 브라우저에서 열거나 CMS에 붙여넣거나 사용자 정의 CSS를 사용하여 추가 스타일을 지정할 수 있는 독립형 .html 파일입니다. 업로드가 발생하지 않습니다. 변환은 브라우저에서 실행됩니다.

두 가지 출력 스타일이 지원됩니다. 시맨틱 HTML은 블로그나 문서 사이트에 콘텐츠를 다시 게시하는 데 적합한 단락 및 제목 요소가 포함된 깔끔한 마크업을 생성합니다. Visual HTML은 절대 위치 지정을 통해 PDF 레이아웃을 더 많이 유지하므로 문서의 모양이 리플로우 가능성보다 더 중요한 경우에 적합합니다.

PDF를 HTML로 변환하는 이유

PDF는 웹에서 제대로 작동하지 않습니다. 모바일 브라우저는 PDF를 어색하게 렌더링하고, 화면 판독기가 PDF를 일관되지 않게 처리하고, 검색 엔진이 PDF를 크롤링하지만 동등한 HTML보다 순위가 낮으며, 웹 페이지에 PDF를 삽입하면 기본 경험이 아닌 투박한 iframe 뷰어가 생성됩니다. HTML로 변환하면 웹이 작동하는 방식으로 작동하는 콘텐츠가 생성됩니다.

HTML도 편집 가능합니다. PDF 콘텐츠가 HTML 형식이면 인쇄 체계를 변경하고, 섹션을 재구성하고, 대화형 요소를 추가하고, 콘텐츠를 다른 웹 페이지와 통합할 수 있습니다. PDF는 이러한 모든 작업에 저항합니다.

사용 방법

PDF를 삭제하고 출력 스타일을 선택한 후 생성하세요.

  1. PDF 업로드: 파일을 업로드 영역으로 드래그하거나 클릭하여 찾아보세요. 최대 50MB의 파일이 지원됩니다. 비밀번호로 보호된 PDF는 지원되지 않습니다. 먼저 보호를 제거하십시오.
  2. 출력 스타일 선택: 시맨틱 HTML은 단락 및 제목 태그가 있는 흐르는 콘텐츠를 생성합니다. 시각적 HTML은 절대 CSS를 통해 PDF의 위치를 ​​유지합니다. 레이아웃이 중요한 문서의 경우 시각적인 재게시를 위한 의미 체계를 선택하세요.
  3. 변환: PDF.js는 텍스트와 레이아웃을 추출합니다. 변환기는 글꼴 크기를 제목 수준에 매핑하고, 단락 구분을 식별하고, 입력 체계에 대한 CSS 스타일을 사용하여 HTML을 내보냅니다. 일반적인 문서의 경우 변환에는 몇 초가 걸립니다.
  4. HTML 다운로드: .html 파일을 저장합니다. 미리 보려면 어떤 브라우저에서든 열어보세요. CMS에서 콘텐츠를 사용하려면 본문 내부 콘텐츠를 복사하여 편집기에 붙여넣으세요.

일반적인 사용 사례

기술적인 세부사항

PDF.js는 경계 상자, 글꼴 및 유니코드 문자열이 포함된 항목으로 텍스트 콘텐츠를 노출합니다. 변환기는 읽기 순서를 복구하기 위해 Y, X 순으로 항목을 정렬하고, 유사한 기준선에 있는 항목을 줄로 그룹화하며, 세로 간격을 기준으로 줄을 단락으로 묶습니다.

제목 감지는 글꼴 크기 분석을 사용합니다. 본문 글꼴보다 훨씬 큰 크기는 제목이 되며 가장 큰 것은 h1에 매핑되고 다음으로 큰 것은 h2에 매핑됩니다. 목록 감지는 글머리 기호 문자 또는 숫자 시퀀스로 시작하는 줄을 찾습니다.

출력 HTML은 doctype, 타이포그래피용 CSS가 포함된 헤드, 변환된 콘텐츠가 포함된 본문 등 자체 포함되어 있습니다. PDF의 인라인 이미지는 현재 포함되지 않습니다. 이는 알려진 제한 사항으로 남아 있습니다. 출력은 HTML5로 검증됩니다.

모범 사례

자주 묻는 질문

PDF를 HTML로 변환하면 내용이 변경됩니까?
내용은 최대한 정확하게 보존됩니다. 그러나 일부 형식별 기능에는 직접적인 상응 기능이 없을 수 있으므로 사소한 형식 차이가 발생할 수 있습니다.
HTML 형식은 무엇에 사용됩니까?
HTML(HyperText Markup Language)은 주로 웹페이지와 웹 콘텐츠에 사용됩니다.
알아야 할 제한 사항이 있나요?
최대 50MB의 파일이 지원됩니다. 매우 크거나 복잡한 파일은 처리하는 데 시간이 더 오래 걸릴 수 있습니다. 모든 변환은 브라우저에서 이루어지므로 처리 속도는 장치에 따라 다릅니다.
내 문서 데이터는 안전한가요?
예. 문서 처리는 전적으로 브라우저에서 실행됩니다. 귀하의 파일과 그 내용은 어떤 서버에도 업로드되지 않습니다. 이렇게 하면 민감하거나 기밀인 문서를 안전하게 변환할 수 있습니다.
출력이 모바일 친화적인가요?
시맨틱 모드는 모든 너비에 맞게 흐르는 콘텐츠를 생성합니다. 비주얼 모드는 작은 화면에 적합하지 않은 절대 위치 지정을 사용합니다. 모바일의 경우 의미 체계 모드를 사용하세요.
내 PDF가 서버에 업로드됩니까?
아니요. PDF.js는 브라우저에서 실행됩니다. 파일이 장치를 떠나지 않습니다.
최대 파일 크기는 얼마입니까?
50MB. 문서가 클수록 구문 분석하는 데 시간이 더 오래 걸립니다.
변환 후 HTML을 편집할 수 있나요?
예 — 그게 요점의 일부입니다. 출력은 CSS가 포함된 일반 HTML로, 텍스트 편집기에서 쉽게 편집하거나 CMS에 붙여넣을 수 있습니다.