PDF로 HTML 변환기
PDF 문서를 브라우저에서 직접 깔끔하고 의미 있는 HTML 파일로 변환하세요. 빠르고 안전하며 문서 구조를 보존합니다.
PDF 파일 선택
아니면 여기로 드래그 앤 드롭하세요.
PDF 문서를 브라우저에서 직접 깔끔하고 의미 있는 HTML 파일로 변환하세요. 빠르고 안전하며 문서 구조를 보존합니다.
아니면 여기로 드래그 앤 드롭하세요.
PDF를 HTML로 변환하면 고정 레이아웃 문서가 흐르는 웹 페이지로 변환됩니다. 변환에서는 HTML의 반응 흐름을 위해 PDF의 정확한 픽셀 레이아웃을 버리고 텍스트 내용, 제목, 단락 및 기본 스타일을 유지합니다. 이는 웹 콘텐츠(기사, 보고서, 기술 문서)로 재출판되는 문서에 대한 올바른 거래이며 레이아웃이 필수적인 문서(양식, 엄격한 위치가 지정된 송장, 디자인된 마케팅 자료)에 대한 잘못된 거래입니다.
이 도구는 PDF.js를 사용하여 PDF에서 텍스트, 글꼴 및 기본 구조를 추출한 다음 인쇄술용 CSS가 포함된 해당 HTML 마크업을 작성합니다. 출력은 모든 브라우저에서 열거나 CMS에 붙여넣거나 사용자 정의 CSS를 사용하여 추가 스타일을 지정할 수 있는 독립형 .html 파일입니다. 업로드가 발생하지 않습니다. 변환은 브라우저에서 실행됩니다.
두 가지 출력 스타일이 지원됩니다. 시맨틱 HTML은 블로그나 문서 사이트에 콘텐츠를 다시 게시하는 데 적합한 단락 및 제목 요소가 포함된 깔끔한 마크업을 생성합니다. Visual HTML은 절대 위치 지정을 통해 PDF 레이아웃을 더 많이 유지하므로 문서의 모양이 리플로우 가능성보다 더 중요한 경우에 적합합니다.
PDF는 웹에서 제대로 작동하지 않습니다. 모바일 브라우저는 PDF를 어색하게 렌더링하고, 화면 판독기가 PDF를 일관되지 않게 처리하고, 검색 엔진이 PDF를 크롤링하지만 동등한 HTML보다 순위가 낮으며, 웹 페이지에 PDF를 삽입하면 기본 경험이 아닌 투박한 iframe 뷰어가 생성됩니다. HTML로 변환하면 웹이 작동하는 방식으로 작동하는 콘텐츠가 생성됩니다.
HTML도 편집 가능합니다. PDF 콘텐츠가 HTML 형식이면 인쇄 체계를 변경하고, 섹션을 재구성하고, 대화형 요소를 추가하고, 콘텐츠를 다른 웹 페이지와 통합할 수 있습니다. PDF는 이러한 모든 작업에 저항합니다.
PDF를 삭제하고 출력 스타일을 선택한 후 생성하세요.
PDF.js는 경계 상자, 글꼴 및 유니코드 문자열이 포함된 항목으로 텍스트 콘텐츠를 노출합니다. 변환기는 읽기 순서를 복구하기 위해 Y, X 순으로 항목을 정렬하고, 유사한 기준선에 있는 항목을 줄로 그룹화하며, 세로 간격을 기준으로 줄을 단락으로 묶습니다.
제목 감지는 글꼴 크기 분석을 사용합니다. 본문 글꼴보다 훨씬 큰 크기는 제목이 되며 가장 큰 것은 h1에 매핑되고 다음으로 큰 것은 h2에 매핑됩니다. 목록 감지는 글머리 기호 문자 또는 숫자 시퀀스로 시작하는 줄을 찾습니다.
출력 HTML은 doctype, 타이포그래피용 CSS가 포함된 헤드, 변환된 콘텐츠가 포함된 본문 등 자체 포함되어 있습니다. PDF의 인라인 이미지는 현재 포함되지 않습니다. 이는 알려진 제한 사항으로 남아 있습니다. 출력은 HTML5로 검증됩니다.