PDF sang PNG Bộ chuyển đổi
Chuyển đổi tài liệu PDF của bạn thành hình ảnh PNG độ phân giải cao ngay lập tức. An toàn, nhanh chóng và hoàn toàn miễn phí.
Kéo và thả tệp vào đây
Định dạng hỗ trợ: PDF. Kích thước tệp tối đa: 50MB.
Chuyển đổi tài liệu PDF của bạn thành hình ảnh PNG độ phân giải cao ngay lập tức. An toàn, nhanh chóng và hoàn toàn miễn phí.
Định dạng hỗ trợ: PDF. Kích thước tệp tối đa: 50MB.
PDF và PNG nằm ở hai phía đối diện nhau của sự phân chia tài liệu/hình ảnh. PDF mô tả một trang bằng cách sử dụng lệnh vectơ, phông chữ nhúng và hình ảnh raster tùy chọn, tất cả đều có kích thước theo điểm cố định (1/72 inch). PNG lưu trữ một bitmap hình chữ nhật ở độ phân giải pixel cố định. Do đó, việc chuyển đổi từ PDF sang PNG là một bước tạo điểm ảnh: hướng dẫn vẽ của tệp PDF được thực thi ở một mức dpi đã chọn để tạo ra một bitmap, sau đó được mã hóa không mất dữ liệu dưới dạng PNG. Chọn mức độ nhạy sáng phù hợp là quyết định quan trọng nhất trong quá trình chuyển đổi này — quá thấp và văn bản sẽ bị mờ, quá cao và tệp sẽ trở nên lớn.
Bộ chuyển đổi này hiển thị từng trang PDF bằng PDF.js, cùng một công cụ mà Firefox cung cấp để xem PDF tích hợp. Quá trình hiển thị diễn ra trên canvas trong trình duyệt của bạn; không có phần nào của tập tin rời khỏi thiết bị của bạn. Đối với các tệp PDF nhiều trang, công cụ này tạo ra một PNG trên mỗi trang, được đặt tên bằng hậu tố số trang. Đối với các tệp PDF một trang, đầu ra là một PNG.
Các lựa chọn DPI phổ biến là 72 (tương đương với màn hình, tệp nhỏ nhất), 150 (tốt để xem trước trực tuyến và hầu hết các tài liệu), 300 (chất lượng in, phù hợp với OCR và in offset) và 600 (lưu trữ hoặc chụp chi tiết nhỏ). Cao hơn 600 hiếm khi tạo ra sự cải thiện rõ rệt và kích thước tệp tăng gấp bốn lần với mỗi lần tăng gấp đôi số điểm thi.
PDF không phải là hình ảnh. Không thể nhúng chúng nội tuyến vào email HTML, thả vào các nền tảng xã hội chỉ có hình ảnh, sử dụng làm hình nền máy tính hoặc dán vào cuộc trò chuyện không hỗ trợ tệp đính kèm. Việc hiển thị mỗi trang dưới dạng PNG sẽ biến PDF thành thứ mà mọi nền tảng đều hiểu được — với cái giá phải trả là mất đi văn bản, siêu liên kết có thể chọn và bất kỳ tính độc lập nào với độ phân giải vectơ mà bản gốc có.
Lý do chính khác là OCR. Nhiều quy trình nhận dạng ký tự quang học chạy trực tiếp trên các trình quét thay vì PDF vector trực tiếp; chuyển đổi sang PNG 300 dpi và cung cấp kết quả cho Tesseract, Cloud Vision hoặc dịch vụ OCR khác là quy trình làm việc tiêu chuẩn. PNG được ưu tiên hơn JPG ở đây vì các cạnh văn bản chịu ảnh hưởng rõ rệt do nén JPG ở kích thước nhỏ và hình phạt kích thước tệp cận biên của PNG không quan trọng bằng độ chính xác nhận dạng.
Thả tệp, chọn DPI, kết xuất. Công cụ này xử lý các tệp PDF đơn và nhiều trang theo cùng một cách.
PDF (ISO 32000) là ngôn ngữ mô tả trang có nguồn gốc từ PostScript. Mỗi trang chứa một luồng nội dung gồm các toán tử vẽ (di chuyển, đường thẳng, đường cong, vẽ, đặt phông chữ, hiển thị văn bản) hoạt động trên hệ tọa độ được đo bằng điểm. Kết xuất một tệp PDF có nghĩa là di chuyển luồng nội dung đó và thực thi từng toán tử trên bề mặt mục tiêu - trong trường hợp này là canvas HTML5.
PDF.js triển khai quy trình kết xuất này bằng JavaScript. Công cụ này khởi tạo tài liệu PDF.js, gọi getPage(n) cho mỗi trang và sử dụng page.render({canvasContext, viewport}) trong đó chế độ xem được tính toán từ DPI được yêu cầu. Canvas kết quả được xuất qua canvas.toBlob('image/png'). Các tệp PDF nhiều trang được xử lý tuần tự; đầu ra được thu thập vào kho lưu trữ JSZip và được tải xuống.
Chọn PPI: một trang US Letter PDF có kích thước 612 × 792 điểm. Ở 72DPI, bitmap được hiển thị là 612 × 792 pixel (khoảng 0,5 MP); ở 150 dpi, 1275 × 1650 (2,1 MP); ở 300 dpi, 2550 × 3300 (8,4 MP); ở 600 dpi, 5100 × 6600 (33,7 MP). Bộ nhớ và thang thời gian với số pixel.