Konverter PDF ke HTML
Konversi dokumen PDF ke file HTML yang bersih dan semantik langsung di browser Anda. Cepat, aman, dan menjaga struktur dokumen.
Pilih file PDF
atau seret dan lepas di sini
Konversi dokumen PDF ke file HTML yang bersih dan semantik langsung di browser Anda. Cepat, aman, dan menjaga struktur dokumen.
atau seret dan lepas di sini
Mengonversi PDF ke HTML mengubah dokumen dengan tata letak tetap menjadi halaman web yang mengalir. Konversi ini mempertahankan konten teks, judul, paragraf, dan gaya dasar sambil mengabaikan tata letak piksel persis PDF demi alur responsif HTML. Ini adalah perdagangan yang tepat untuk dokumen yang diterbitkan ulang sebagai konten web — artikel, laporan, dokumentasi teknis — dan perdagangan yang salah untuk dokumen yang tata letaknya penting — formulir, faktur dengan posisi yang ketat, bagian pemasaran yang dirancang.
Alat ini menggunakan PDF.js untuk mengekstrak teks, font, dan struktur dasar dari PDF, kemudian menulis markup HTML yang sesuai dengan CSS tertanam untuk tipografi. Outputnya adalah file .html mandiri yang dapat Anda buka di browser apa pun, tempelkan ke CMS, atau gaya lebih lanjut dengan CSS khusus. Tidak ada unggahan yang terjadi; konversi berjalan di browser Anda.
Dua gaya keluaran didukung. HTML semantik menghasilkan markup yang bersih dengan elemen paragraf dan judul, cocok untuk menerbitkan ulang konten di blog atau situs dokumentasi. Visual HTML mempertahankan lebih banyak tata letak PDF melalui pemosisian absolut, cocok ketika tampilan dokumen lebih penting daripada kemampuan mengalir ulang.
PDF tidak berfungsi dengan baik di web. Peramban seluler merender PDF dengan canggung, pembaca layar menanganinya secara tidak konsisten, mesin telusur merayapinya tetapi memberi peringkat lebih rendah dibandingkan HTML yang setara, dan menyematkan PDF di laman web menghasilkan penampil dalam iframe yang kikuk dibandingkan pengalaman asli. Mengonversi ke HTML menghasilkan konten yang berfungsi seperti web bekerja.
HTML juga dapat diedit. Setelah konten PDF dalam bentuk HTML, Anda dapat mengubah tipografi, menyusun ulang bagian, menambahkan elemen interaktif, dan mengintegrasikan konten dengan halaman web lain. PDF menolak semua operasi tersebut.
Jatuhkan PDF, pilih gaya keluaran, hasilkan.
PDF.js menampilkan konten teks sebagai item dengan kotak pembatas, font, dan string Unicode. Konverter mengurutkan item berdasarkan Y lalu X untuk memulihkan urutan bacaan, mengelompokkan item pada garis dasar yang sama ke dalam baris, dan mengelompokkan baris ke dalam paragraf berdasarkan spasi vertikal.
Deteksi judul menggunakan analisis ukuran font: ukuran yang jauh lebih besar daripada font isi menjadi judul, dengan yang terbesar dipetakan ke h1, yang terbesar berikutnya ke h2, dan seterusnya. Deteksi daftar mencari baris yang dimulai dengan karakter poin atau urutan numerik.
HTML keluarannya mandiri: doctype, head dengan CSS tertanam untuk tipografi, body dengan konten yang dikonversi. Gambar sebaris dari PDF saat ini tidak disematkan; mereka tetap menjadi batasan yang diketahui. Outputnya divalidasi sebagai HTML5.