PDF ke Penukar HTML
Tukar dokumen PDF kepada membersihkan, fail HTML semantik terus dalam penyemak imbas anda. Pantas, selamat dan mengekalkan struktur dokumen.
Pilih fail PDF
atau seret dan lepaskan di sini
Tukar dokumen PDF kepada membersihkan, fail HTML semantik terus dalam penyemak imbas anda. Pantas, selamat dan mengekalkan struktur dokumen.
atau seret dan lepaskan di sini
Menukar PDF kepada HTML mengubah dokumen susun atur tetap menjadi halaman web yang mengalir. Penukaran mengekalkan kandungan teks, tajuk, perenggan dan penggayaan asas sambil meninggalkan reka letak piksel tepat PDF demi aliran responsif HTML. Ini ialah perdagangan yang betul untuk dokumen yang diterbitkan semula sebagai kandungan web — artikel, laporan, dokumentasi teknikal — dan perdagangan yang salah untuk dokumen yang reka letaknya penting — borang, invois dengan kedudukan yang ketat, bahagian pemasaran yang direka bentuk.
Alat ini menggunakan PDF.js untuk mengekstrak teks, fon dan struktur asas daripada PDF, kemudian menulis penanda HTML yang sepadan dengan CSS terbenam untuk tipografi. Output ialah fail .html kendiri yang anda boleh buka dalam mana-mana penyemak imbas, tampal ke dalam CMS atau gaya selanjutnya dengan CSS tersuai. Tiada muat naik berlaku; penukaran berjalan dalam penyemak imbas anda.
Dua gaya keluaran disokong. HTML Semantik menghasilkan penanda bersih dengan elemen perenggan dan tajuk, sesuai untuk menerbitkan semula kandungan pada blog atau tapak dokumentasi. HTML Visual mengekalkan lebih banyak reka letak PDF melalui kedudukan mutlak, sesuai apabila penampilan dokumen itu lebih penting daripada kebolehlilir semula.
PDF tidak berfungsi dengan baik di web. Penyemak imbas mudah alih memaparkan PDF dengan janggal, pembaca skrin mengendalikannya secara tidak konsisten, enjin carian merangkaknya tetapi meletakkannya lebih rendah daripada HTML yang setara, dan membenamkan PDF dalam halaman web menghasilkan pemapar dalam iframe yang kikuk dan bukannya pengalaman asli. Menukar kepada HTML menghasilkan kandungan yang berfungsi seperti web berfungsi.
HTML juga boleh diedit. Setelah kandungan PDF berada dalam bentuk HTML, anda boleh menukar tipografi, menyusun semula bahagian, menambah elemen interaktif dan menyepadukan kandungan dengan halaman web lain. PDF menentang semua operasi tersebut.
Lepaskan PDF, pilih gaya keluaran, jana.
PDF.js mendedahkan kandungan teks sebagai item dengan kotak sempadan, fon dan rentetan Unicode. Penukar mengisih item mengikut Y kemudian X untuk memulihkan tertib bacaan, mengumpulkan item pada garis dasar yang serupa ke dalam baris dan mengelompokkan baris ke dalam perenggan berdasarkan jarak menegak.
Pengesanan tajuk menggunakan analisis saiz fon: saiz yang jauh lebih besar daripada fon badan menjadi tajuk, dengan terbesar dipetakan kepada h1, terbesar seterusnya kepada h2 dan seterusnya. Pengesanan senarai mencari baris yang bermula dengan aksara titik atau jujukan angka.
HTML keluaran adalah serba lengkap: doctype, head dengan CSS terbenam untuk tipografi, body dengan kandungan yang ditukar. Imej sebaris daripada PDF tidak dibenamkan pada masa ini; mereka kekal sebagai batasan yang diketahui. Output disahkan sebagai HTML5.