Libreng Converter

PDF sa HTML Converter

I-convert ang mga PDF na dokumento sa malinis, semantic na HTML na mga file nang direkta sa iyong browser. Mabilis, secure, at pinapanatili ang istraktura ng dokumento.

Piliin ang PDF file

o i-drag at i-drop dito

O kaya

Tungkol sa tool na ito

Binabago ng pag-convert ng PDF sa HTML ang isang nakapirming layout na dokumento sa isang dumadaloy na web page. Ang conversion ay nagpapanatili ng nilalaman ng teksto, mga heading, mga talata, at pangunahing estilo habang iniiwan ang eksaktong layout ng pixel ng PDF sa pabor sa tumutugon na daloy ng HTML. Ito ang tamang kalakalan para sa mga dokumentong muling na-publish bilang nilalaman sa web — mga artikulo, ulat, teknikal na dokumentasyon — at ang maling kalakalan para sa mga dokumento na ang layout ay mahalaga — mga form, mga invoice na may mahigpit na pagpoposisyon, mga dinisenyong piraso ng marketing.

Gumagamit ang tool na ito ng PDF.js para mag-extract ng text, font, at basic structure mula sa PDF, pagkatapos ay magsusulat ng kaukulang HTML markup na may naka-embed na CSS para sa typography. Ang output ay isang standalone na .html file na maaari mong buksan sa anumang browser, i-paste sa isang CMS, o higit pang istilo gamit ang custom na CSS. Walang upload na mangyayari; tumatakbo ang conversion sa iyong browser.

Dalawang istilo ng output ang sinusuportahan. Ang Semantic HTML ay gumagawa ng malinis na markup na may mga elemento ng talata at heading, na angkop para sa muling pag-publish ng nilalaman sa isang blog o site ng dokumentasyon. Pinapanatili ng Visual HTML ang higit pa sa layout ng PDF sa pamamagitan ng ganap na pagpoposisyon, na angkop kapag ang hitsura ng dokumento ay mas mahalaga kaysa sa muling pagdaloy.

Bakit I-convert ang PDF sa HTML

Ang mga PDF ay hindi gumagana nang maayos sa web. Ang mga mobile browser ay nagre-render ng mga PDF nang awkward, ang mga screen reader ay humahawak sa mga ito nang hindi pare-pareho, ang mga search engine ay nag-crawl sa mga ito ngunit niraranggo ang mga ito nang mas mababa kaysa sa katumbas na HTML, at ang pag-embed ng isang PDF sa isang webpage ay gumagawa ng clunky in-iframe viewer sa halip na isang katutubong karanasan. Ang pag-convert sa HTML ay gumagawa ng nilalamang gumagana sa paraang gumagana ang web.

Nae-edit din ang HTML. Kapag ang nilalaman ng PDF ay nasa HTML na form, maaari mong baguhin ang typography, muling isaayos ang mga seksyon, magdagdag ng mga interactive na elemento, at isama ang nilalaman sa iba pang mga web page. Pinipigilan ng PDF ang lahat ng mga operasyong iyon.

Paano gamitin

I-drop ang PDF, piliin ang istilo ng output, bumuo.

  1. I-upload ang iyong PDF: I-drag ang file sa lugar ng pag-upload o i-click upang mag-browse. Sinusuportahan ang mga file na hanggang 50 MB. Hindi sinusuportahan ang mga PDF na protektado ng password; tanggalin muna ang proteksyon.
  2. Pumili ng istilo ng output: Ang Semantic HTML ay gumagawa ng dumadaloy na nilalaman na may mga tag ng talata at heading. Pinapanatili ng Visual HTML ang pagpoposisyon ng PDF sa pamamagitan ng ganap na CSS. Pumili ng semantic para sa muling pag-publish, visual para sa layout-kritikal na mga dokumento.
  3. Magbalik-loob: Kinukuha ng PDF.js ang text at layout. Ang converter ay nagmamapa ng mga laki ng font sa mga antas ng heading, kinikilala ang mga break ng talata, at naglalabas ng HTML na may CSS styling para sa typography. Ang conversion ay tumatagal ng ilang segundo para sa karaniwang mga dokumento.
  4. I-download ang HTML: I-save ang .html file. Buksan ito sa anumang browser upang i-preview. Upang gamitin ang nilalaman sa isang CMS, kopyahin ang nilalaman ng panloob na katawan at i-paste sa editor.

Mga Pangkaraniwang Paggamit

Mga Detalye ng Teknikal

Inilalantad ng PDF.js ang text content bilang mga item na may mga bounding box, font, at Unicode string. Ang converter ay nagbubukod-bukod ng mga item ayon sa Y pagkatapos X upang mabawi ang pagkakasunud-sunod ng pagbabasa, pinapangkat ang mga item sa magkatulad na baseline sa mga linya, at pinagsasama-sama ang mga linya sa mga talata batay sa vertical spacing.

Gumagamit ang pag-detect ng heading ng pagsusuri sa laki ng font: nagiging mga heading ang mga laki na mas malaki kaysa sa body font, na ang pinakamalaking nakamapa sa h1, ang susunod na pinakamalaking sa h2, at iba pa. Ang pag-detect ng listahan ay naghahanap ng mga linya na nagsisimula sa mga bullet na character o mga numeric sequence.

Ang output na HTML ay self-contained: doctype, head na may naka-embed na CSS para sa typography, body na may na-convert na content. Ang mga inline na larawan mula sa PDF ay kasalukuyang hindi naka-embed; nananatili silang isang kilalang limitasyon. Ang output ay nagpapatunay bilang HTML5.

Pinakamahusay na Kasanayan

Mga madalas itanong

Binabago ba ng pag-convert ng PDF sa HTML ang nilalaman?
Ang nilalaman ay pinapanatili nang tumpak hangga't maaari. Gayunpaman, maaaring walang direktang katumbas ang ilang feature na partikular sa format, kaya maaaring magkaroon ng maliliit na pagkakaiba sa pag-format.
Ano ang ginagamit na format ng HTML?
Pangunahing ginagamit ang HTML (HyperText Markup Language) para sa mga web page at nilalaman ng web.
Mayroon bang anumang mga limitasyon na dapat malaman?
Sinusuportahan ang mga file na hanggang 50MB. Maaaring mas matagal bago maproseso ang napakalaki o kumplikadong mga file. Ang lahat ng conversion ay nangyayari sa iyong browser, kaya ang bilis ng pagproseso ay nakasalalay sa iyong device.
Secure ba ang data ng aking dokumento?
Oo. Ang pagpoproseso ng dokumento ay ganap na tumatakbo sa iyong browser. Ang iyong mga file at ang kanilang mga nilalaman ay hindi kailanman ina-upload sa anumang server. Ginagawa nitong ligtas ang pag-convert ng mga sensitibo o kumpidensyal na dokumento.
Mobile-friendly ba ang output?
Gumagawa ang semantic mode ng content na dumadaloy upang magkasya sa anumang lapad. Gumagamit ang visual mode ng ganap na pagpoposisyon na hindi umaangkop sa maliliit na screen. Para sa mobile, gumamit ng semantic mode.
Na-upload ba ang aking PDF sa isang server?
Hindi. Gumagana ang PDF.js sa iyong browser; hindi umaalis ang file sa iyong device.
Ano ang maximum na laki ng file?
50 MB. Mas matagal na ma-parse ang mga malalaking dokumento.
Maaari ko bang i-edit ang HTML pagkatapos ng conversion?
Oo — bahagi iyon ng punto. Ang output ay simpleng HTML na may naka-embed na CSS, madaling i-edit sa anumang text editor o i-paste sa isang CMS.