Libreng Converter

PDF sa Word (DOCX)

I-extract ang text mula sa PDF at i-convert ito sa nae-edit na Word format nang buo sa iyong browser. Mabilis, secure, at pribado.

I-drop ang PDF file dito

Sinusuportahan ang hanggang 50MB

O kaya

Tungkol sa tool na ito

Ang PDF at DOCX (Microsoft Word) ay naglalarawan ng mga dokumento na gumagamit ng magkakaibang mga modelo. Ang PDF ay isang fixed-layout na format: bawat glyph ay may tahasang posisyon sa isang fixed-size na page, na ginagawang magkapareho ang hitsura ng dokumento saanman ito i-render. Ang DOCX ay isang format ng flow-layout: ang mga talata, talahanayan, at heading ay inilarawan sa semantiko, at ang rendering engine ay nagpapasya kung saan sila mahuhulog sa pahina batay sa kasalukuyang laki ng pahina at pagkakaroon ng font. Ang pag-convert mula sa PDF sa DOCX ay nangangahulugang reverse-engineering ang nakapirming layout sa isang semantic na istraktura na maaaring muling dumaloy ng Word.

Ang conversion na ito ay likas na lossy. Karaniwang hindi pinapanatili ng PDF ang mga antas ng heading, mga hangganan ng talata, istraktura ng listahan, o semantika ng talahanayan; kailangang ipahiwatig ng converter ang mga ito mula sa mga laki ng font, posisyon, at bullet character. Ang mga simpleng PDF na nakabatay sa teksto ay malinis na nagko-convert. Ang mga kumplikadong PDF na may mga multi-column na layout, naka-embed na larawan, footnote, o hindi pangkaraniwang typography ay karaniwang nangangailangan ng manual na paglilinis pagkatapos ng conversion.

Ang tool na ito ay nagpapatakbo ng conversion sa iyong browser gamit ang PDF.js para sa pag-parse at isang custom na layout-to-DOCX na manunulat na gumagawa ng karaniwang Office Open XML na output. Ang resulta ay bubukas sa Microsoft Word, LibreOffice Writer, Google Docs, at anumang iba pang editor na katugma sa DOCX. Walang upload na mangyayari; mananatili ang file sa iyong device.

Bakit I-convert ang PDF sa DOCX

Editability ay ang buong dahilan. Ang PDF ay salungat sa pag-edit — maaari mong punan ang mga patlang ng form at mag-annotate, ngunit hindi ka maaaring mag-reflow ng teksto, magbago ng mga istilo ng talata, o mag-restructure ng nilalaman nang walang mga espesyal na editor ng PDF na nagkakahalaga ng pera at makagawa ng hindi pare-parehong mga resulta. Ang DOCX ay binuo para sa pag-edit. Ang pag-convert ng PDF sa DOCX ay ginagawang tractable ang content para sa rebisyon, pagsasalin, repurposing, o muling pagdidisenyo.

Ang iba pang dahilan ay pakikipagtulungan. Ang Word at Google Docs ay ang lingua franca ng pakikipagtulungan ng dokumento sa mga opisina, paaralan, at karamihan sa mga organisasyon. Ang mga thread ng komento, subaybayan ang mga pagbabago, at ibinahaging pag-edit ay ipinapalagay na DOCX o mga katumbas nito sa cloud. Ang mga PDF na ipinadala para sa pagsusuri ay nagiging mga bottleneck; Ang DOCX ay dumadaloy sa mga karaniwang tool sa pakikipagtulungan.

Paano gamitin

I-drop ang PDF, bumuo, mag-download. Asahan na gumawa ng ilang paglilinis sa Word pagkatapos.

  1. I-upload ang iyong PDF: I-drag ang file sa lugar ng pag-upload o i-click upang mag-browse. Sinusuportahan ang mga file na hanggang 50 MB. Hindi sinusuportahan ang mga PDF na protektado ng password; alisin muna ang password gamit ang desktop tool.
  2. Maghintay para sa pag-parse: Kinukuha ng PDF.js ang teksto, impormasyon ng font, at mga posisyon ng layout mula sa bawat pahina. Ang pag-parse ay tumatagal ng ilang segundo para sa mga maiikling dokumento at mas matagal para sa mga dokumentong may mga naka-embed na larawan o kumplikadong mga graphics.
  3. Magbalik-loob: Ang converter ay naglalakad sa na-parse na nilalaman, naghihinuha ng mga hangganan ng talata at heading mula sa mga laki at posisyon ng font, at nagsusulat ng Office Open XML sa isang in-memory na zip file. Ang mga heading, talata, at listahan ng bullet ay nakamapa sa katumbas na mga estilo ng DOCX.
  4. I-download at linisin: I-save ang .docx file at buksan ito sa Word o sa iyong gustong editor. Magplanong gumugol ng ilang minuto sa pag-aayos ng mga natitirang isyu — heading hierarchy, list formatting, table boundaries — na ang converter ay hindi lubos na mahihinuha mula sa PDF.

Mga Pangkaraniwang Paggamit

Mga Detalye ng Teknikal

Pino-parse ng PDF.js ang bawat pahina ng PDF sa isang stream ng mga pagpapatakbo ng text at graphics. Ang text-extraction API ay nagbabalik ng mga text item kasama ang kanilang mga bounding box, impormasyon ng font, at Unicode-decoded string. Mula sa mga item na ito ang converter ay muling bumubuo ng pagkakasunud-sunod ng pagbasa sa pamamagitan ng pag-uuri mula sa itaas hanggang sa ibaba at kaliwa-pakanan, pagpapangkat-pangkat ng mga item na may katulad na mga baseline sa mga linya at linya sa mga talata.

Ang DOCX ay isang zip archive na naglalaman ng mga XML file (document.xml, styles.xml, kasama ang uri ng nilalaman at mga manifest ng relasyon). Binubuo ng converter ang document.xml na nilalaman gamit ang isang serye ng mga elemento ng talata (w:p) at patakbuhin ang (w:r), naglalapat ng mga style reference para sa mga heading (Heading 1, Heading 2) kung saan ang laki ng font ay nagmumungkahi ng heading, at binubuo ang zip sa memorya gamit ang JSZip.

Mga Limitasyon: ang mga layout ng column ay hindi palaging naaayos nang tama. Ang mga talahanayan sa PDF ay binabawi bilang mga talata maliban kung ang layout ay malakas na nagmumungkahi ng tabular na istraktura. Ang mga header, footer, at footnote ay karaniwang nauuwi sa inline sa katawan kaysa sa kaukulang mga DOCX zone. Ang mga larawang naka-embed sa PDF ay kasalukuyang hindi napreserba sa DOCX output.

Pinakamahusay na Kasanayan

Mga madalas itanong

Binabago ba ng pag-convert ng PDF sa DOCX ang nilalaman?
Ang nilalaman ay pinapanatili nang tumpak hangga't maaari. Gayunpaman, maaaring walang direktang katumbas ang ilang feature na partikular sa format, kaya maaaring magkaroon ng maliliit na pagkakaiba sa pag-format.
Ano ang DOCX format na ginagamit?
Ang DOCX (Microsoft Word Document) ay pangunahing ginagamit para sa mga nae-edit na dokumento ng teksto na may pag-format.
Mayroon bang anumang mga limitasyon na dapat malaman?
Sinusuportahan ang mga file na hanggang 50MB. Maaaring mas matagal bago maproseso ang napakalaki o kumplikadong mga file. Ang lahat ng conversion ay nangyayari sa iyong browser, kaya ang bilis ng pagproseso ay nakasalalay sa iyong device.
Secure ba ang data ng aking dokumento?
Oo. Ang pagpoproseso ng dokumento ay ganap na tumatakbo sa iyong browser. Ang iyong mga file at ang kanilang mga nilalaman ay hindi kailanman ina-upload sa anumang server. Ginagawa nitong ligtas ang pag-convert ng mga sensitibo o kumpidensyal na dokumento.
Mapangalagaan ba ang mga mesa?
Ang mga simpleng talahanayan kung minsan ay nagiging mga talahanayan ng Word; ang mga kumplikadong talahanayan ay karaniwang nagko-convert sa mga naka-format na talata na nangangailangan ng manu-manong restructuring. Magplano na muling likhain ang mga kritikal na talahanayan nang manu-mano kung mahalaga ang katumpakan.
Na-upload ba ang aking PDF sa isang server?
Hindi. Gumagamit ang pag-parse ng PDF ng PDF.js at ang pagsusulat ng DOCX ay gumagamit ng JSZip — parehong tumatakbo nang buo sa iyong browser.
Ano ang maximum na laki ng file?
50 MB. Ang mga praktikal na limitasyon ay nakasalalay sa pagiging kumplikado ng dokumento; ang isang PDF na mabigat sa teksto na ganoon ang laki ay nagko-convert sa ilang segundo, habang ang isang mabigat na graphics na dokumento na may parehong laki ay maaaring mahirapan.
Maaari ko bang i-convert ang mga PDF na protektado ng password?
Hindi. Ang PDF.js ay hindi nagpapatupad ng decryption. Alisin muna ang password gamit ang desktop tool gaya ng qpdf o mga setting ng seguridad ng Acrobat.