PDF kohteeseen Word (DOCX)
Pura teksti PDF-tiedostosta ja muunna se muokattavaan Word-muotoon kokonaan selaimessasi. Nopea, turvallinen ja yksityinen.
Pudota PDF-tiedosto tähän
Tukee jopa 50 Mt
Pura teksti PDF-tiedostosta ja muunna se muokattavaan Word-muotoon kokonaan selaimessasi. Nopea, turvallinen ja yksityinen.
Tukee jopa 50 Mt
PDF ja DOCX (Microsoft Word) kuvaavat asiakirjoja käyttämällä täysin erilaisia malleja. PDF on kiinteän asettelun muoto: jokaisella kuviolla on selkeä sijainti kiinteän kokoisella sivulla, jolloin asiakirja näyttää samalta kaikkialla, missä se hahmonnetaan. DOCX on flow-layout-muoto: kappaleet, taulukot ja otsikot kuvataan semanttisesti, ja renderöintikone päättää, mihin ne sijaitsevat sivulla nykyisen sivukoon ja fonttien saatavuuden perusteella. Muuntaminen PDF-tiedostosta DOCX-muotoon tarkoittaa kiinteän asettelun käänteissuunnittelua semanttiseksi rakenteeksi, jonka Word voi muuttaa uudelleen.
Tämä muunnos on luonnostaan häviöllinen. PDF ei yleensä säilytä otsikkotasoja, kappalerajoja, luettelorakennetta tai taulukon semantiikkaa; muuntimen on pääteltävä nämä kirjasinkokojen, paikkojen ja luettelomerkkien perusteella. Yksinkertaiset tekstipohjaiset PDF-tiedostot muunnetaan siististi. Monimutkaiset PDF-tiedostot, joissa on usean sarakkeen asettelu, upotetut kuvat, alaviitteet tai epätavallinen typografia, vaativat yleensä manuaalisen puhdistamisen muuntamisen jälkeen.
Tämä työkalu suorittaa muunnoksen selaimessasi käyttämällä PDF.js-tiedostoa jäsentämiseen ja mukautettua ulkoasua DOCX-kirjoittajaksi, joka tuottaa tavallisen Office Open XML -tulosteen. Tulos avautuu Microsoft Wordissa, LibreOffice Writerissä, Google Docsissa ja missä tahansa muussa DOCX-yhteensopivassa editorissa. latausta ei tapahdu; tiedosto pysyy laitteessasi.
Muokattavuus on koko syy. PDF on vihamielinen muokkaukselle – voit täyttää lomakekenttiä ja tehdä huomautuksia, mutta et voi järjestellä tekstiä uudelleen, muuttaa kappaletyylejä tai järjestellä sisältöä uudelleen ilman erikoistuneita PDF-editoreja, jotka maksavat rahaa ja tuottavat epäjohdonmukaisia tuloksia. DOCX on rakennettu muokkausta varten. PDF-tiedoston muuntaminen DOCX-muotoon tekee sisällöstä tarkistettavissa olevaa tarkistusta, käännöstä, uudelleenkäyttöä tai uudelleensuunnittelua varten.
Toinen syy on yhteistyö. Word ja Google Docs ovat asiakirjayhteistyön lingua francaa toimistoissa, kouluissa ja useimmissa organisaatioissa. Kommenttisäikeissä, seurantamuutoksissa ja jaetuissa muokkauksissa oletetaan DOCX:ää tai sen pilvivastineita. Tarkistettavaksi lähetetyistä PDF-tiedostoista tulee pullonkauloja; DOCX kulkee tavallisten yhteistyötyökalujen kautta.
Pudota PDF, luo, lataa. Odota, että siivoat Wordissa myöhemmin.
PDF.js jäsentää jokaisen PDF-sivun teksti- ja grafiikkatoimintojen virraksi. Tekstinpoistosovellusliittymä palauttaa tekstikohteet niiden rajauslaatikoilla, kirjasintiedoilla ja Unicode-dekoodatuilla merkkijonoilla. Näistä kohteista muunnin rekonstruoi lukujärjestyksen lajittelemalla ylhäältä alas ja vasemmalta oikealle ryhmittelemällä kohteet, joilla on samanlaiset perusviivat riveiksi ja rivit kappaleiksi.
DOCX on zip-arkisto, joka sisältää XML-tiedostoja (document.xml, styles.xml sekä sisältötyyppi- ja suhdeluettelot). Muunnin rakentaa document.xml-sisällön käyttämällä useita kappale- (w:p)- ja run (w:r) -elementtejä, käyttää tyyliviittauksia otsikoille (Otsikko 1, Otsikko 2), joissa fontin koko ehdottaa otsikkoa, ja kokoaa zip-tiedoston muistiin JSZip:n avulla.
Rajoitukset: sarakkeiden asetteluja ei aina rekonstruoida oikein. PDF-tiedoston taulukot palautetaan kappaleina, ellei asettelu viittaa vahvasti taulukkorakenteeseen. Ylätunnisteet, alatunnisteet ja alaviitteet päätyvät yleensä tekstin sisäpuolelle vastaavien DOCX-alueiden sijaan. PDF-tiedostoon upotetut kuvat eivät tällä hetkellä säily DOCX-tulostuksessa.