Darmowy konwerter

PDF do Słowo (DOCX)

Wyodrębnij tekst z pliku PDF i przekonwertuj go całkowicie do edytowalnego formatu Word w przeglądarce. Szybko, bezpiecznie i prywatnie.

Upuść tutaj plik PDF

Obsługuje do 50 MB

Lub

O tym narzędziu

PDF i DOCX (Microsoft Word) opisują dokumenty przy użyciu zasadniczo różnych modeli. PDF to format o stałym układzie: każdy glif ma wyraźną pozycję na stronie o stałym rozmiarze, dzięki czemu dokument wygląda identycznie w każdym miejscu, w którym jest renderowany. DOCX to format układu przepływu: akapity, tabele i nagłówki są opisywane semantycznie, a silnik renderujący decyduje, gdzie się one znajdują na stronie w oparciu o bieżący rozmiar strony i dostępność czcionki. Konwersja z formatu PDF na DOCX oznacza inżynierię wsteczną ustalonego układu w strukturę semantyczną, którą program Word może ponownie wykorzystać.

Ta konwersja jest z natury stratna. Plik PDF zasadniczo nie zachowuje poziomów nagłówków, granic akapitów, struktury list ani semantyki tabel; konwerter musi je wywnioskować na podstawie rozmiarów czcionek, pozycji i znaków punktorów. Proste tekstowe pliki PDF można konwertować w prosty sposób. Złożone pliki PDF z układami wielokolumnowymi, osadzonymi obrazami, przypisami lub nietypową typografią zwykle wymagają ręcznego czyszczenia po konwersji.

To narzędzie przeprowadza konwersję w przeglądarce przy użyciu pliku PDF.js do analizowania i niestandardowego modułu zapisującego układ do formatu DOCX, który generuje standardowe dane wyjściowe pakietu Office Open XML. Wynik zostanie otwarty w programie Microsoft Word, LibreOffice Writer, Dokumentach Google i dowolnym innym edytorze zgodnym z DOCX. Nie następuje przesyłanie; plik pozostanie na Twoim urządzeniu.

Dlaczego warto konwertować pliki PDF na DOCX

Możliwość edycji jest jedynym powodem. PDF jest wrogo nastawiony do edycji — możesz wypełniać pola formularzy i dodawać adnotacje, ale nie możesz zmieniać układu tekstu, zmieniać stylów akapitów ani restrukturyzować treści bez wyspecjalizowanych edytorów PDF, które są kosztowne i dają niespójne wyniki. DOCX jest stworzony do edycji. Konwersja pliku PDF do formatu DOCX sprawia, że ​​treść można poddać rewizji, tłumaczeniu, zmianie przeznaczenia lub przeprojektowaniu.

Drugim powodem jest współpraca. Word i Dokumenty Google to język współpracy nad dokumentami w biurach, szkołach i większości organizacji. Wątki komentarzy, śledzenie zmian i wspólne edytowanie zakładają DOCX lub jego odpowiedniki w chmurze. Pliki PDF wysyłane do recenzji stają się wąskimi gardłami; DOCX przepływa przez standardowe narzędzia do współpracy.

Jak używać

Upuść plik PDF, wygeneruj i pobierz. Spodziewaj się później zrobienia porządków w programie Word.

  1. Prześlij swój plik PDF: Przeciągnij plik do obszaru przesyłania lub kliknij, aby przeglądać. Obsługiwane są pliki do 50 MB. Pliki PDF chronione hasłem nie są obsługiwane; najpierw usuń hasło za pomocą narzędzia komputerowego.
  2. Poczekaj na parsowanie: PDF.js wyodrębnia tekst, informacje o czcionce i położenie układu z każdej strony. Analizowanie zajmuje kilka sekund w przypadku krótkich dokumentów i dłużej w przypadku dokumentów z osadzonymi obrazami lub złożoną grafiką.
  3. Konwertuj: Konwerter analizuje przeanalizowaną treść, wyznacza granice akapitów i nagłówków na podstawie rozmiarów i pozycji czcionek oraz zapisuje format Office Open XML do pliku ZIP znajdującego się w pamięci. Nagłówki, akapity i listy punktowane są mapowane na odpowiadające im style DOCX.
  4. Pobierz i wyczyść: Zapisz plik .docx i otwórz go w programie Word lub preferowanym edytorze. Zaplanuj poświęcenie kilku minut na naprawienie pozostałych problemów — hierarchii nagłówków, formatowania listy, granic tabel — których konwerter nie mógł idealnie wywnioskować z pliku PDF.

Typowe przypadki użycia

Szczegóły techniczne

PDF.js analizuje każdą stronę PDF w strumień operacji tekstowych i graficznych. Interfejs API wyodrębniania tekstu zwraca elementy tekstowe z ich ramkami ograniczającymi, informacjami o czcionce i ciągami zdekodowanymi w formacie Unicode. Na podstawie tych elementów konwerter rekonstruuje kolejność czytania, sortując od góry do dołu i od lewej do prawej, grupując elementy o podobnych liniach bazowych w linie i linie w akapity.

DOCX to archiwum zip zawierające pliki XML (document.xml, Style.xml oraz manifesty typów zawartości i relacji). Konwerter tworzy zawartość document.xml przy użyciu serii elementów akapitowych (w:p) i run (w:r), stosuje odniesienia do stylu dla nagłówków (Nagłówek 1, Nagłówek 2), gdzie rozmiar czcionki sugeruje nagłówek, i składa plik zip w pamięci za pomocą JSZip.

Ograniczenia: układy kolumn nie zawsze są rekonstruowane poprawnie. Tabele w pliku PDF są odtwarzane jako akapity, chyba że układ wyraźnie sugeruje strukturę tabelaryczną. Nagłówki, stopki i przypisy zwykle trafiają do treści, a nie do odpowiednich stref DOCX. Obrazy osadzone w pliku PDF nie są obecnie zachowywane w pliku wyjściowym DOCX.

Najlepsze praktyki

Często zadawane pytania

Czy konwersja pliku PDF na DOCX zmienia treść?
Treść jest zachowywana tak dokładnie, jak to możliwe. Jednak niektóre funkcje specyficzne dla formatu mogą nie mieć bezpośrednich odpowiedników, dlatego mogą wystąpić drobne różnice w formatowaniu.
Do czego służy format DOCX?
DOCX (dokument Microsoft Word) jest używany głównie w edytowalnych dokumentach tekstowych z formatowaniem.
Czy są jakieś ograniczenia, o których warto wiedzieć?
Obsługiwane są pliki do 50 MB. Przetwarzanie bardzo dużych lub złożonych plików może zająć więcej czasu. Cała konwersja odbywa się w Twojej przeglądarce, więc szybkość przetwarzania zależy od Twojego urządzenia.
Czy dane w moim dokumencie są bezpieczne?
Tak. Przetwarzanie dokumentów odbywa się całkowicie w Twojej przeglądarce. Twoje pliki i ich zawartość nigdy nie są przesyłane na żaden serwer. Dzięki temu konwersja wrażliwych lub poufnych dokumentów jest bezpieczna.
Czy tablice zostaną zachowane?
Proste tabele czasami przekształcają się w tabele programu Word; złożone tabele zazwyczaj przekształcają się w sformatowane akapity, które wymagają ręcznej restrukturyzacji. Jeśli precyzja ma znaczenie, zaplanuj ręczne odtworzenie krytycznych tabel.
Czy mój plik PDF zostanie przesłany na serwer?
Nie. Analiza plików PDF wykorzystuje plik PDF.js, a zapis DOCX — JSZip — oba działają w całości w przeglądarce.
Jaki jest maksymalny rozmiar pliku?
50 MB. Praktyczne ograniczenia zależą od złożoności dokumentu; konwersja pliku PDF zawierającego dużą ilość tekstu o tym rozmiarze trwa kilka sekund, podczas gdy dokument zawierający dużą ilość grafiki o tym samym rozmiarze może powodować problemy.
Czy mogę konwertować pliki PDF chronione hasłem?
Nie. PDF.js nie implementuje deszyfrowania. Najpierw usuń hasło za pomocą narzędzia komputerowego, takiego jak qpdf lub ustawień zabezpieczeń programu Acrobat.