Ingyenes konverter

PDF ide Excel (XLSX) konverter

Kivonja a táblázatokat és szövegeket PDF-ből, és biztonságosan konvertálja őket Excel XLSX táblázatokká a böngészőben.

Húzza ide a PDF fájlt

vagy kattintson a fájl kiválasztásához

Vagy

Az eszközről

A táblázatos adatok PDF-ből táblázatba húzása az egyik leggyakoribb dokumentum-munkafolyamat a számlákat, pénzügyi jelentéseket, tudományos közleményeket és kormányzati adatokat kezelő irodákban. A PDF formátum natívan nem érti a táblázatokat – csak a karakterjelek pozícióit írja le az oldalon –, így az Excel-be való konvertáláshoz a táblázat szerkezetére a szöveg geometriájából kell következtetni. Hol végződik és kezdődik a következő cella, azt vízszintes szóközből kell kitalálni; ahol az egyik sor véget ér és a következő kezdődik, függőleges szóközből.

Ez az eszköz a PDF.js használatával elemzi a PDF-fájlt, kibontja a szövegelemeket a határolókeretekkel, és az elemeket sorokba és oszlopokba csoportosítja a pozíció alapján. Az észlelt tábla egy Excel-munkafüzetbe kerül a SheetJS xlsx könyvtár használatával. A kimenet egy szabványos .xlsx fájl, amely megnyílik az Excelben, a Google Táblázatokban, a Numbersben vagy bármely más táblázatkezelő alkalmazásban.

A PDF-táblázat kivonatolása valóban nehéz, és egyetlen kivonat sem hoz tökéletes eredményt minden PDF-fájlban. A következetes oszlophatárokkal, nem egyesített cellákkal és egyértelmű függőleges igazítással rendelkező táblázatok tisztán konvertálhatók. Az egyesített cellákat, többsoros bejegyzéseket, lábjegyzeteket vagy szokatlan elrendezéseket tartalmazó táblázatokat általában manuálisan kell megtisztítani a kibontás után. Tervezze meg a felülvizsgálatot.

Miért konvertálhat PDF-et Excel-be?

Az ok szinte mindig az elemzés. A PDF-ben rekedt adatok nem rendezhetők, szűrhetők, összegezhetők, diagramozhatók vagy elforgathatók. Az Excelben minden szabványos táblázatkezelési művelet elérhetővé válik – és ez megnyitja a különbséget a statikus jelentés bámulása és a benne lévő számokkal való tényleges munka között.

A tömeges adatkezelés PDF-ben lehetetlen. A negyedéves adatok több PDF-jelentésben történő összesítése, a gyártók sorainak összehasonlítása vagy meghatározott oszlopok lehívása a későbbi elemzéshez szükségessé teszi, hogy az adatokat olyan formátumba helyezze, amely támogatja ezeket a műveleteket. Az Excel és a CSV ezek a formátumok. A megtérés a híd.

Használati útmutató

Dobj el egy táblázatos adatokat tartalmazó PDF-et, szerezz be egy munkafüzetet, amelyben minden táblázat a saját lapján található.

  1. Töltse fel PDF-jét: Húzza a fájlt a feltöltési területre, vagy kattintson a böngészéshez. 50 MB-ig terjedő fájlok támogatottak. A PDF-nek tényleges szöveget kell tartalmaznia; A beolvasott PDF-eknek először OCR-re van szükségük.
  2. Várja meg az asztal észlelését: A PDF.js kivonja a szöveges elemeket és azok helyzetét. A konverter a vízszintes és függőleges igazítás elemzésével sorokba és oszlopokba csoportosítja az elemeket. Rövid dokumentumok esetén az észlelés másodpercekig tart, többoldalas táblázatok esetén pedig tovább tart.
  3. Az észlelt táblázatok áttekintése: Az észlelt táblázatok előnézete letöltés előtt megtörténik. Győződjön meg arról, hogy az oszlopok és sorok megfelelnek a vártnak; az itt található eltérések később Excel-tisztítássá válnak.
  4. Letöltés XLSX-ként: A konverter minden észlelt táblát külön lapra ír egy .xlsx munkafüzetben a SheetJS használatával. Nyissa meg az eredményt Excelben vagy Google Táblázatokban, és szüntesse meg a fennmaradó problémákat.

Gyakori használati esetek

Műszaki részletek

A PDF.js egy getTextContent API-t tesz közzé, amely a szöveges elemeket a határolókeretekkel adja vissza. Minden elemhez tartozik egy karakterlánc, egy transzformációs mátrix (a pozícióhoz és az elforgatáshoz), valamint egy szélesség/magasság. A konverter az elemeket Y-koordináta szerint rendezi a sorok azonosítása érdekében, majd az egyes sorokon belül X-koordináta szerint. A nagyon hasonló Y pozíciójú elemek egy sort alkotnak.

Az oszlopészlelés hézagelemzést használ: az egymást követő elemek közötti X-távolság jelzi, hogy ugyanahhoz a cellához vagy szomszédos cellához tartoznak-e. A küszöbértéknél nagyobb hézag (általában 1–2 karakterszélesség) oszlophatárt jelez. A küszöbhangolás kiegyenlíti a szomszédos oszlopok összevonását és az egyes oszlopok felosztását.

Az Excel-kimenet a SheetJS-t használja egy munkafüzet létrehozásához a memóriában, minden egyes észlelt táblával a saját lapján, amelyek neve Sheet1, Sheet2 stb. A munkafüzet .xlsx (Office Open XML) formátumba van sorosítva, és letölthető. Az eredmény az Excel 2007+, a Google Sheets, a LibreOffice Calc és az Apple Numbers programban nyílik meg.

Legjobb gyakorlatok

Gyakran ismételt kérdések

A PDF EXCEL formátumba konvertálása megváltoztatja a tartalmat?
A tartalom a lehető legpontosabban megőrződik. Előfordulhat azonban, hogy egyes formátum-specifikus funkciók nem rendelkeznek közvetlen megfelelőkkel, így kisebb formázási eltérések léphetnek fel.
Mire használható az EXCEL formátum?
Az XLSX-et (Microsoft Excel Spreadsheet) elsősorban képleteket, diagramokat és adatelemzést tartalmazó táblázatokhoz használják.
Vannak-e korlátozások, amelyekkel tisztában kell lenni?
A fájlok legfeljebb 50 MB-ig támogatottak. A nagyon nagy vagy összetett fájlok feldolgozása tovább tarthat. Minden átalakítás a böngészőben történik, így a feldolgozás sebessége az eszköztől függ.
Biztonságban vannak a dokumentumaim?
Igen. A dokumentumfeldolgozás teljes egészében a böngészőben fut. A fájlok és azok tartalma soha nem töltődik fel egyetlen szerverre sem. Ez biztonságossá teszi az érzékeny vagy bizalmas dokumentumok konvertálását.
Milyen kimeneti formátum készül?
.xlsx (Office Open XML), a modern Excel formátum. A fájl Excel 2007+, Google Táblázatok, LibreOffice Calc, Apple Numbers és bármely más modern táblázatban nyílik meg.
Fel van töltve a PDF-em egy szerverre?
Nem. Az elemzés és az Excel létrehozása a böngészőben történik PDF.js és SheetJS használatával.
Mi a maximális fájlméret?
50 MB. A konvertálási idő a dokumentum összetettségétől függ, nem pedig önmagában a fájlmérettől – egy 50 MB-os grafikát tartalmazó PDF kibontása hosszabb ideig tarthat, mint egy nagy szöveget tartalmazó PDF-fájl kibontása.
Miért rossz oszlopokban vannak a számaim?
Szinte mindig azért, mert a konverter oszlopészlelési küszöbértéke nem egyezik a PDF tényleges elrendezésével. Nyissa meg a forrás-PDF-et, nézze meg, hol szakadnak meg vizuálisan az oszlopok, és szükség szerint kézzel tolja el a cellákat az Excelben.