Gratis omvandlare

PDF till Excel (XLSX) konverterare

Extrahera tabeller och text från PDF och konvertera dem till Excel XLSX-kalkylblad säkert i din webbläsare.

Släpp PDF-filen här

eller klicka för att välja fil

Eller

Om detta verktyg

Att dra tabelldata från en PDF och till ett kalkylblad är ett av de vanligaste dokumentarbetsflödena på kontor som hanterar fakturor, finansiella rapporter, vetenskapliga artiklar och statliga data. PDF-formatet förstår inte tabeller – det beskriver bara glyfpositioner på en sida – så att konvertera till Excel kräver att man härleder tabellstrukturen från textens geometri. Var en cell slutar och nästa börjar måste gissas från horisontellt blanksteg; där en rad slutar och nästa börjar, från vertikala blanksteg.

Det här verktyget analyserar PDF-filen med PDF.js, extraherar textobjekt med sina begränsningsrutor och grupperar objekten i rader och kolumner baserat på position. Den upptäckta tabellen skrivs till en Excel-arbetsbok med SheetJS xlsx-biblioteket. Utdata är en standard .xlsx-fil som öppnas i Excel, Google Sheets, Numbers eller något annat kalkylarksprogram.

PDF-tabellextraktion är verkligen svårt, och ingen extraherare ger perfekta resultat på varje PDF. Tabeller med konsekventa kolumngränser, inga sammanslagna celler och tydlig vertikal justering konverterar rent. Tabeller med sammanslagna celler, poster med flera rader, fotnoter eller ovanliga layouter behöver vanligtvis rengöras manuellt efter extraktion. Planera för granskning.

Varför konvertera PDF till Excel

Anledningen är nästan alltid analys. Data som fångas i en PDF kan inte sorteras, filtreras, summeras, kartläggas eller pivoteras. När den väl är i Excel blir alla vanliga kalkylbladsoperationer tillgänglig - och det öppnar upp för skillnaden mellan att stirra på en statisk rapport och att faktiskt arbeta med siffrorna i den.

Massdataarbete är omöjligt i PDF. Att samla kvartalssiffror över flera PDF-rapporter, jämföra rader mellan leverantörer eller dra specifika kolumner för nedströmsanalys kräver allt att få data till ett format som stöder dessa operationer. Excel och CSV är dessa format. Omvandlingen är bron.

Så här använder du det

Släpp en PDF som innehåller tabelldata, få en arbetsbok med varje tabell på sitt eget ark.

  1. Ladda upp din PDF: Dra filen till uppladdningsområdet eller klicka för att bläddra. Filer upp till 50 MB stöds. PDF-filen måste innehålla verklig text; skannade PDF-filer behöver OCR först.
  2. Vänta på bordsdetektering: PDF.js extraherar textobjekt och deras positioner. Omvandlaren grupperar objekt i rader och kolumner genom att analysera horisontell och vertikal justering. Detektering tar några sekunder för korta dokument och längre för flersidiga tabeller.
  3. Granska upptäckta tabeller: Upptäckta tabeller förhandsgranskas före nedladdning. Bekräfta att kolumnerna och raderna matchar vad du förväntar dig; feljusteringar här blir Excel-rensning senare.
  4. Ladda ner som XLSX: Omvandlaren skriver varje upptäckt tabell till ett separat ark i en .xlsx-arbetsbok med SheetJS. Öppna resultatet i Excel eller Google Sheets och rensa upp eventuella återstående problem.

Vanliga användningsfall

Tekniska detaljer

PDF.js exponerar ett getTextContent API som returnerar textobjekt med sina begränsningsrutor. Varje objekt har en sträng, en transformationsmatris (för position och rotation) och bredd/höjd. Omvandlaren sorterar objekt efter Y-koordinat för att identifiera linjer, sedan inom varje rad efter X-koordinat. Objekt på mycket liknande Y-positioner bildar en rad.

Kolumndetektering använder gapanalys: X-avståndet mellan på varandra följande objekt i en rad indikerar om de tillhör samma cell eller intilliggande celler. Ett gap som är större än ett tröskelvärde (vanligtvis 1–2 teckenbredder) signalerar en kolumngräns. Tröskeljustering avviker mellan att slå samman angränsande kolumner och dela enstaka kolumner.

Excel-utdata använder SheetJS för att konstruera en arbetsbok i minnet, med varje upptäckt tabell på sitt eget ark som heter Sheet1, Sheet2, etc. Arbetsboken är serialiserad till .xlsx-format (Office Open XML) och erbjuds som en nedladdning. Resultatet öppnas i Excel 2007+, Google Sheets, LibreOffice Calc och Apple Numbers.

Bästa metoder

Vanliga frågor

Ändrar konvertering av PDF till EXCEL innehållet?
Innehållet bevaras så exakt som möjligt. Vissa formatspecifika funktioner kanske inte har direkta motsvarigheter, så mindre formateringsskillnader kan förekomma.
Vad används EXCEL-formatet till?
XLSX (Microsoft Excel Spreadsheet) används främst för kalkylblad med formler, diagram och dataanalys.
Finns det några begränsningar att vara medveten om?
Filer upp till 50 MB stöds. Mycket stora eller komplexa filer kan ta längre tid att bearbeta. All konvertering sker i din webbläsare, så bearbetningshastigheten beror på din enhet.
Är mina dokumentdata säkra?
Ja. Dokumentbehandling körs helt i din webbläsare. Dina filer och deras innehåll laddas aldrig upp till någon server. Detta gör det säkert att konvertera känsliga eller konfidentiella dokument.
Vilket utdataformat produceras?
.xlsx (Office Open XML), det moderna Excel-formatet. Filen öppnas i Excel 2007+, Google Sheets, LibreOffice Calc, Apple Numbers och alla andra moderna kalkylblad.
Är min PDF uppladdad till en server?
Nej. Parsning och Excel-generering sker i din webbläsare med PDF.js och SheetJS.
Vad är den maximala filstorleken?
50 MB. Konverteringstiden beror på dokumentets komplexitet snarare än bara filstorleken – en grafiktung PDF på 50 MB kan ta längre tid att extrahera än en texttung.
Varför är mina siffror i fel kolumner?
Nästan alltid för att omvandlarens kolumndetekteringströskel inte matchade PDF:ens faktiska layout. Öppna käll-PDF-filen, titta på var kolumner visuellt bryts och flytta celler manuellt i Excel efter behov.