Gratis omformer

PDF til Excel (XLSX) Converter

Trekk ut tabeller og tekst fra PDF og konverter dem til Excel XLSX-regneark sikkert i nettleseren din.

Slipp PDF-filen her

eller klikk for å velge fil

Eller

Om dette verktøyet

Å trekke tabelldata ut av en PDF og inn i et regneark er en av de vanligste dokumentarbeidsflytene på kontorer som håndterer fakturaer, økonomiske rapporter, vitenskapelige artikler og offentlige data. PDF-formatet forstår ikke tabeller – det beskriver bare tegnposisjoner på en side – så konvertering til Excel krever å utlede tabellstruktur fra tekstens geometri. Hvor en celle slutter og den neste begynner må gjettes fra horisontalt mellomrom; der en rad slutter og den neste begynner, fra vertikale mellomrom.

Dette verktøyet analyserer PDF-en ved hjelp av PDF.js, trekker ut tekstelementer med deres avgrensningsbokser, og grupperer elementene i rader og kolonner basert på posisjon. Den oppdagede tabellen skrives til en Excel-arbeidsbok ved hjelp av SheetJS xlsx-biblioteket. Utdataene er en standard .xlsx-fil som åpnes i Excel, Google Sheets, Numbers eller et annet regnearkprogram.

PDF-tabellutvinning er virkelig vanskelig, og ingen uttrekker gir perfekte resultater på hver PDF. Tabeller med konsekvente kolonnegrenser, ingen sammenslåtte celler og tydelig vertikal justering konverterer rent. Tabeller med sammenslåtte celler, oppføringer med flere linjer, fotnoter eller uvanlige oppsett trenger vanligvis manuell opprydding etter ekstraksjon. Plan for gjennomgang.

Hvorfor konvertere PDF til Excel

Årsaken er nesten alltid analyse. Data som er fanget i en PDF kan ikke sorteres, filtreres, summeres, kartlegges eller pivoteres. Når den først er i Excel, blir hver standard regnearkoperasjon tilgjengelig – og det åpner for forskjellen mellom å se på en statisk rapport og faktisk jobbe med tallene i den.

Massedataarbeid er umulig i PDF. Å samle kvartalstall på tvers av flere PDF-rapporter, sammenligne linjeelementer på tvers av leverandører eller trekke spesifikke kolonner for nedstrømsanalyse krever alt å få dataene til et format som støtter disse operasjonene. Excel og CSV er disse formatene. Konvertering er broen.

Slik bruker du det

Slipp en PDF som inneholder tabelldata, få en arbeidsbok med hver tabell på sitt eget ark.

  1. Last opp PDF-en din: Dra filen til opplastingsområdet eller klikk for å bla. Filer på opptil 50 MB støttes. PDF-en må inneholde faktisk tekst; skannede PDF-filer trenger OCR først.
  2. Vent på borddeteksjon: PDF.js trekker ut tekstelementer og deres posisjoner. Konverteren grupperer elementer i rader og kolonner ved å analysere horisontal og vertikal justering. Deteksjon tar sekunder for korte dokumenter og lengre tid for flersides tabeller.
  3. Gjennomgå oppdagede tabeller: Oppdagede tabeller forhåndsvises før nedlasting. Bekreft at kolonnene og radene samsvarer med det du forventer; feiljusteringer her blir Excel-opprydding senere.
  4. Last ned som XLSX: Konverteren skriver hver oppdaget tabell til et separat ark i en .xlsx-arbeidsbok ved hjelp av SheetJS. Åpne resultatet i Excel eller Google Sheets og ryd opp i eventuelle gjenværende problemer.

Vanlige brukstilfeller

Tekniske detaljer

PDF.js avslører et getTextContent API som returnerer tekstelementer med deres avgrensningsbokser. Hvert element har en streng, en transformasjonsmatrise (for posisjon og rotasjon) og bredde/høyde. Konverteren sorterer elementer etter Y-koordinat for å identifisere linjer, deretter innenfor hver linje etter X-koordinat. Elementer i svært like Y-posisjoner danner en rad.

Kolonnedeteksjon bruker gapanalyse: X-avstanden mellom påfølgende elementer i en rad indikerer om de tilhører samme celle eller tilstøtende celler. Et gap større enn en terskel (vanligvis 1–2 tegnbredder) signaliserer en kolonnegrense. Terskeljustering avveier mellom å slå sammen tilstøtende kolonner og splitte enkeltkolonner.

Excel-utdata bruker SheetJS til å konstruere en arbeidsbok i minnet, med hver oppdaget tabell på sitt eget ark kalt Sheet1, Sheet2, etc. Arbeidsboken er serialisert til .xlsx-format (Office Open XML) og tilbys som en nedlasting. Resultatet åpnes i Excel 2007+, Google Sheets, LibreOffice Calc og Apple Numbers.

Beste praksis

Ofte stilte spørsmål

Endrer konvertering av PDF til EXCEL innholdet?
Innholdet bevares så nøyaktig som mulig. Imidlertid kan det hende at enkelte formatspesifikke funksjoner ikke har direkte ekvivalenter, så det kan oppstå mindre formateringsforskjeller.
Hva brukes EXCEL-formatet til?
XLSX (Microsoft Excel Spreadsheet) brukes først og fremst til regneark med formler, diagrammer og dataanalyse.
Er det noen begrensninger å være klar over?
Filer på opptil 50 MB støttes. Svært store eller komplekse filer kan ta lengre tid å behandle. All konvertering skjer i nettleseren din, så behandlingshastigheten avhenger av enheten din.
Er dokumentdataene mine sikre?
Ja. Dokumentbehandling kjører helt i nettleseren din. Dine filer og deres innhold blir aldri lastet opp til noen server. Dette gjør det trygt å konvertere sensitive eller konfidensielle dokumenter.
Hvilket utdataformat produseres?
.xlsx (Office Open XML), det moderne Excel-formatet. Filen åpnes i Excel 2007+, Google Sheets, LibreOffice Calc, Apple Numbers og alle andre moderne regneark.
Er PDF-en min lastet opp til en server?
Nei. Parsing og Excel-generering skjer i nettleseren din ved å bruke PDF.js og SheetJS.
Hva er maksimal filstørrelse?
50 MB. Konverteringstiden avhenger av dokumentets kompleksitet snarere enn filstørrelsen alene – en grafikk-tung PDF på 50 MB kan ta lengre tid å pakke ut enn en teksttung.
Hvorfor er tallene mine i feil kolonner?
Nesten alltid fordi konverterens kolonnedeteksjonsterskel ikke samsvarte med PDF-ens faktiske layout. Åpne kilde-PDF-en, se på hvor kolonner visuelt brytes, og skift celler manuelt i Excel etter behov.