Gratis converter

PDF naar Excel (XLSX)-converter

Extraheer tabellen en tekst uit PDF en converteer ze veilig naar Excel XLSX-spreadsheets in uw browser.

Zet het PDF-bestand hier neer

of klik om het bestand te selecteren

Of

Over deze tool

Tabelgegevens uit een PDF halen en in een spreadsheet plaatsen is een van de meest voorkomende documentworkflows in kantoren waar facturen, financiële rapporten, wetenschappelijke artikelen en overheidsgegevens worden verwerkt. Het PDF-formaat begrijpt tabellen niet van nature – het beschrijft alleen glyph-posities op een pagina – dus voor het converteren naar Excel moet de tabelstructuur worden afgeleid uit de geometrie van de tekst. Waar de ene cel eindigt en de volgende begint, moet worden geraden vanuit horizontale witruimte; waar de ene rij eindigt en de volgende begint, vanuit verticale witruimte.

Deze tool ontleedt de PDF met behulp van PDF.js, extraheert tekstitems met hun selectiekaders en clustert de items in rijen en kolommen op basis van hun positie. De gedetecteerde tabel wordt naar een Excel-werkmap geschreven met behulp van de SheetJS xlsx-bibliotheek. De uitvoer is een standaard .xlsx-bestand dat wordt geopend in Excel, Google Spreadsheets, Numbers of een andere spreadsheettoepassing.

Het extraheren van PDF-tabellen is echt moeilijk en geen enkele extractor levert perfecte resultaten op voor elke PDF. Tabellen met consistente kolomgrenzen, geen samengevoegde cellen en een duidelijke verticale uitlijning worden netjes geconverteerd. Tabellen met samengevoegde cellen, vermeldingen met meerdere regels, voetnoten of ongebruikelijke lay-outs moeten na extractie doorgaans handmatig worden opgeschoond. Plan voor beoordeling.

Waarom PDF naar Excel converteren

De reden is bijna altijd analyse. Gegevens die in een PDF zijn vastgelegd, kunnen niet worden gesorteerd, gefilterd, opgeteld, in kaart gebracht of gedraaid. Als het eenmaal in Excel staat, wordt elke standaard spreadsheetbewerking beschikbaar – en dat maakt het verschil zichtbaar tussen het staren naar een statisch rapport en het daadwerkelijk werken met de cijfers erin.

Bulkgegevenswerk is onmogelijk in PDF. Het aggregeren van kwartaalcijfers over meerdere PDF-rapporten, het vergelijken van regelitems van leveranciers of het ophalen van specifieke kolommen voor downstream-analyse vereisen allemaal dat de gegevens in een formaat worden gebracht dat deze bewerkingen ondersteunt. Excel en CSV zijn die formaten. Conversie is de brug.

Hoe te gebruiken

Plaats een PDF met tabelgegevens en ontvang een werkmap met elke tabel op een eigen blad.

  1. Upload uw PDF: Sleep het bestand naar het uploadgebied of klik om te bladeren. Bestanden tot 50 MB worden ondersteund. De PDF moet daadwerkelijke tekst bevatten; gescande PDF's hebben eerst OCR nodig.
  2. Wacht op tafeldetectie: PDF.js extraheert tekstitems en hun posities. De converter clustert items in rijen en kolommen door de horizontale en verticale uitlijning te analyseren. Detectie duurt seconden voor korte documenten en langer voor tabellen met meerdere pagina's.
  3. Controleer gedetecteerde tabellen: Gedetecteerde tabellen worden vooraf bekeken voordat ze worden gedownload. Bevestig dat de kolommen en rijen overeenkomen met wat u verwacht; Verkeerde uitlijningen hier worden later Excel-opschoning.
  4. Downloaden als XLSX: De converter schrijft elke gedetecteerde tabel naar een afzonderlijk blad in een .xlsx-werkmap met behulp van SheetJS. Open het resultaat in Excel of Google Spreadsheets en ruim eventuele resterende problemen op.

Veelvoorkomende gebruiksscenario's

Technische details

PDF.js stelt een getTextContent-API beschikbaar die tekstitems retourneert met hun selectiekaders. Elk item heeft een string, een transformatiematrix (voor positie en rotatie) en breedte/hoogte. De converter sorteert items op Y-coördinaat om lijnen te identificeren, en vervolgens binnen elke lijn op X-coördinaat. Items op zeer vergelijkbare Y-posities vormen een rij.

Kolomdetectie maakt gebruik van gap-analyse: de X-afstand tussen opeenvolgende items in een rij geeft aan of ze tot dezelfde cel of aangrenzende cellen behoren. Een opening groter dan een drempel (doorgaans 1 à 2 tekenbreedten) duidt op een kolomgrens. Bij het afstemmen van de drempelwaarde wordt een afweging gemaakt tussen het samenvoegen van aangrenzende kolommen en het splitsen van afzonderlijke kolommen.

Excel-uitvoer gebruikt SheetJS om een werkmap in het geheugen samen te stellen, waarbij elke gedetecteerde tabel op een eigen blad staat met de namen Sheet1, Sheet2, etc. De werkmap is geserialiseerd naar .xlsx (Office Open XML)-indeling en wordt aangeboden als download. Het resultaat wordt geopend in Excel 2007+, Google Spreadsheets, LibreOffice Calc en Apple Numbers.

Beste praktijken

Veelgestelde vragen

Verandert het converteren van PDF naar EXCEL de inhoud?
De inhoud wordt zo nauwkeurig mogelijk bewaard. Sommige formaatspecifieke functies hebben echter mogelijk geen directe equivalenten, waardoor er kleine opmaakverschillen kunnen optreden.
Waar wordt het EXCEL-formaat voor gebruikt?
XLSX (Microsoft Excel Spreadsheet) wordt voornamelijk gebruikt voor spreadsheets met formules, grafieken en gegevensanalyse.
Zijn er beperkingen waar u rekening mee moet houden?
Bestanden tot 50 MB worden ondersteund. Het verwerken van zeer grote of complexe bestanden kan langer duren. Alle conversies vinden plaats in uw browser, dus de verwerkingssnelheid is afhankelijk van uw apparaat.
Zijn mijn documentgegevens veilig?
Ja. De documentverwerking verloopt volledig in uw browser. Uw bestanden en hun inhoud worden nooit naar een server geüpload. Dit maakt het veilig om gevoelige of vertrouwelijke documenten te converteren.
Welk uitvoerformaat wordt geproduceerd?
.xlsx (Office Open XML), het moderne Excel-formaat. Het bestand wordt geopend in Excel 2007+, Google Spreadsheets, LibreOffice Calc, Apple Numbers en elke andere moderne spreadsheet.
Wordt mijn PDF naar een server geüpload?
Nee. Het parseren en genereren van Excel gebeurt in uw browser met behulp van PDF.js en SheetJS.
Wat is de maximale bestandsgrootte?
50MB. De conversietijd is afhankelijk van de complexiteit van het document en niet alleen van de bestandsgrootte. Het uitpakken van een PDF met veel afbeeldingen van 50 MB kan meer tijd in beslag nemen dan een PDF met veel tekst.
Waarom staan mijn cijfers in de verkeerde kolommen?
Bijna altijd omdat de kolomdetectiedrempel van de converter niet overeenkwam met de werkelijke lay-out van de PDF. Open de bron-PDF, kijk waar de kolommen visueel worden afgebroken en verplaats de cellen indien nodig handmatig in Excel.