Conversor Gratuito

PDF para Excel (XLSX)

Extraia tabelas e textos do PDF e converta-os em planilhas Excel XLSX com segurança no seu navegador grátis.

Solte o arquivo PDF aqui

ou clique para selecionar o arquivo

Ou

Sobre esta ferramenta

Extrair dados tabulares de um PDF para uma planilha é um dos fluxos de trabalho de documentos mais comuns em escritórios que lidam com faturas, relatórios financeiros, artigos científicos e dados governamentais. O formato PDF não entende tabelas nativamente – ele apenas descreve as posições dos glifos em uma página – portanto, a conversão para Excel requer inferir a estrutura da tabela a partir da geometria do texto. Onde uma célula termina e a próxima começa deve ser adivinhada a partir do espaço em branco horizontal; onde uma linha termina e a próxima começa, a partir do espaço em branco vertical.

Esta ferramenta analisa o PDF usando PDF.js, extrai itens de texto com suas caixas delimitadoras e agrupa os itens em linhas e colunas com base na posição. A tabela detectada é gravada em uma pasta de trabalho do Excel usando a biblioteca SheetJS xlsx. A saída é um arquivo .xlsx padrão que abre no Excel, no Planilhas Google, no Numbers ou em qualquer outro aplicativo de planilha.

A extração de tabelas PDF é realmente difícil e nenhum extrator produz resultados perfeitos em todos os PDFs. Tabelas com limites de coluna consistentes, sem células mescladas e alinhamento vertical claro são convertidas de forma limpa. Tabelas com células mescladas, entradas multilinhas, notas de rodapé ou layouts incomuns geralmente precisam de limpeza manual após a extração. Planeje a revisão.

Por que converter PDF para Excel

O motivo quase sempre é a análise. Os dados presos em um PDF não podem ser classificados, filtrados, somados, gráficos ou dinamizados. Uma vez no Excel, todas as operações de planilha padrão ficam disponíveis – e isso abre a diferença entre olhar para um relatório estático e realmente trabalhar com os números nele contidos.

O trabalho com dados em massa é impossível em PDF. Agregar números trimestrais em vários relatórios PDF, comparar itens de linha entre fornecedores ou extrair colunas específicas para análise posterior exige a colocação dos dados em um formato que suporte essas operações. Excel e CSV são esses formatos. A conversão é a ponte.

Como usar

Solte um PDF contendo dados tabulares e obtenha uma pasta de trabalho com cada tabela em sua própria planilha.

  1. Carregue seu PDF: Arraste o arquivo para a área de upload ou clique para navegar. Arquivos de até 50 MB são suportados. O PDF deve conter texto real; PDFs digitalizados precisam primeiro de OCR.
  2. Aguarde a detecção da tabela: PDF.js extrai itens de texto e suas posições. O conversor agrupa itens em linhas e colunas analisando o alinhamento horizontal e vertical. A detecção leva segundos para documentos curtos e mais tempo para tabelas com várias páginas.
  3. Revise as tabelas detectadas: As tabelas detectadas são visualizadas antes do download. Confirme se as colunas e linhas correspondem ao que você espera; desalinhamentos aqui se tornam limpeza do Excel posteriormente.
  4. Baixe como XLSX: O conversor grava cada tabela detectada em uma planilha separada em uma pasta de trabalho .xlsx usando SheetJS. Abra o resultado no Excel ou no Planilhas Google e elimine quaisquer problemas residuais.

Casos de uso comuns

Detalhes técnicos

PDF.js expõe uma API getTextContent que retorna itens de texto com suas caixas delimitadoras. Cada item possui uma string, uma matriz de transformação (para posição e rotação) e largura/altura. O conversor classifica os itens pela coordenada Y para identificar as linhas e, em seguida, dentro de cada linha pela coordenada X. Itens em posições Y muito semelhantes formam uma linha.

A detecção de colunas usa análise de lacunas: a distância X entre itens consecutivos em uma linha indica se eles pertencem à mesma célula ou a células adjacentes. Uma lacuna maior que um limite (normalmente de 1 a 2 caracteres de largura) sinaliza um limite de coluna. O ajuste de limite alterna entre mesclar colunas adjacentes e dividir colunas únicas.

A saída do Excel usa SheetJS para construir uma pasta de trabalho na memória, com cada tabela detectada em sua própria planilha chamada Sheet1, Sheet2, etc. A pasta de trabalho é serializada no formato .xlsx (Office Open XML) e oferecida para download. O resultado abre no Excel 2007+, Planilhas Google, LibreOffice Calc e Apple Numbers.

Melhores Práticas

Perguntas frequentes

A conversão de PDF para EXCEL altera o conteúdo?
O conteúdo é preservado com a maior precisão possível. No entanto, alguns recursos específicos de formato podem não ter equivalentes diretos, portanto, podem ocorrer pequenas diferenças de formatação.
Para que é usado o formato EXCEL?
XLSX (planilha do Microsoft Excel) é usado principalmente para planilhas com fórmulas, gráficos e análise de dados.
Há alguma limitação a ser observada?
Arquivos de até 50 MB são suportados. Arquivos muito grandes ou complexos podem demorar mais para serem processados. Todas as conversões acontecem no seu navegador, portanto a velocidade de processamento depende do seu dispositivo.
Os dados dos meus documentos estão seguros?
Sim. O processamento de documentos é executado inteiramente no seu navegador. Seus arquivos e seus conteúdos nunca são enviados para nenhum servidor. Isso torna seguro converter documentos sensíveis ou confidenciais.
Qual formato de saída é produzido?
.xlsx (Office Open XML), o formato Excel moderno. O arquivo abre no Excel 2007+, Planilhas Google, LibreOffice Calc, Apple Numbers e qualquer outra planilha moderna.
Meu PDF foi carregado em um servidor?
A análise e a geração do Excel acontecem no seu navegador usando PDF.js e SheetJS.
Qual é o tamanho máximo do arquivo?
50 MB. O tempo de conversão depende da complexidade do documento e não apenas do tamanho do arquivo – um PDF de 50 MB com muitos gráficos pode levar mais tempo para ser extraído do que um PDF com muito texto.
Por que meus números estão nas colunas erradas?
Quase sempre porque o limite de detecção de colunas do conversor não correspondia ao layout real do PDF. Abra o PDF de origem, observe onde as colunas se quebram visualmente e mude manualmente as células no Excel conforme necessário.