Ücretsiz Dönüştürücü

PDF'ye Excel (XLSX) Dönüştürücü

PDF'den tabloları ve metinleri çıkarın ve bunları tarayıcınızda güvenli bir şekilde Excel XLSX elektronik tablolarına dönüştürün.

PDF dosyasını buraya bırakın

veya dosyayı seçmek için tıklayın

Veya

Bu araç hakkında

Tablosal verileri PDF'den elektronik tabloya çekmek, faturaların, mali raporların, bilimsel makalelerin ve hükümet verilerinin işlendiği ofislerdeki en yaygın belge iş akışlarından biridir. PDF formatı tabloları doğal olarak anlamaz; yalnızca bir sayfadaki glif konumlarını tanımlar; bu nedenle Excel'e dönüştürmek, tablo yapısının metnin geometrisinden çıkarılmasını gerektirir. Bir hücrenin nerede bitip bir sonrakinin nerede başladığı yatay boşluktan tahmin edilmelidir; dikey boşluktan bir satırın bittiği ve sonrakinin başladığı yer.

Bu araç, PDF.js'yi kullanarak PDF'yi ayrıştırır, metin öğelerini sınırlayıcı kutularıyla birlikte çıkarır ve öğeleri konuma göre satırlar ve sütunlar halinde kümeler. Algılanan tablo, SheetJS xlsx kitaplığı kullanılarak bir Excel çalışma kitabına yazılır. Çıktı, Excel, Google E-Tablolar, Numbers veya başka herhangi bir e-tablo uygulamasında açılan standart bir .xlsx dosyasıdır.

PDF tablosunu çıkarmak gerçekten zordur ve hiçbir çıkarıcı her PDF'de mükemmel sonuçlar vermez. Tutarlı sütun sınırlarına sahip, birleştirilmiş hücre içermeyen ve net dikey hizalamaya sahip tablolar temiz bir şekilde dönüştürülür. Birleştirilmiş hücrelere, çok satırlı girişlere, dipnotlara veya olağandışı düzenlere sahip tabloların genellikle çıkarma sonrasında manuel olarak temizlenmesi gerekir. İncelemeyi planlayın.

PDF'yi Neden Excel'e Dönüştürün?

Bunun nedeni neredeyse her zaman analizdir. PDF'ye sıkıştırılan veriler sıralanamaz, filtrelenemez, özetlenemez, grafik haline getirilemez veya özetlenemez. Excel'e girdikten sonra her standart elektronik tablo işlemi kullanılabilir hale gelir ve bu, statik bir rapora bakmak ile içindeki sayılarla gerçekten çalışmak arasındaki farkı ortaya çıkarır.

PDF'de toplu veri çalışması mümkün değildir. Üç aylık rakamların birden fazla PDF raporunda toplanması, satıcılar arasında satır öğelerinin karşılaştırılması veya aşağı yönlü analiz için belirli sütunların alınması, verilerin bu işlemleri destekleyen bir formata dönüştürülmesini gerektirir. Excel ve CSV bu formatlardır. Dönüşüm köprüdür.

Nasıl kullanılır

Tablo verileri içeren bir PDF bırakın, her tablonun kendi sayfasında olduğu bir çalışma kitabı alın.

  1. PDF'nizi yükleyin: Dosyayı yükleme alanına sürükleyin veya göz atmak için tıklayın. 50 MB'a kadar dosyalar desteklenir. PDF gerçek metni içermelidir; taranan PDF'lerin öncelikle OCR'ye ihtiyacı vardır.
  2. Tablo algılamayı bekleyin: PDF.js, metin öğelerini ve konumlarını çıkarır. Dönüştürücü, yatay ve dikey hizalamayı analiz ederek öğeleri satırlar ve sütunlar halinde kümeler. Algılama, kısa belgeler için saniyeler sürerken, çok sayfalı tablolar için daha uzun sürer.
  3. Algılanan tabloları inceleyin: Algılanan tablolar indirmeden önce önizlenir. Sütunların ve satırların beklediğinizle eşleştiğini doğrulayın; Buradaki yanlış hizalamalar daha sonra Excel temizliği haline gelir.
  4. XLSX olarak indir: Dönüştürücü, algılanan her tabloyu SheetJS kullanarak .xlsx çalışma kitabındaki ayrı bir sayfaya yazar. Sonucu Excel'de veya Google E-Tablolar'da açın ve kalan sorunları temizleyin.

Yaygın Kullanım Durumları

Teknik Detaylar

PDF.js, metin öğelerini sınırlayıcı kutularıyla birlikte döndüren bir getTextContent API'sini kullanıma sunar. Her öğenin bir dizesi, bir dönüşüm matrisi (konum ve döndürme için) ve genişliği/yüksekliği vardır. Dönüştürücü, satırları tanımlamak için öğeleri Y koordinatına göre, ardından her satırda X koordinatına göre sıralar. Çok benzer Y konumlarındaki öğeler bir sıra oluşturur.

Sütun tespiti boşluk analizini kullanır: bir satırdaki ardışık öğeler arasındaki X mesafesi, bunların aynı hücreye mi yoksa bitişik hücrelere mi ait olduğunu gösterir. Bir eşikten daha büyük bir boşluk (genellikle 1-2 karakter genişliğinde), bir sütun sınırını işaret eder. Eşik ayarı, bitişik sütunların birleştirilmesi ve tek sütunların bölünmesi arasında geçiş yapar.

Excel çıktısı, algılanan her tablonun Sayfa1, Sayfa2 vb. adlı kendi sayfasında yer aldığı, bellekte bir çalışma kitabı oluşturmak için SheetJS'yi kullanır. Çalışma kitabı .xlsx (Office Açık XML) biçiminde serileştirilir ve indirme olarak sunulur. Sonuç Excel 2007+, Google E-Tablolar, LibreOffice Calc ve Apple Numbers'da açılır.

En İyi Uygulamalar

Sık sorulan sorular

PDF'yi EXCEL'e dönüştürmek içeriği değiştirir mi?
İçerik mümkün olduğunca doğru bir şekilde korunur. Ancak formata özgü bazı özelliklerin doğrudan eşdeğerleri olmayabilir, bu nedenle küçük formatlama farklılıkları oluşabilir.
EXCEL formatı ne için kullanılır?
XLSX (Microsoft Excel Elektronik Tablosu) öncelikle formüller, grafikler ve veri analizi içeren elektronik tablolar için kullanılır.
Dikkat edilmesi gereken herhangi bir sınırlama var mı?
50 MB'a kadar dosyalar desteklenir. Çok büyük veya karmaşık dosyaların işlenmesi daha uzun sürebilir. Tüm dönüşümler tarayıcınızda gerçekleşir, dolayısıyla işlem hızı cihazınıza bağlıdır.
Belge verilerim güvende mi?
Evet. Belge işleme tamamen tarayıcınızda çalışır. Dosyalarınız ve içerikleri hiçbir zaman hiçbir sunucuya yüklenmez. Bu, hassas veya gizli belgelerin dönüştürülmesini güvenli hale getirir.
Hangi çıktı formatı üretilir?
.xlsx (Office Açık XML), modern Excel biçimi. Dosya Excel 2007+, Google E-Tablolar, LibreOffice Calc, Apple Numbers ve diğer herhangi bir modern e-tabloda açılır.
PDF'im bir sunucuya yüklendi mi?
Hayır. Ayrıştırma ve Excel oluşturma, tarayıcınızda PDF.js ve SheetJS kullanılarak gerçekleşir.
Maksimum dosya boyutu nedir?
50 MB. Dönüştürme süresi, yalnızca dosya boyutundan ziyade belgenin karmaşıklığına bağlıdır; grafik ağırlıklı 50 MB PDF'nin çıkarılması, metin ağırlıklı PDF'den daha uzun sürebilir.
Numaralarım neden yanlış sütunlarda?
Neredeyse her zaman bunun nedeni dönüştürücünün sütun algılama eşiğinin PDF'nin gerçek düzeniyle eşleşmemesidir. Kaynak PDF'yi açın, sütunların görsel olarak nerede kesildiğine bakın ve Excel'deki hücreleri gerektiği gibi manuel olarak kaydırın.