PDF üçün Excel (XLSX) çeviricisi
Cədvəlləri və mətni PDF-dən çıxarın və brauzerinizdə təhlükəsiz şəkildə Excel XLSX cədvəllərinə çevirin.
PDF faylını bura buraxın
və ya faylı seçmək üçün klikləyin
Cədvəlləri və mətni PDF-dən çıxarın və brauzerinizdə təhlükəsiz şəkildə Excel XLSX cədvəllərinə çevirin.
və ya faylı seçmək üçün klikləyin
Cədvəl məlumatlarını PDF-dən və elektron cədvələ çıxarmaq, hesab-fakturaları, maliyyə hesabatlarını, elmi sənədləri və hökumət məlumatlarını idarə edən ofislərdə ən çox yayılmış sənəd iş axınlarından biridir. PDF formatı cədvəlləri təbii olaraq başa düşmür - o, sadəcə səhifədəki qlif mövqelərini təsvir edir - buna görə də Excel-ə çevirmək mətnin həndəsəsindən cədvəl strukturunu çıxarmağı tələb edir. Bir hüceyrənin bitdiyi və digərinin başladığı üfüqi boşluqdan təxmin edilməlidir; bir cərgənin bitdiyi və digərinin başladığı yerdə, şaquli boşluqdan.
Bu alət PDF.js-dən istifadə edərək PDF-i təhlil edir, mətn elementlərini məhdudlaşdırıcı qutuları ilə çıxarır və elementləri mövqeyə əsasən sətirlərə və sütunlara qruplaşdırır. Aşkar edilmiş cədvəl SheetJS xlsx kitabxanasından istifadə edərək Excel iş kitabına yazılır. Çıxış Excel, Google Sheets, Numbers və ya hər hansı digər cədvəl proqramında açılan standart .xlsx faylıdır.
PDF cədvəlinin çıxarılması həqiqətən çətindir və heç bir çıxarıcı hər PDF-də mükəmməl nəticələr vermir. Ardıcıl sütun sərhədləri, birləşdirilmiş xanalar və aydın şaquli düzülüşü olan cədvəllər təmiz şəkildə çevrilir. Birləşdirilmiş xanalar, çox sətirli qeydlər, alt qeydlər və ya qeyri-adi tərtibatları olan cədvəllər adətən çıxarıldıqdan sonra əl ilə təmizlənməlidir. Baxış üçün plan.
Səbəb demək olar ki, həmişə təhlildir. PDF-də saxlanılan məlumatları çeşidləmək, süzgəcdən keçirmək, yekunlaşdırmaq, qrafiki yaratmaq və ya döndərmək mümkün deyil. Excel-də olduqdan sonra hər bir standart cədvəl əməliyyatı əlçatan olur və bu, statik hesabata baxmaqla oradakı rəqəmlərlə işləmək arasında fərqi açır.
PDF-də toplu məlumatlarla işləmək mümkün deyil. Çoxsaylı PDF hesabatlarında rüblük rəqəmlərin cəmlənməsi, satıcılar arasında sətir elementlərinin müqayisəsi və ya aşağı axın təhlili üçün xüsusi sütunların çəkilməsi məlumatların həmin əməliyyatları dəstəkləyən formata daxil edilməsini tələb edir. Excel və CSV bu formatlardır. Dönüşüm körpüdür.
Cədvəl məlumatları olan PDF-i buraxın, hər bir cədvəlin öz vərəqində olan iş dəftərini əldə edin.
PDF.js mətn elementlərini məhdudlaşdıran qutuları ilə qaytaran getTextContent API-ni ifşa edir. Hər bir elementin sətri, çevrilmə matrisi (mövqe və fırlanma üçün) və eni/hündürlüyü var. Dönüştürücü xətləri müəyyən etmək üçün elementləri Y-koordinatına, sonra hər bir sətir daxilində X-koordinatına görə çeşidləyir. Çox oxşar Y mövqelərində olan elementlər sıra təşkil edir.
Sütun aşkarlanması boşluq təhlilindən istifadə edir: cərgədəki ardıcıl elementlər arasındakı X-məsafə onların eyni xanaya və ya qonşu xanalara aid olub-olmadığını göstərir. Həddən böyük boşluq (adətən 1-2 simvol genişliyi) sütunun sərhəddini bildirir. Eşik tənzimləməsi bitişik sütunları birləşdirmək və tək sütunları bölmək arasında dəyişir.
Excel çıxışı yaddaşda iş dəftəri yaratmaq üçün SheetJS-dən istifadə edir, hər bir aşkar edilmiş cədvəl Sheet1, Sheet2 və s. adlı öz vərəqindədir. İş kitabı .xlsx (Office Open XML) formatında seriallaşdırılır və yükləmə kimi təklif olunur. Nəticə Excel 2007+, Google Sheets, LibreOffice Calc və Apple Numbers proqramlarında açılır.