Фрее Цонвертер

ПДФ то Екцел (КСЛСКС) конвертер

Извуците табеле и текст из ПДФ-а и конвертујте их у Екцел КСЛСКС табеле безбедно у свом претраживачу.

Испустите ПДФ датотеку овде

или кликните да бисте изабрали датотеку

Ор

О овом алату

Извлачење табеларних података из ПДФ-а у табелу је један од најчешћих токова рада докумената у канцеларијама које рукују фактурама, финансијским извештајима, научним радовима и државним подацима. ПДФ формат изворно не разуме табеле – он само описује позиције глифова на страници – тако да претварање у Екцел захтева закључивање структуре табеле из геометрије текста. Где се завршава једна ћелија, а почиње следећа мора се погодити из хоризонталног размака; где се завршава један ред и почиње следећи, од вертикалног размака.

Овај алат анализира ПДФ користећи ПДФ.јс, издваја текстуалне ставке са њиховим граничним оквирима и групише ставке у редове и колоне на основу положаја. Откривена табела се уписује у Екцел радну свеску користећи СхеетЈС клск библиотеку. Резултат је стандардна .клск датотека која се отвара у Екцел-у, Гоогле табелама, бројевима или било којој другој апликацији за табеларне прорачуне.

Екстракција ПДФ табеле је заиста тешка и ниједан екстрактор не даје савршене резултате на сваком ПДФ-у. Табеле са доследним границама колона, без спојених ћелија и јасним вертикалним поравнањем се чисте претварају. Табеле са спојеним ћелијама, уносима у више редова, фуснотама или необичним изгледима обично захтевају ручно чишћење након екстракције. План за преглед.

Зашто претворити ПДФ у Екцел

Разлог је скоро увек анализа. Подаци заробљени у ПДФ-у не могу се сортирати, филтрирати, сумирати, уцртати у графикон или заокренути. Једном када је у Екцел-у, свака стандардна радња у табели постаје доступна — и то отвара разлику између буљења у статички извештај и стварног рада са бројевима у њему.

Масовни рад са подацима је немогућ у ПДФ-у. Обједињавање тромесечних цифара у више ПДФ извештаја, поређење ставки поруџбина међу добављачима или повлачење одређених колона за низводну анализу захтевају довођење података у формат који подржава те операције. Екцел и ЦСВ су ти формати. Конверзија је мост.

Како користити

Испустите ПДФ који садржи табеларне податке, набавите радну свеску са сваком табелом на свом листу.

  1. Отпремите свој ПДФ: Превуците датотеку у област за отпремање или кликните да бисте је прегледали. Подржане су датотеке до 50 МБ. ПДФ мора да садржи стварни текст; скенираним ПДФ-овима је прво потребан ОЦР.
  2. Сачекајте детекцију табеле: ПДФ.јс издваја текстуалне ставке и њихове позиције. Конвертор групише ставке у редове и колоне анализирајући хоризонтално и вертикално поравнање. Откривање траје неколико секунди за кратке документе и дуже за табеле са више страница.
  3. Прегледајте откривене табеле: Откривене табеле се прегледају пре преузимања. Потврдите да се колоне и редови подударају са оним што очекујете; неусклађености овде касније постају чишћење Екцел-а.
  4. Преузмите као КСЛСКС: Конвертор уписује сваку откривену табелу на посебан лист у .клск радној свесци користећи СхеетЈС. Отворите резултат у Екцел-у или Гоогле табелама и очистите све преостале проблеме.

Уобичајени случајеви употребе

Тецхницал Детаилс

ПДФ.јс излаже гетТектЦонтент АПИ који враћа текстуалне ставке са њиховим граничним оквирима. Свака ставка има стринг, матрицу трансформације (за позицију и ротацију) и ширину/висину. Конвертор сортира ставке по И-координати да би идентификовао линије, а затим унутар сваке линије по Кс-координати. Ставке на веома сличним И позицијама формирају ред.

Детекција колона користи анализу празнина: Кс-раздаљина између узастопних ставки у реду показује да ли припадају истој ћелији или суседним ћелијама. Размак већи од прага (обично 1–2 ширине карактера) сигнализира границу колоне. Подешавање прага се мења између спајања суседних колона и раздвајања појединачних колона.

Екцел излаз користи СхеетЈС за конструисање радне свеске у меморији, са сваком откривеном табелом на сопственом листу под називом Схеет1, Схеет2, итд. Радна свеска је серијализована у .клск (Оффице Опен КСМЛ) формат и нуди се за преузимање. Резултат се отвара у Екцел 2007+, Гоогле табеле, ЛибреОффице Цалц и Аппле Нумберс.

Најбоље праксе

Често постављана питања

Да ли претварање ПДФ-а у ЕКСЦЕЛ мења садржај?
Садржај је сачуван што је могуће прецизније. Међутим, неке функције специфичне за формат можда немају директне еквиваленте, тако да може доћи до мањих разлика у форматирању.
За шта се користи ЕКСЦЕЛ формат?
КСЛСКС (Мицрософт Екцел Спреадсхеет) се првенствено користи за табеле са формулама, графиконима и анализом података.
Да ли постоје нека ограничења којих треба бити свестан?
Подржане су датотеке до 50МБ. Обрада веома великих или сложених датотека може потрајати дуже. Све конверзије се дешавају у вашем претраживачу, тако да брзина обраде зависи од вашег уређаја.
Да ли су моји подаци о документу безбедни?
Да. Обрада докумената се у потпуности одвија у вашем претраживачу. Ваше датотеке и њихов садржај се никада не отпремају ни на један сервер. Ово чини безбедним претварање осетљивих или поверљивих докумената.
Који излазни формат се производи?
.клск (Оффице Опен КСМЛ), модерни Екцел формат. Датотека се отвара у Екцел 2007+, Гоогле табеле, ЛибреОффице Цалц, Аппле Нумберс и било којој другој модерној табели.
Да ли је мој ПДФ учитан на сервер?
Не. Парсинг и Екцел генерисање се дешавају у вашем претраживачу помоћу ПДФ.јс и СхеетЈС.
Која је максимална величина датотеке?
50 МБ. Време конверзије зависи од сложености документа, а не само од величине датотеке — графиком тешком ПДФ-у од 50 МБ може бити потребно више времена да се екстрахује од оног који је тежак за текст.
Зашто су моји бројеви у погрешним колонама?
Скоро увек зато што се праг детекције колоне претварача не поклапа са стварним изгледом ПДФ-а. Отворите изворни ПДФ, погледајте где се колоне визуелно прекидају и ручно померајте ћелије у Екцел-у по потреби.