ПДФ то Екцел (КСЛСКС) конвертер
Извуците табеле и текст из ПДФ-а и конвертујте их у Екцел КСЛСКС табеле безбедно у свом претраживачу.
Испустите ПДФ датотеку овде
или кликните да бисте изабрали датотеку
Извуците табеле и текст из ПДФ-а и конвертујте их у Екцел КСЛСКС табеле безбедно у свом претраживачу.
или кликните да бисте изабрали датотеку
Извлачење табеларних података из ПДФ-а у табелу је један од најчешћих токова рада докумената у канцеларијама које рукују фактурама, финансијским извештајима, научним радовима и државним подацима. ПДФ формат изворно не разуме табеле – он само описује позиције глифова на страници – тако да претварање у Екцел захтева закључивање структуре табеле из геометрије текста. Где се завршава једна ћелија, а почиње следећа мора се погодити из хоризонталног размака; где се завршава један ред и почиње следећи, од вертикалног размака.
Овај алат анализира ПДФ користећи ПДФ.јс, издваја текстуалне ставке са њиховим граничним оквирима и групише ставке у редове и колоне на основу положаја. Откривена табела се уписује у Екцел радну свеску користећи СхеетЈС клск библиотеку. Резултат је стандардна .клск датотека која се отвара у Екцел-у, Гоогле табелама, бројевима или било којој другој апликацији за табеларне прорачуне.
Екстракција ПДФ табеле је заиста тешка и ниједан екстрактор не даје савршене резултате на сваком ПДФ-у. Табеле са доследним границама колона, без спојених ћелија и јасним вертикалним поравнањем се чисте претварају. Табеле са спојеним ћелијама, уносима у више редова, фуснотама или необичним изгледима обично захтевају ручно чишћење након екстракције. План за преглед.
Разлог је скоро увек анализа. Подаци заробљени у ПДФ-у не могу се сортирати, филтрирати, сумирати, уцртати у графикон или заокренути. Једном када је у Екцел-у, свака стандардна радња у табели постаје доступна — и то отвара разлику између буљења у статички извештај и стварног рада са бројевима у њему.
Масовни рад са подацима је немогућ у ПДФ-у. Обједињавање тромесечних цифара у више ПДФ извештаја, поређење ставки поруџбина међу добављачима или повлачење одређених колона за низводну анализу захтевају довођење података у формат који подржава те операције. Екцел и ЦСВ су ти формати. Конверзија је мост.
Испустите ПДФ који садржи табеларне податке, набавите радну свеску са сваком табелом на свом листу.
ПДФ.јс излаже гетТектЦонтент АПИ који враћа текстуалне ставке са њиховим граничним оквирима. Свака ставка има стринг, матрицу трансформације (за позицију и ротацију) и ширину/висину. Конвертор сортира ставке по И-координати да би идентификовао линије, а затим унутар сваке линије по Кс-координати. Ставке на веома сличним И позицијама формирају ред.
Детекција колона користи анализу празнина: Кс-раздаљина између узастопних ставки у реду показује да ли припадају истој ћелији или суседним ћелијама. Размак већи од прага (обично 1–2 ширине карактера) сигнализира границу колоне. Подешавање прага се мења између спајања суседних колона и раздвајања појединачних колона.
Екцел излаз користи СхеетЈС за конструисање радне свеске у меморији, са сваком откривеном табелом на сопственом листу под називом Схеет1, Схеет2, итд. Радна свеска је серијализована у .клск (Оффице Опен КСМЛ) формат и нуди се за преузимање. Резултат се отвара у Екцел 2007+, Гоогле табеле, ЛибреОффице Цалц и Аппле Нумберс.