PDF kwa Kigeuzi cha Excel (XLSX).
Chambua majedwali na maandishi kutoka kwa PDF na ubadilishe hadi lahajedwali za Excel XLSX kwa usalama katika kivinjari chako.
Dondosha faili ya PDF hapa
au bofya ili kuchagua faili
Chambua majedwali na maandishi kutoka kwa PDF na ubadilishe hadi lahajedwali za Excel XLSX kwa usalama katika kivinjari chako.
au bofya ili kuchagua faili
Kuchota data ya jedwali kutoka kwa PDF na hadi kwenye lahajedwali ni mojawapo ya utiririshaji wa kazi wa hati katika ofisi zinazoshughulikia ankara, ripoti za fedha, karatasi za kisayansi na data ya serikali. Umbizo la PDF halielewi jedwali asili - linaelezea tu nafasi za glyph kwenye ukurasa - kwa hivyo kugeuza hadi Excel kunahitaji muundo wa jedwali kutoka kwa jiometri ya maandishi. Ambapo seli moja inaisha na inayofuata kuanza lazima ikisiwe kutoka kwa nafasi nyeupe ya mlalo; ambapo safu mlalo moja inaisha na inayofuata huanza, kutoka nafasi nyeupe wima.
Zana hii huchanganua PDF kwa kutumia PDF.js, huchota vipengee vya maandishi na visanduku vyake vya kufunga, na kuvikusanya vipengee katika safu mlalo na safu wima kulingana na mahali. Jedwali lililotambuliwa limeandikwa kwa kitabu cha kazi cha Excel kwa kutumia maktaba ya SheetJS xlsx. Matokeo ni faili ya kawaida ya .xlsx ambayo hufunguliwa katika Excel, Majedwali ya Google, Hesabu, au programu nyingine yoyote ya lahajedwali.
Uchimbaji wa jedwali la PDF ni mgumu sana, na hakuna kichuna kinachotoa matokeo bora kwenye kila PDF. Majedwali yaliyo na mipaka ya safu wima thabiti, hakuna seli zilizounganishwa, na upangaji wazi wa wima hubadilika kwa usafi. Majedwali yaliyo na visanduku vilivyounganishwa, maingizo ya mistari mingi, maelezo ya chini, au miundo isiyo ya kawaida kwa kawaida huhitaji kusafishwa mwenyewe baada ya kutoa. Panga kwa ukaguzi.
Sababu ni karibu kila wakati uchambuzi. Data iliyonaswa katika PDF haiwezi kupangwa, kuchujwa, kufupishwa, kuorodheshwa, au kupitiwa. Inapokuwa katika Excel, kila utendakazi wa kawaida wa lahajedwali unapatikana - na hiyo inafungua tofauti kati ya kutazama ripoti tuli na kufanya kazi na nambari ndani yake.
Data ya wingi haiwezekani katika PDF. Kujumlisha takwimu za kila robo mwaka kwenye ripoti nyingi za PDF, kulinganisha bidhaa za laini kwenye wachuuzi, au kuvuta safu wima mahususi kwa uchanganuzi wa mkondo, yote hayo yanahitaji kupata data katika umbizo linaloauni shughuli hizo. Excel na CSV ndizo fomati hizo. Uongofu ni daraja.
Dondosha PDF iliyo na data ya jedwali, pata kitabu cha kazi na kila jedwali kwenye laha yake.
PDF.js hufichua API ya getTextContent ambayo hurejesha maandishi na visanduku vyake vya kufunga. Kila kitu kina kamba, matrix ya kubadilisha (kwa nafasi na mzunguko), na upana / urefu. Kigeuzi hupanga vitu kwa kuratibu Y ili kutambua mistari, kisha ndani ya kila mstari kwa X-coordinate. Vipengee vilivyo katika nafasi za Y zinazofanana huunda safu.
Ugunduzi wa safu wima hutumia uchanganuzi wa pengo: Umbali wa X kati ya vipengee vinavyofuatana katika safu mlalo unaonyesha kama ni vya seli moja au visanduku vilivyo karibu. Pengo kubwa kuliko kizingiti (kwa kawaida upana wa herufi 1-2) huashiria mpaka wa safu wima. Urekebishaji wa kiwango cha juu hubadilika kati ya kuunganisha safu wima zilizo karibu na kugawanya safu wima moja.
Excel output hutumia SheetJS kuunda kitabu cha kumbukumbu, huku kila jedwali kwenye laha yake likiitwa Sheet1, Sheet2, n.k. Kitabu cha kazi kinasasishwa hadi umbizo la .xlsx (Office Open XML) na kutolewa kama kipakuliwa. Matokeo hufunguliwa katika Excel 2007+, Majedwali ya Google, LibreOffice Calc, na Nambari za Apple.