PDF થી શબ્દ (DOCX)
PDF માંથી ટેક્સ્ટ કાઢો અને તેને તમારા બ્રાઉઝરમાં સંપાદનયોગ્ય વર્ડ ફોર્મેટમાં કન્વર્ટ કરો. ઝડપી, સુરક્ષિત અને ખાનગી.
પીડીએફ ફાઈલ અહીં મૂકો
50MB સુધી સપોર્ટ કરે છે
PDF માંથી ટેક્સ્ટ કાઢો અને તેને તમારા બ્રાઉઝરમાં સંપાદનયોગ્ય વર્ડ ફોર્મેટમાં કન્વર્ટ કરો. ઝડપી, સુરક્ષિત અને ખાનગી.
50MB સુધી સપોર્ટ કરે છે
પીડીએફ અને ડીઓસીએક્સ (માઈક્રોસોફ્ટ વર્ડ) મૂળભૂત રીતે અલગ મોડલનો ઉપયોગ કરીને દસ્તાવેજોનું વર્ણન કરે છે. PDF એ ફિક્સ્ડ-લેઆઉટ ફોર્મેટ છે: દરેક ગ્લિફ નિશ્ચિત-કદના પૃષ્ઠ પર સ્પષ્ટ સ્થાન ધરાવે છે, જે દસ્તાવેજને જ્યાં પણ પ્રસ્તુત કરવામાં આવે છે ત્યાં સમાન દેખાય છે. DOCX એ ફ્લો-લેઆઉટ ફોર્મેટ છે: ફકરા, કોષ્ટકો અને મથાળાઓ અર્થપૂર્ણ રીતે વર્ણવવામાં આવે છે, અને રેન્ડરિંગ એન્જિન વર્તમાન પૃષ્ઠ કદ અને ફોન્ટ ઉપલબ્ધતાના આધારે પૃષ્ઠ પર ક્યાં આવે છે તે નક્કી કરે છે. પીડીએફમાંથી ડીઓસીએક્સમાં રૂપાંતરિત કરવાનો અર્થ એ છે કે નિશ્ચિત લેઆઉટને સિમેન્ટીક સ્ટ્રક્ચરમાં રિવર્સ-એન્જિનિયરિંગ કરવું કે જે વર્ડ ફરીથી પ્રવાહ કરી શકે.
આ રૂપાંતર સ્વાભાવિક રીતે નુકસાનકારક છે. પીડીએફ સામાન્ય રીતે મથાળાના સ્તરો, ફકરાની સીમાઓ, સૂચિ માળખું, અથવા ટેબલ સિમેન્ટિક્સ સાચવતું નથી; કન્વર્ટરને ફોન્ટના કદ, સ્થાનો અને બુલેટ અક્ષરો પરથી આનું અનુમાન લગાવવું પડશે. સરળ ટેક્સ્ટ-આધારિત પીડીએફ સ્વચ્છ રીતે કન્વર્ટ કરે છે. મલ્ટી-કૉલમ લેઆઉટ, એમ્બેડ કરેલી છબીઓ, ફૂટનોટ્સ અથવા અસામાન્ય ટાઇપોગ્રાફી સાથેના જટિલ PDF ને સામાન્ય રીતે રૂપાંતર પછી મેન્યુઅલ ક્લિનઅપની જરૂર પડે છે.
આ સાધન તમારા બ્રાઉઝરમાં પદચ્છેદન માટે PDF.js અને કસ્ટમ લેઆઉટ-ટુ-DOCX લેખકનો ઉપયોગ કરીને રૂપાંતરણ ચલાવે છે જે પ્રમાણભૂત Office Open XML આઉટપુટ ઉત્પન્ન કરે છે. પરિણામ Microsoft Word, LibreOffice Writer, Google Docs અને અન્ય કોઈપણ DOCX- સુસંગત સંપાદકમાં ખુલે છે. કોઈ અપલોડ થતું નથી; ફાઇલ તમારા ઉપકરણ પર રહે છે.
સંપાદનક્ષમતા એ સમગ્ર કારણ છે. PDF એ સંપાદન માટે પ્રતિકૂળ છે — તમે ફોર્મ ફીલ્ડ્સ ભરી શકો છો અને ટીકા કરી શકો છો, પરંતુ તમે વિશિષ્ટ PDF સંપાદકો વિના ટેક્સ્ટને રિફ્લો કરી શકતા નથી, ફકરાની શૈલી બદલી શકતા નથી અથવા સામગ્રીનું પુનર્ગઠન કરી શકતા નથી કે જેના માટે પૈસા ખર્ચ થાય છે અને અસંગત પરિણામો ઉત્પન્ન કરે છે. DOCX સંપાદન માટે બનાવવામાં આવ્યું છે. પીડીએફને ડીઓસીએક્સમાં રૂપાંતરિત કરવાથી સામગ્રીને પુનરાવર્તન, અનુવાદ, પુનઃઉપયોગ અથવા પુનઃડિઝાઈન કરવા યોગ્ય બનાવે છે.
બીજું કારણ સહયોગ છે. વર્ડ અને ગૂગલ ડોક્સ એ ઓફિસો, શાળાઓ અને મોટાભાગની સંસ્થાઓમાં દસ્તાવેજ સહયોગની ભાષા છે. ટિપ્પણી થ્રેડો, ટ્રૅક ફેરફારો અને વહેંચાયેલ સંપાદન બધા DOCX અથવા તેના ક્લાઉડ સમકક્ષ ધારે છે. સમીક્ષા માટે મોકલેલ પીડીએફ અડચણો બની જાય છે; DOCX પ્રમાણભૂત સહયોગ સાધનો દ્વારા વહે છે.
પીડીએફ છોડો, જનરેટ કરો, ડાઉનલોડ કરો. પછીથી વર્ડમાં થોડી સફાઈ કરવાની અપેક્ષા રાખો.
PDF.js દરેક PDF પૃષ્ઠને ટેક્સ્ટ અને ગ્રાફિક્સ ઑપરેશનના પ્રવાહમાં પાર્સ કરે છે. ટેક્સ્ટ-નિષ્કર્ષણ API તેમના બાઉન્ડિંગ બોક્સ, ફોન્ટ માહિતી અને યુનિકોડ-ડીકોડેડ સ્ટ્રિંગ્સ સાથે ટેક્સ્ટ આઇટમ્સ પરત કરે છે. આ વસ્તુઓમાંથી કન્વર્ટર ઉપર-થી-નીચે અને ડાબે-થી-જમણે સૉર્ટ કરીને વાંચન ક્રમનું પુનઃનિર્માણ કરે છે, સમાન આધારરેખા સાથેની વસ્તુઓને રેખાઓમાં અને રેખાઓને ફકરાઓમાં જૂથબદ્ધ કરે છે.
DOCX એ XML ફાઇલો ધરાવતું ઝિપ આર્કાઇવ છે (document.xml, styles.xml, વત્તા સામગ્રી પ્રકાર અને સંબંધો મેનિફેસ્ટ). કન્વર્ટર ફકરા (w:p) અને રન (w:r) તત્વોની શ્રેણીનો ઉપયોગ કરીને document.xml સામગ્રી બનાવે છે, મથાળાઓ માટે શૈલી સંદર્ભો લાગુ કરે છે (મથાળું 1, મથાળું 2) જ્યાં ફોન્ટનું કદ મથાળું સૂચવે છે, અને JSZip નો ઉપયોગ કરીને મેમરીમાં ઝિપને એસેમ્બલ કરે છે.
મર્યાદાઓ: કૉલમ લેઆઉટ હંમેશા યોગ્ય રીતે પુનઃનિર્માણ કરવામાં આવતું નથી. PDF માં કોષ્ટકોને ફકરા તરીકે પુનઃપ્રાપ્ત કરવામાં આવે છે સિવાય કે લેઆઉટ ટેબ્યુલર માળખું મજબૂત રીતે સૂચવે છે. હેડર, ફૂટર અને ફૂટનોટ્સ સામાન્ય રીતે સંબંધિત DOCX ઝોનને બદલે બોડીમાં ઇનલાઇન થાય છે. PDF માં એમ્બેડ કરેલી છબીઓ હાલમાં DOCX આઉટપુટમાં સચવાયેલી નથી.