ਨੂੰ PDF ਸ਼ਬਦ (DOCX)
PDF ਤੋਂ ਟੈਕਸਟ ਐਕਸਟਰੈਕਟ ਕਰੋ ਅਤੇ ਇਸਨੂੰ ਆਪਣੇ ਬ੍ਰਾਊਜ਼ਰ ਵਿੱਚ ਸੰਪਾਦਨ ਯੋਗ ਵਰਡ ਫਾਰਮੈਟ ਵਿੱਚ ਬਦਲੋ। ਤੇਜ਼, ਸੁਰੱਖਿਅਤ ਅਤੇ ਨਿੱਜੀ।
PDF ਫਾਈਲ ਇੱਥੇ ਸੁੱਟੋ
50MB ਤੱਕ ਸਪੋਰਟ ਕਰਦਾ ਹੈ
PDF ਤੋਂ ਟੈਕਸਟ ਐਕਸਟਰੈਕਟ ਕਰੋ ਅਤੇ ਇਸਨੂੰ ਆਪਣੇ ਬ੍ਰਾਊਜ਼ਰ ਵਿੱਚ ਸੰਪਾਦਨ ਯੋਗ ਵਰਡ ਫਾਰਮੈਟ ਵਿੱਚ ਬਦਲੋ। ਤੇਜ਼, ਸੁਰੱਖਿਅਤ ਅਤੇ ਨਿੱਜੀ।
50MB ਤੱਕ ਸਪੋਰਟ ਕਰਦਾ ਹੈ
PDF ਅਤੇ DOCX (Microsoft Word) ਬੁਨਿਆਦੀ ਤੌਰ 'ਤੇ ਵੱਖਰੇ ਮਾਡਲਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਦਸਤਾਵੇਜ਼ਾਂ ਦਾ ਵਰਣਨ ਕਰਦੇ ਹਨ। PDF ਇੱਕ ਨਿਸ਼ਚਿਤ-ਲੇਆਉਟ ਫਾਰਮੈਟ ਹੈ: ਹਰੇਕ ਗਲਾਈਫ ਦੀ ਇੱਕ ਨਿਸ਼ਚਤ-ਆਕਾਰ ਵਾਲੇ ਪੰਨੇ 'ਤੇ ਇੱਕ ਸਪੱਸ਼ਟ ਸਥਿਤੀ ਹੁੰਦੀ ਹੈ, ਜਿਸ ਨਾਲ ਦਸਤਾਵੇਜ਼ ਨੂੰ ਹਰ ਥਾਂ ਇੱਕ ਸਮਾਨ ਦਿਖਾਈ ਦਿੰਦਾ ਹੈ। DOCX ਇੱਕ ਪ੍ਰਵਾਹ-ਲੇਆਉਟ ਫਾਰਮੈਟ ਹੈ: ਪੈਰਾਗ੍ਰਾਫ, ਟੇਬਲ, ਅਤੇ ਸਿਰਲੇਖਾਂ ਦਾ ਅਰਥ-ਵਿਵਸਥਾ ਨਾਲ ਵਰਣਨ ਕੀਤਾ ਗਿਆ ਹੈ, ਅਤੇ ਰੈਂਡਰਿੰਗ ਇੰਜਣ ਮੌਜੂਦਾ ਪੰਨੇ ਦੇ ਆਕਾਰ ਅਤੇ ਫੌਂਟ ਦੀ ਉਪਲਬਧਤਾ ਦੇ ਆਧਾਰ 'ਤੇ ਇਹ ਫੈਸਲਾ ਕਰਦਾ ਹੈ ਕਿ ਉਹ ਪੰਨੇ 'ਤੇ ਕਿੱਥੇ ਆਉਂਦੇ ਹਨ। PDF ਤੋਂ DOCX ਵਿੱਚ ਬਦਲਣ ਦਾ ਮਤਲਬ ਹੈ ਫਿਕਸਡ ਲੇਆਉਟ ਨੂੰ ਇੱਕ ਸਿਮੈਂਟਿਕ ਢਾਂਚੇ ਵਿੱਚ ਉਲਟਾ-ਇੰਜੀਨੀਅਰ ਕਰਨਾ ਜਿਸ ਨਾਲ Word ਮੁੜ-ਪ੍ਰਵਾਹ ਹੋ ਸਕਦਾ ਹੈ।
ਇਹ ਪਰਿਵਰਤਨ ਕੁਦਰਤੀ ਤੌਰ 'ਤੇ ਨੁਕਸਾਨਦਾਇਕ ਹੈ। PDF ਆਮ ਤੌਰ 'ਤੇ ਸਿਰਲੇਖ ਦੇ ਪੱਧਰਾਂ, ਪੈਰਾਗ੍ਰਾਫ਼ ਸੀਮਾਵਾਂ, ਸੂਚੀ ਬਣਤਰ, ਜਾਂ ਸਾਰਣੀ ਦੇ ਅਰਥ ਵਿਗਿਆਨ ਨੂੰ ਸੁਰੱਖਿਅਤ ਨਹੀਂ ਰੱਖਦਾ ਹੈ; ਕਨਵਰਟਰ ਨੂੰ ਫੌਂਟ ਦੇ ਆਕਾਰ, ਸਥਿਤੀਆਂ ਅਤੇ ਬੁਲੇਟ ਅੱਖਰਾਂ ਤੋਂ ਇਹਨਾਂ ਦਾ ਅਨੁਮਾਨ ਲਗਾਉਣਾ ਪੈਂਦਾ ਹੈ। ਸਧਾਰਨ ਪਾਠ-ਅਧਾਰਿਤ PDF ਸਾਫ਼-ਸੁਥਰੇ ਰੂਪ ਵਿੱਚ ਬਦਲਦੇ ਹਨ। ਬਹੁ-ਕਾਲਮ ਲੇਆਉਟ, ਏਮਬੈਡਡ ਚਿੱਤਰਾਂ, ਫੁਟਨੋਟਸ, ਜਾਂ ਅਸਾਧਾਰਨ ਟਾਈਪੋਗ੍ਰਾਫੀ ਵਾਲੇ ਗੁੰਝਲਦਾਰ PDF ਨੂੰ ਆਮ ਤੌਰ 'ਤੇ ਰੂਪਾਂਤਰਨ ਤੋਂ ਬਾਅਦ ਹੱਥੀਂ ਸਫਾਈ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ।
ਇਹ ਟੂਲ ਪਾਰਸਿੰਗ ਲਈ PDF.js ਅਤੇ ਇੱਕ ਕਸਟਮ ਲੇਆਉਟ-ਟੂ-DOCX ਲੇਖਕ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਤੁਹਾਡੇ ਬ੍ਰਾਊਜ਼ਰ ਵਿੱਚ ਪਰਿਵਰਤਨ ਚਲਾਉਂਦਾ ਹੈ ਜੋ ਸਟੈਂਡਰਡ Office Open XML ਆਉਟਪੁੱਟ ਪੈਦਾ ਕਰਦਾ ਹੈ। ਨਤੀਜਾ ਮਾਈਕ੍ਰੋਸਾਫਟ ਵਰਡ, ਲਿਬਰੇਆਫਿਸ ਰਾਈਟਰ, ਗੂਗਲ ਡੌਕਸ, ਅਤੇ ਕਿਸੇ ਹੋਰ DOCX- ਅਨੁਕੂਲ ਸੰਪਾਦਕ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ। ਕੋਈ ਅੱਪਲੋਡ ਨਹੀਂ ਹੁੰਦਾ; ਫਾਈਲ ਤੁਹਾਡੀ ਡਿਵਾਈਸ 'ਤੇ ਰਹਿੰਦੀ ਹੈ।
ਸੰਪਾਦਨਯੋਗਤਾ ਸਾਰਾ ਕਾਰਨ ਹੈ। PDF ਸੰਪਾਦਨ ਲਈ ਵਿਰੋਧੀ ਹੈ — ਤੁਸੀਂ ਫਾਰਮ ਖੇਤਰਾਂ ਨੂੰ ਭਰ ਸਕਦੇ ਹੋ ਅਤੇ ਐਨੋਟੇਟ ਕਰ ਸਕਦੇ ਹੋ, ਪਰ ਤੁਸੀਂ ਵਿਸ਼ੇਸ਼ PDF ਸੰਪਾਦਕਾਂ ਤੋਂ ਬਿਨਾਂ ਟੈਕਸਟ ਰੀਫਲੋ ਨਹੀਂ ਕਰ ਸਕਦੇ, ਪੈਰਾਗ੍ਰਾਫ ਸ਼ੈਲੀ ਨਹੀਂ ਬਦਲ ਸਕਦੇ, ਜਾਂ ਸਮੱਗਰੀ ਦਾ ਪੁਨਰਗਠਨ ਨਹੀਂ ਕਰ ਸਕਦੇ ਜੋ ਪੈਸੇ ਖਰਚ ਕਰਦੇ ਹਨ ਅਤੇ ਅਸੰਗਤ ਨਤੀਜੇ ਪੈਦਾ ਕਰਦੇ ਹਨ। DOCX ਸੰਪਾਦਨ ਲਈ ਬਣਾਇਆ ਗਿਆ ਹੈ। ਇੱਕ PDF ਨੂੰ DOCX ਵਿੱਚ ਤਬਦੀਲ ਕਰਨ ਨਾਲ ਸਮੱਗਰੀ ਨੂੰ ਸੰਸ਼ੋਧਨ, ਅਨੁਵਾਦ, ਦੁਬਾਰਾ ਤਿਆਰ ਕਰਨ, ਜਾਂ ਮੁੜ-ਡਿਜ਼ਾਇਨ ਕਰਨ ਯੋਗ ਬਣਾਉਂਦਾ ਹੈ।
ਦੂਜਾ ਕਾਰਨ ਹੈ ਸਹਿਯੋਗ। Word ਅਤੇ Google Docs ਦਫ਼ਤਰਾਂ, ਸਕੂਲਾਂ ਅਤੇ ਜ਼ਿਆਦਾਤਰ ਸੰਸਥਾਵਾਂ ਵਿੱਚ ਦਸਤਾਵੇਜ਼ ਸਹਿਯੋਗ ਦੀ ਭਾਸ਼ਾ ਹੈ। ਟਿੱਪਣੀ ਥ੍ਰੈੱਡ, ਟ੍ਰੈਕ ਤਬਦੀਲੀਆਂ, ਅਤੇ ਸਾਂਝਾ ਸੰਪਾਦਨ ਸਾਰੇ DOCX ਜਾਂ ਇਸਦੇ ਕਲਾਉਡ ਦੇ ਬਰਾਬਰ ਮੰਨਦੇ ਹਨ। ਸਮੀਖਿਆ ਲਈ ਭੇਜੇ ਗਏ PDF ਅੜਿੱਕੇ ਬਣ ਜਾਂਦੇ ਹਨ; DOCX ਮਿਆਰੀ ਸਹਿਯੋਗ ਸਾਧਨਾਂ ਰਾਹੀਂ ਵਹਿੰਦਾ ਹੈ।
PDF ਸੁੱਟੋ, ਤਿਆਰ ਕਰੋ, ਡਾਊਨਲੋਡ ਕਰੋ। ਬਾਅਦ ਵਿੱਚ Word ਵਿੱਚ ਕੁਝ ਸਫਾਈ ਕਰਨ ਦੀ ਉਮੀਦ ਕਰੋ।
PDF.js ਹਰੇਕ PDF ਪੰਨੇ ਨੂੰ ਟੈਕਸਟ ਅਤੇ ਗ੍ਰਾਫਿਕਸ ਓਪਰੇਸ਼ਨਾਂ ਦੀ ਇੱਕ ਧਾਰਾ ਵਿੱਚ ਪਾਰਸ ਕਰਦਾ ਹੈ। ਟੈਕਸਟ-ਐਕਸਟ੍ਰਕਸ਼ਨ API ਟੈਕਸਟ ਆਈਟਮਾਂ ਨੂੰ ਉਹਨਾਂ ਦੇ ਬਾਊਂਡਿੰਗ ਬਾਕਸ, ਫੌਂਟ ਜਾਣਕਾਰੀ, ਅਤੇ ਯੂਨੀਕੋਡ-ਡੀਕੋਡਡ ਸਤਰਾਂ ਨਾਲ ਵਾਪਸ ਕਰਦਾ ਹੈ। ਇਹਨਾਂ ਆਈਟਮਾਂ ਤੋਂ ਕਨਵਰਟਰ ਉੱਪਰ-ਤੋਂ-ਹੇਠਾਂ ਅਤੇ ਖੱਬੇ-ਤੋਂ-ਸੱਜੇ ਕ੍ਰਮਬੱਧ ਕਰਕੇ, ਸਮਾਨ ਬੇਸਲਾਈਨਾਂ ਵਾਲੀਆਂ ਆਈਟਮਾਂ ਨੂੰ ਲਾਈਨਾਂ ਵਿੱਚ ਅਤੇ ਲਾਈਨਾਂ ਨੂੰ ਪੈਰਿਆਂ ਵਿੱਚ ਕ੍ਰਮਬੱਧ ਕਰਕੇ ਰੀਡਿੰਗ ਆਰਡਰ ਦਾ ਪੁਨਰਗਠਨ ਕਰਦਾ ਹੈ।
DOCX ਇੱਕ ਜ਼ਿਪ ਆਰਕਾਈਵ ਹੈ ਜਿਸ ਵਿੱਚ XML ਫਾਈਲਾਂ (document.xml, styles.xml, ਪਲੱਸ ਸਮੱਗਰੀ ਦੀ ਕਿਸਮ ਅਤੇ ਰਿਸ਼ਤੇ ਪ੍ਰਗਟ ਹੁੰਦੇ ਹਨ)। ਕਨਵਰਟਰ ਪੈਰਾਗ੍ਰਾਫ (w:p) ਅਤੇ ਰਨ (w:r) ਤੱਤਾਂ ਦੀ ਇੱਕ ਲੜੀ ਦੀ ਵਰਤੋਂ ਕਰਕੇ document.xml ਸਮੱਗਰੀ ਬਣਾਉਂਦਾ ਹੈ, ਸਿਰਲੇਖਾਂ (ਸਿਰਲੇਖ 1, ਸਿਰਲੇਖ 2) ਲਈ ਸ਼ੈਲੀ ਦੇ ਹਵਾਲੇ ਲਾਗੂ ਕਰਦਾ ਹੈ ਜਿੱਥੇ ਫੌਂਟ ਆਕਾਰ ਇੱਕ ਸਿਰਲੇਖ ਦਾ ਸੁਝਾਅ ਦਿੰਦਾ ਹੈ, ਅਤੇ JSZip ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਮੈਮੋਰੀ ਵਿੱਚ ਜ਼ਿਪ ਨੂੰ ਇਕੱਠਾ ਕਰਦਾ ਹੈ।
ਸੀਮਾਵਾਂ: ਕਾਲਮ ਲੇਆਉਟ ਹਮੇਸ਼ਾ ਸਹੀ ਢੰਗ ਨਾਲ ਪੁਨਰ-ਨਿਰਮਾਣ ਨਹੀਂ ਕੀਤੇ ਜਾਂਦੇ ਹਨ। PDF ਵਿੱਚ ਟੇਬਲਾਂ ਨੂੰ ਪੈਰਾਗ੍ਰਾਫਾਂ ਦੇ ਰੂਪ ਵਿੱਚ ਮੁੜ ਪ੍ਰਾਪਤ ਕੀਤਾ ਜਾਂਦਾ ਹੈ ਜਦੋਂ ਤੱਕ ਕਿ ਖਾਕਾ ਸਾਰਣੀ ਬਣਤਰ ਦਾ ਜ਼ੋਰਦਾਰ ਸੁਝਾਅ ਨਹੀਂ ਦਿੰਦਾ। ਸਿਰਲੇਖ, ਫੁੱਟਰ, ਅਤੇ ਫੁਟਨੋਟ ਆਮ ਤੌਰ 'ਤੇ ਸੰਬੰਧਿਤ DOCX ਜ਼ੋਨਾਂ ਦੀ ਬਜਾਏ ਸਰੀਰ ਵਿੱਚ ਇਨਲਾਈਨ ਹੁੰਦੇ ਹਨ। PDF ਵਿੱਚ ਏਮਬੇਡ ਕੀਤੀਆਂ ਤਸਵੀਰਾਂ ਵਰਤਮਾਨ ਵਿੱਚ DOCX ਆਉਟਪੁੱਟ ਵਿੱਚ ਸੁਰੱਖਿਅਤ ਨਹੀਂ ਹਨ।