PDF க்கு வார்த்தை (DOCX)
PDF இலிருந்து உரையை பிரித்தெடுத்து, அதை உங்கள் உலாவியில் முழுமையாக திருத்தக்கூடிய வேர்ட் வடிவத்திற்கு மாற்றவும். வேகமான, பாதுகாப்பான மற்றும் தனிப்பட்ட.
PDF கோப்பை இங்கே விடுங்கள்
50MB வரை ஆதரிக்கிறது
PDF இலிருந்து உரையை பிரித்தெடுத்து, அதை உங்கள் உலாவியில் முழுமையாக திருத்தக்கூடிய வேர்ட் வடிவத்திற்கு மாற்றவும். வேகமான, பாதுகாப்பான மற்றும் தனிப்பட்ட.
50MB வரை ஆதரிக்கிறது
PDF மற்றும் DOCX (Microsoft Word) அடிப்படையில் வேறுபட்ட மாதிரிகளைப் பயன்படுத்தி ஆவணங்களை விவரிக்கிறது. PDF என்பது ஒரு நிலையான-தளவமைப்பு வடிவம்: ஒவ்வொரு கிளிஃப் ஒரு நிலையான அளவிலான பக்கத்தில் ஒரு வெளிப்படையான நிலைப்பாட்டைக் கொண்டுள்ளது, இது ஆவணம் ரெண்டர் செய்யப்படும் எல்லா இடங்களிலும் ஒரே மாதிரியாக இருக்கும். DOCX என்பது ஒரு ஓட்ட-தளவமைப்பு வடிவமாகும்: பத்திகள், அட்டவணைகள் மற்றும் தலைப்புகள் சொற்பொருளில் விவரிக்கப்பட்டுள்ளன, மேலும் அவை தற்போதைய பக்க அளவு மற்றும் எழுத்துரு கிடைக்கும் தன்மையின் அடிப்படையில் பக்கத்தில் எங்கு விழும் என்பதை ரெண்டரிங் இயந்திரம் தீர்மானிக்கிறது. PDF இலிருந்து DOCX க்கு மாற்றுவது என்பது, நிலையான தளவமைப்பை ஒரு சொற்பொருள் அமைப்பாக மாற்றுவது என்பது வார்த்தையின் மறு-பாய்ச்சலைக் குறிக்கிறது.
இந்த மாற்றம் இயல்பாகவே இழப்பு. PDF பொதுவாக தலைப்பு நிலைகள், பத்தி எல்லைகள், பட்டியல் அமைப்பு அல்லது அட்டவணை சொற்பொருள்களைப் பாதுகாப்பதில்லை; எழுத்துரு அளவுகள், நிலைகள் மற்றும் புல்லட் எழுத்துக்களில் இருந்து மாற்றி இவற்றை ஊகிக்க வேண்டும். எளிய உரை அடிப்படையிலான PDFகள் சுத்தமாக மாற்றப்படுகின்றன. பல நெடுவரிசை தளவமைப்புகள், உட்பொதிக்கப்பட்ட படங்கள், அடிக்குறிப்புகள் அல்லது வழக்கத்திற்கு மாறான அச்சுக்கலை கொண்ட சிக்கலான PDFகள் பொதுவாக மாற்றத்திற்குப் பிறகு கைமுறையாக சுத்தம் செய்ய வேண்டும்.
இந்தக் கருவி உங்கள் உலாவியில் PDF.js ஐப் பாகுபடுத்துவதற்கும், நிலையான Office Open XML வெளியீட்டை உருவாக்கும் தனிப்பயன் தளவமைப்பு-க்கு-DOCX ரைட்டரைப் பயன்படுத்தியும் மாற்றுகிறது. முடிவுகள் Microsoft Word, LibreOffice Writer, Google Docs மற்றும் பிற DOCX-இணக்கமான எடிட்டரில் திறக்கப்படும். பதிவேற்றம் நடக்காது; கோப்பு உங்கள் சாதனத்தில் இருக்கும்.
திருத்தும் தன்மையே முழுக் காரணம். PDF திருத்துவதற்கு விரோதமானது - நீங்கள் படிவப் புலங்களை நிரப்பலாம் மற்றும் சிறுகுறிப்பு செய்யலாம், ஆனால் நீங்கள் உரையை மறுபரிசீலனை செய்யவோ, பத்தி பாணிகளை மாற்றவோ அல்லது உள்ளடக்கத்தை மறுகட்டமைக்கவோ முடியாது, இது சிறப்பு PDF எடிட்டர்கள் இல்லாமல் பணம் செலவழித்து சீரற்ற முடிவுகளை உருவாக்குகிறது. DOCX எடிட்டிங் செய்ய கட்டப்பட்டது. ஒரு PDF ஐ DOCX ஆக மாற்றுவது, உள்ளடக்கத்தை திருத்தம், மொழிபெயர்ப்பு, மறுபயன்பாடு அல்லது மறுவடிவமைப்பு செய்யக்கூடியதாக மாற்றுகிறது.
மற்றொரு காரணம் ஒத்துழைப்பு. Word மற்றும் Google Docs ஆகியவை அலுவலகங்கள், பள்ளிகள் மற்றும் பெரும்பாலான நிறுவனங்களில் ஆவண ஒத்துழைப்பின் மொழியாகும். கருத்துத் தொடரிழைகள், டிராக் மாற்றங்கள் மற்றும் பகிரப்பட்ட எடிட்டிங் அனைத்தும் DOCX அல்லது அதன் மேகக்கணிச் சமமானவற்றைக் கருதுகின்றன. மதிப்பாய்வுக்காக அனுப்பப்பட்ட PDFகள் தடையாகின்றன; DOCX நிலையான ஒத்துழைப்பு கருவிகள் மூலம் பாய்கிறது.
PDF ஐ கைவிடவும், உருவாக்கவும், பதிவிறக்கவும். வேர்டில் சிறிது சுத்தம் செய்ய எதிர்பார்க்கலாம்.
PDF.js ஒவ்வொரு PDF பக்கத்தையும் உரை மற்றும் கிராபிக்ஸ் செயல்பாடுகளின் ஸ்ட்ரீமாக அலசுகிறது. டெக்ஸ்ட் பிரித்தெடுத்தல் API ஆனது உரை உருப்படிகளை அவற்றின் எல்லைப் பெட்டிகள், எழுத்துருத் தகவல் மற்றும் யூனிகோட்-டிகோட் செய்யப்பட்ட சரங்களுடன் வழங்குகிறது. இந்த உருப்படிகளிலிருந்து மாற்றியானது மேலிருந்து கீழாக மற்றும் இடமிருந்து வலமாக வரிசைப்படுத்துவதன் மூலம் வாசிப்பு வரிசையை மறுகட்டமைக்கிறது, ஒரே மாதிரியான அடிப்படைகளைக் கொண்ட உருப்படிகளை வரிகளாகவும் வரிகளை பத்திகளாகவும் தொகுக்கிறது.
DOCX என்பது XML கோப்புகளைக் கொண்ட ஜிப் காப்பகமாகும் (document.xml, styles.xml, மேலும் உள்ளடக்க வகை மற்றும் உறவுகள் வெளிப்படும்). கன்வெர்ட்டர் ஒரு தொடர் பத்தி (w:p) மற்றும் ரன் (w:r) உறுப்புகளைப் பயன்படுத்தி document.xml உள்ளடக்கத்தை உருவாக்குகிறது, எழுத்துரு அளவு தலைப்பைப் பரிந்துரைக்கும் தலைப்புகளுக்கு (தலைப்பு 1, தலைப்பு 2) நடை குறிப்புகளைப் பயன்படுத்துகிறது மற்றும் JSZip ஐப் பயன்படுத்தி நினைவகத்தில் ஜிப்பைச் சேகரிக்கிறது.
வரம்புகள்: நெடுவரிசை தளவமைப்புகள் எப்போதும் சரியாக மறுகட்டமைக்கப்படுவதில்லை. PDF இல் உள்ள அட்டவணைகள் பத்திகளாக மீட்டெடுக்கப்படும், தளவமைப்பு அட்டவணை அமைப்பை வலுவாக பரிந்துரைக்கும் வரை. தலைப்புகள், அடிக்குறிப்புகள் மற்றும் அடிக்குறிப்புகள் பொதுவாக தொடர்புடைய DOCX மண்டலங்களில் இல்லாமல் உடலில் இன்லைனில் முடிவடையும். PDF இல் உட்பொதிக்கப்பட்ட படங்கள் தற்போது DOCX வெளியீட்டில் பாதுகாக்கப்படவில்லை.