PDF to لفظ (DOCX)
PDF سے متن نکالیں اور اسے اپنے براؤزر میں مکمل طور پر قابل تدوین ورڈ فارمیٹ میں تبدیل کریں۔ تیز، محفوظ، اور نجی۔
پی ڈی ایف فائل یہاں ڈراپ کریں۔
50MB تک سپورٹ کرتا ہے۔
PDF سے متن نکالیں اور اسے اپنے براؤزر میں مکمل طور پر قابل تدوین ورڈ فارمیٹ میں تبدیل کریں۔ تیز، محفوظ، اور نجی۔
50MB تک سپورٹ کرتا ہے۔
PDF اور DOCX (Microsoft Word) بنیادی طور پر مختلف ماڈلز کا استعمال کرتے ہوئے دستاویزات کی وضاحت کرتے ہیں۔ پی ڈی ایف ایک فکسڈ لے آؤٹ فارمیٹ ہے: ہر گلیف کی ایک فکسڈ سائز پیج پر ایک واضح پوزیشن ہوتی ہے، جس سے دستاویز کو ہر جگہ یکساں نظر آتا ہے۔ DOCX ایک فلو لے آؤٹ فارمیٹ ہے: پیراگراف، ٹیبلز، اور ہیڈنگز کو لفظی طور پر بیان کیا جاتا ہے، اور رینڈرنگ انجن فیصلہ کرتا ہے کہ صفحہ کے موجودہ سائز اور فونٹ کی دستیابی کی بنیاد پر وہ صفحہ پر کہاں آتے ہیں۔ پی ڈی ایف سے ڈی او سی ایکس میں تبدیل کرنے کا مطلب ہے فکسڈ لے آؤٹ کو معکوس ساخت میں معکوس انجینئرنگ جس سے لفظ دوبارہ بہہ سکے۔
یہ تبدیلی فطری طور پر نقصان دہ ہے۔ پی ڈی ایف عام طور پر سرخی کی سطح، پیراگراف کی حدود، فہرست کی ساخت، یا جدول کے الفاظ کو محفوظ نہیں رکھتا ہے۔ کنورٹر کو فونٹ کے سائز، پوزیشنز اور بلٹ کریکٹرز سے ان کا اندازہ لگانا پڑتا ہے۔ سادہ متن پر مبنی پی ڈی ایف صاف طور پر تبدیل ہوتی ہیں۔ کثیر کالم لے آؤٹس، ایمبیڈڈ امیجز، فوٹ نوٹ، یا غیر معمولی نوع ٹائپ کے ساتھ پیچیدہ پی ڈی ایف کو عام طور پر تبدیلی کے بعد دستی صفائی کی ضرورت ہوتی ہے۔
یہ ٹول آپ کے براؤزر میں PDF.js کو پارس کرنے کے لیے اور ایک حسب ضرورت لے آؤٹ ٹو DOCX رائٹر کا استعمال کرتے ہوئے تبادلوں کو چلاتا ہے جو معیاری Office Open XML آؤٹ پٹ تیار کرتا ہے۔ نتیجہ Microsoft Word، LibreOffice Writer، Google Docs، اور کسی دوسرے DOCX کے موافق ایڈیٹر میں کھلتا ہے۔ کوئی اپ لوڈ نہیں ہوتا ہے۔ فائل آپ کے آلے پر رہتی ہے۔
تدوین پوری وجہ ہے۔ پی ڈی ایف ایڈیٹنگ کے خلاف ہے — آپ فارم کے فیلڈز کو پُر کر سکتے ہیں اور تشریح کر سکتے ہیں، لیکن آپ متن کو ری فلو نہیں کر سکتے، پیراگراف کی طرزیں تبدیل نہیں کر سکتے، یا مخصوص پی ڈی ایف ایڈیٹرز کے بغیر مواد کی تنظیم نو نہیں کر سکتے جس پر پیسہ خرچ ہوتا ہے اور متضاد نتائج برآمد ہوتے ہیں۔ DOCX ترمیم کے لیے بنایا گیا ہے۔ پی ڈی ایف کو DOCX میں تبدیل کرنا مواد کو نظر ثانی، ترجمہ، دوبارہ پیش کرنے، یا دوبارہ ڈیزائن کرنے کے قابل بناتا ہے۔
دوسری وجہ تعاون ہے۔ Word اور Google Docs دفتروں، اسکولوں اور زیادہ تر تنظیموں میں دستاویز کے تعاون کی زبان ہیں۔ تبصرہ کے دھاگوں، ٹریک تبدیلیوں، اور مشترکہ ترمیم سبھی DOCX یا اس کے کلاؤڈ کے مساوی تصور کرتے ہیں۔ جائزہ کے لیے بھیجی گئی پی ڈی ایف رکاوٹیں بن جاتی ہیں۔ DOCX معیاری تعاون کے ٹولز سے گزرتا ہے۔
پی ڈی ایف ڈراپ کریں، جنریٹ کریں، ڈاؤن لوڈ کریں۔ اس کے بعد ورڈ میں کچھ صفائی کرنے کی توقع کریں۔
PDF.js ہر پی ڈی ایف صفحہ کو متن اور گرافکس آپریشنز کے سلسلے میں پارس کرتا ہے۔ ٹیکسٹ ایکسٹریکشن API ٹیکسٹ آئٹمز کو ان کے باؤنڈنگ بکس، فونٹ کی معلومات، اور یونیکوڈ ڈی کوڈ شدہ تاروں کے ساتھ واپس کرتا ہے۔ ان آئٹمز سے کنورٹر اوپر سے نیچے اور بائیں سے دائیں ترتیب دے کر پڑھنے کی ترتیب کو دوبارہ تشکیل دیتا ہے، اسی طرح کی بنیادی لائنوں کے ساتھ آئٹمز کو لائنوں میں اور لائنوں کو پیراگراف میں گروپ کرتا ہے۔
DOCX ایک زپ آرکائیو ہے جس میں XML فائلیں (document.xml، styles.xml، علاوہ مواد کی قسم اور تعلقات ظاہر ہوتے ہیں)۔ کنورٹر پیراگراف (w:p) اور رن (w:r) عناصر کی ایک سیریز کا استعمال کرتے ہوئے document.xml مواد تیار کرتا ہے، ہیڈنگز (ہیڈنگ 1، ہیڈنگ 2) کے لیے اسٹائل ریفرینسز کا اطلاق کرتا ہے جہاں فونٹ سائز سرخی تجویز کرتا ہے، اور JSZip کا استعمال کرتے ہوئے میموری میں زپ کو جمع کرتا ہے۔
حدود: کالم لے آؤٹ ہمیشہ صحیح طریقے سے دوبارہ نہیں بنائے جاتے ہیں۔ پی ڈی ایف میں ٹیبلز کو پیراگراف کے طور پر بازیافت کیا جاتا ہے جب تک کہ لے آؤٹ ٹیبلر ڈھانچے کی سختی سے تجویز نہ کرے۔ ہیڈر، فوٹر، اور فوٹ نوٹ عام طور پر متعلقہ DOCX زونز کے بجائے باڈی میں ان لائن ہوتے ہیں۔ پی ڈی ایف میں سرایت شدہ تصاویر فی الحال DOCX آؤٹ پٹ میں محفوظ نہیں ہیں۔