مفت کنورٹر

PDF to ایکسل (XLSX) کنورٹر

پی ڈی ایف سے ٹیبلز اور ٹیکسٹ نکالیں اور انہیں اپنے براؤزر میں محفوظ طریقے سے Excel XLSX سپریڈ شیٹس میں تبدیل کریں۔

پی ڈی ایف فائل یہاں ڈراپ کریں۔

یا فائل کو منتخب کرنے کے لیے کلک کریں۔

یا

اس ٹول کے بارے میں

ٹیبلولر ڈیٹا کو پی ڈی ایف سے نکال کر اسپریڈشیٹ میں ڈالنا دفتروں میں سب سے عام دستاویز کے ورک فلو میں سے ایک ہے جو انوائسز، مالیاتی رپورٹس، سائنسی کاغذات اور سرکاری ڈیٹا کو ہینڈل کرتے ہیں۔ پی ڈی ایف فارمیٹ مقامی طور پر جدولوں کو نہیں سمجھتا ہے - یہ صرف ایک صفحہ پر گلیف پوزیشنز کو بیان کرتا ہے - لہذا ایکسل میں تبدیل کرنے کے لیے متن کی جیومیٹری سے ٹیبل کی ساخت کا اندازہ لگانے کی ضرورت ہوتی ہے۔ جہاں ایک سیل ختم ہوتا ہے اور اگلا شروع ہوتا ہے اس کا اندازہ افقی وائٹ اسپیس سے لگانا ضروری ہے۔ جہاں ایک قطار ختم ہوتی ہے اور اگلی شروع ہوتی ہے، عمودی وائٹ اسپیس سے۔

یہ ٹول PDF.js کا استعمال کرتے ہوئے پی ڈی ایف کو پارس کرتا ہے، ٹیکسٹ آئٹمز کو ان کے باؤنڈنگ بکس کے ساتھ نکالتا ہے، اور پوزیشن کی بنیاد پر آئٹمز کو قطاروں اور کالموں میں کلسٹر کرتا ہے۔ پتہ لگایا گیا ٹیبل SheetJS xlsx لائبریری کا استعمال کرتے ہوئے ایکسل ورک بک میں لکھا گیا ہے۔ آؤٹ پٹ ایک معیاری .xlsx فائل ہے جو Excel، Google Sheets، Numbers، یا کسی دوسری اسپریڈشیٹ ایپلیکیشن میں کھلتی ہے۔

پی ڈی ایف ٹیبل نکالنا واقعی مشکل ہے، اور کوئی بھی ایکسٹریکٹر ہر پی ڈی ایف پر بہترین نتائج نہیں دیتا ہے۔ مستقل کالم کی حدود کے ساتھ میزیں، کوئی ضم شدہ سیل نہیں، اور واضح عمودی سیدھ صاف طور پر تبدیل ہوتی ہے۔ ضم شدہ سیلز، ملٹی لائن اندراجات، فوٹ نوٹ، یا غیر معمولی لے آؤٹ والی میزوں کو عام طور پر نکالنے کے بعد دستی صفائی کی ضرورت ہوتی ہے۔ جائزہ لینے کا منصوبہ بنائیں۔

پی ڈی ایف کو ایکسل میں کیوں تبدیل کریں۔

وجہ تقریبا ہمیشہ تجزیہ ہے. پی ڈی ایف میں پھنسے ہوئے ڈیٹا کو ترتیب، فلٹر، خلاصہ، چارٹ یا محور نہیں کیا جا سکتا۔ ایک بار جب یہ ایکسل میں آجائے تو، ہر معیاری اسپریڈشیٹ آپریشن دستیاب ہو جاتا ہے — اور اس سے جامد رپورٹ کو دیکھنے اور اس میں موجود نمبروں کے ساتھ کام کرنے کے درمیان فرق کھل جاتا ہے۔

پی ڈی ایف میں بلک ڈیٹا کا کام ناممکن ہے۔ متعدد پی ڈی ایف رپورٹس میں سہ ماہی اعداد و شمار کو جمع کرنا، دکانداروں کے درمیان لائن آئٹمز کا موازنہ کرنا، یا بہاو تجزیہ کے لیے مخصوص کالموں کو کھینچنا ان سب کے لیے ڈیٹا کو ایک ایسے فارمیٹ میں حاصل کرنے کی ضرورت ہوتی ہے جو ان کارروائیوں کو سپورٹ کرتا ہو۔ Excel اور CSV وہ فارمیٹس ہیں۔ تبدیلی پل ہے۔

استعمال کرنے کا طریقہ

ٹیبلر ڈیٹا پر مشتمل پی ڈی ایف ڈراپ کریں، ہر ٹیبل کے ساتھ اس کی اپنی شیٹ پر ایک ورک بک حاصل کریں۔

  1. اپنی پی ڈی ایف اپ لوڈ کریں۔: فائل کو اپ لوڈ ایریا میں گھسیٹیں یا براؤز کرنے کے لیے کلک کریں۔ 50 MB تک کی فائلیں معاون ہیں۔ پی ڈی ایف میں اصل متن ہونا ضروری ہے۔ اسکین شدہ پی ڈی ایف کو پہلے OCR کی ضرورت ہوتی ہے۔
  2. ٹیبل کا پتہ لگانے کا انتظار کریں۔: PDF.js ٹیکسٹ آئٹمز اور ان کی پوزیشنز کو نکالتا ہے۔ کنورٹر افقی اور عمودی سیدھ کا تجزیہ کرکے آئٹمز کو قطاروں اور کالموں میں کلسٹر کرتا ہے۔ کھوج میں مختصر دستاویزات کے لیے سیکنڈ اور ملٹی پیج ٹیبلز کے لیے زیادہ وقت لگتا ہے۔
  3. دریافت شدہ جدولوں کا جائزہ لیں۔: ڈاؤن لوڈ کرنے سے پہلے دریافت شدہ ٹیبلز کا جائزہ لیا جاتا ہے۔ تصدیق کریں کہ کالم اور قطاریں آپ کی توقع کے مطابق ہیں۔ یہاں کی غلط ترتیب بعد میں ایکسل کلین اپ بن جاتی ہے۔
  4. XLSX کے بطور ڈاؤن لوڈ کریں۔: کنورٹر SheetJS کا استعمال کرتے ہوئے .xlsx ورک بک میں ہر ایک دریافت شدہ ٹیبل کو علیحدہ شیٹ میں لکھتا ہے۔ ایکسل یا گوگل شیٹس میں نتیجہ کھولیں اور کسی بھی بقایا مسائل کو صاف کریں۔

عام استعمال کے معاملات

تکنیکی تفصیلات

PDF.js ایک getTextContent API کو ظاہر کرتا ہے جو ٹیکسٹ آئٹمز کو ان کے باؤنڈنگ بکس کے ساتھ واپس کرتا ہے۔ ہر آئٹم میں ایک تار، ایک ٹرانسفارم میٹرکس (پوزیشن اور گردش کے لیے)، اور چوڑائی/اونچائی ہوتی ہے۔ کنورٹر لائنوں کی شناخت کے لیے Y-coordinate کے ذریعے آئٹمز کو ترتیب دیتا ہے، پھر X-coordinate کے ذریعے ہر لائن کے اندر۔ بہت ملتی جلتی Y پوزیشنوں پر آئٹمز ایک قطار بناتے ہیں۔

کالم کا پتہ لگانے میں فرق کے تجزیے کا استعمال کیا جاتا ہے: لگاتار آئٹمز کے درمیان X فاصلہ یہ بتاتا ہے کہ آیا ان کا تعلق ایک ہی سیل سے ہے یا ملحقہ خلیوں سے۔ ایک حد سے بڑا خلا (عام طور پر 1–2 حروف کی چوڑائی) کالم کی باؤنڈری کا اشارہ کرتا ہے۔ تھریشولڈ ٹیوننگ ملحقہ کالموں کو ضم کرنے اور سنگل کالموں کو تقسیم کرنے کے درمیان تجارت کرتی ہے۔

ایکسل آؤٹ پٹ شیٹ جے ایس کو میموری میں ورک بک بنانے کے لیے استعمال کرتا ہے، جس میں ہر ایک دریافت شدہ ٹیبل کا نام شیٹ1، شیٹ2، وغیرہ ہوتا ہے۔ نتیجہ Excel 2007+، Google Sheets، LibreOffice Calc، اور Apple Numbers میں کھلتا ہے۔

بہترین طرز عمل

اکثر پوچھے جانے والے سوالات

کیا پی ڈی ایف کو EXCEL میں تبدیل کرنے سے مواد تبدیل ہوتا ہے؟
مواد کو ہر ممکن حد تک درست طریقے سے محفوظ کیا جاتا ہے۔ تاہم، کچھ فارمیٹ مخصوص خصوصیات میں براہ راست مساوی نہیں ہو سکتا، لہذا فارمیٹنگ میں معمولی فرق ہو سکتا ہے۔
EXCEL فارمیٹ کس کے لیے استعمال ہوتا ہے؟
XLSX (Microsoft Excel Spreadsheet) بنیادی طور پر فارمولوں، چارٹس اور ڈیٹا کے تجزیہ کے ساتھ اسپریڈ شیٹس کے لیے استعمال ہوتا ہے۔
کیا کوئی حدود ہیں جن سے آگاہ ہونا ضروری ہے؟
50MB تک کی فائلیں معاون ہیں۔ بہت بڑی یا پیچیدہ فائلوں پر کارروائی میں زیادہ وقت لگ سکتا ہے۔ تمام تبدیلیاں آپ کے براؤزر میں ہوتی ہیں، لہذا پروسیسنگ کی رفتار آپ کے آلے پر منحصر ہے۔
کیا میرے دستاویز کا ڈیٹا محفوظ ہے؟
جی ہاں دستاویز کی پروسیسنگ مکمل طور پر آپ کے براؤزر میں چلتی ہے۔ آپ کی فائلیں اور ان کے مواد کو کبھی بھی کسی سرور پر اپ لوڈ نہیں کیا جاتا ہے۔ یہ حساس یا خفیہ دستاویزات کو تبدیل کرنا محفوظ بناتا ہے۔
کیا آؤٹ پٹ فارمیٹ تیار کیا جاتا ہے؟
.xlsx (Office Open XML)، جدید ایکسل فارمیٹ۔ فائل Excel 2007+، Google Sheets، LibreOffice Calc، Apple Numbers، اور کسی بھی دوسری جدید اسپریڈشیٹ میں کھلتی ہے۔
کیا میری پی ڈی ایف سرور پر اپ لوڈ ہے؟
نہیں۔ آپ کے براؤزر میں PDF.js اور SheetJS کا استعمال کرتے ہوئے پارسنگ اور ایکسل جنریشن ہوتی ہے۔
زیادہ سے زیادہ فائل کا سائز کیا ہے؟
50 ایم بی۔ تبادلوں کا وقت صرف فائل کے سائز کے بجائے دستاویز کی پیچیدگی پر منحصر ہے — گرافکس سے بھاری 50 ایم بی پی ڈی ایف کو ٹیکسٹ ہیوی سے نکالنے میں زیادہ وقت لگ سکتا ہے۔
میرے نمبر غلط کالموں میں کیوں ہیں؟
تقریبا ہمیشہ اس وجہ سے کہ کنورٹر کے کالم کا پتہ لگانے کی حد پی ڈی ایف کے اصل لے آؤٹ سے مماثل نہیں ہے۔ سورس پی ڈی ایف کو کھولیں، دیکھیں کہ کالم کہاں بصری طور پر ٹوٹتے ہیں، اور ضرورت کے مطابق ایکسل میں سیل کو دستی طور پر شفٹ کریں۔