বিনামূল্যে কনভার্টার

PDF থেকে Excel (XLSX)

আপনার ব্রাউজারে বিনামূল্যে নিরাপদে PDF থেকে টেবিল এবং টেক্সট এক্সট্র্যাক্ট করুন এবং এক্সেল XLSX স্প্রেডশীটে রূপান্তর করুন।

এখানে PDF ফাইল ড্রপ করুন

বা ফাইল নির্বাচন করতে ক্লিক করুন

অথবা

এই টুল সম্পর্কে

একটি পিডিএফ থেকে টেবুলার ডেটা বের করে একটি স্প্রেডশীটে তোলা হল অফিসে সবচেয়ে সাধারণ ডকুমেন্ট ওয়ার্কফ্লোগুলির মধ্যে একটি যা চালান, আর্থিক প্রতিবেদন, বৈজ্ঞানিক কাগজপত্র এবং সরকারী ডেটা পরিচালনা করে। পিডিএফ ফরম্যাটটি নেটিভভাবে টেবিল বুঝতে পারে না - এটি শুধুমাত্র একটি পৃষ্ঠায় গ্লিফ পজিশন বর্ণনা করে - তাই এক্সেলে রূপান্তর করার জন্য পাঠ্যের জ্যামিতি থেকে টেবিলের গঠন অনুমান করা প্রয়োজন। যেখানে একটি ঘর শেষ হয় এবং পরেরটি শুরু হয় অনুভূমিক হোয়াইটস্পেস থেকে অনুমান করতে হবে; যেখানে একটি সারি শেষ হয় এবং পরবর্তীটি শুরু হয়, উল্লম্ব হোয়াইটস্পেস থেকে।

এই টুলটি PDF.js ব্যবহার করে PDF পার্স করে, টেক্সট আইটেমগুলিকে তাদের বাউন্ডিং বক্সের সাহায্যে বের করে এবং অবস্থানের উপর ভিত্তি করে আইটেমগুলিকে সারি এবং কলামে ক্লাস্টার করে। সনাক্ত করা টেবিলটি SheetJS xlsx লাইব্রেরি ব্যবহার করে একটি এক্সেল ওয়ার্কবুকে লেখা হয়েছে। আউটপুট হল একটি প্রমিত .xlsx ফাইল যা Excel, Google Sheets, Numbers, বা অন্য কোনো স্প্রেডশীট অ্যাপ্লিকেশনে খোলে।

পিডিএফ টেবিল নিষ্কাশন প্রকৃতপক্ষে কঠিন, এবং কোন নিষ্কাশনকারী প্রতিটি PDF এ নিখুঁত ফলাফল উত্পাদন করে না। সামঞ্জস্যপূর্ণ কলামের সীমানা, কোন একত্রিত কক্ষ এবং স্পষ্ট উল্লম্ব প্রান্তিককরণ সহ সারণিগুলি পরিষ্কারভাবে রূপান্তরিত হয়। মার্জড সেল, মাল্টি-লাইন এন্ট্রি, পাদটীকা বা অস্বাভাবিক লেআউট সহ টেবিলগুলি সাধারণত নিষ্কাশনের পরে ম্যানুয়াল ক্লিনআপের প্রয়োজন হয়। পর্যালোচনার জন্য পরিকল্পনা করুন।

পিডিএফকে এক্সেলে কনভার্ট করুন কেন?

কারণ প্রায় সবসময় বিশ্লেষণ. পিডিএফ-এ আটকে থাকা ডেটা সাজানো, ফিল্টার করা, যোগ করা, চার্ট করা বা পিভট করা যায় না। একবার এটি এক্সেলে, প্রতিটি স্ট্যান্ডার্ড স্প্রেডশীট অপারেশন উপলব্ধ হয়ে যায় - এবং এটি একটি স্ট্যাটিক রিপোর্টের দিকে তাকানো এবং প্রকৃতপক্ষে এটিতে থাকা সংখ্যাগুলির সাথে কাজ করার মধ্যে পার্থক্যটি খুলে দেয়।

পিডিএফে বাল্ক ডেটা কাজ অসম্ভব। একাধিক পিডিএফ রিপোর্ট জুড়ে ত্রৈমাসিক পরিসংখ্যান একত্রিত করা, বিক্রেতাদের জুড়ে লাইন আইটেমগুলির তুলনা করা, বা ডাউনস্ট্রিম বিশ্লেষণের জন্য নির্দিষ্ট কলামগুলি টেনে আনার জন্য এই ক্রিয়াকলাপগুলিকে সমর্থন করে এমন একটি ফর্ম্যাটে ডেটা পাওয়ার প্রয়োজন৷ এক্সেল এবং CSV সেই ফরম্যাট। রূপান্তর সেতু।

কিভাবে ব্যবহার করবেন

ট্যাবুলার ডেটা সহ একটি পিডিএফ ড্রপ করুন, প্রতিটি টেবিলের নিজস্ব শীটে একটি ওয়ার্কবুক পান।

  1. আপনার পিডিএফ আপলোড করুন: ফাইলটিকে আপলোড এলাকায় টেনে আনুন বা ব্রাউজ করতে ক্লিক করুন। 50 MB পর্যন্ত ফাইল সমর্থিত। পিডিএফে প্রকৃত পাঠ্য থাকতে হবে; স্ক্যান করা পিডিএফের প্রথমে ওসিআর প্রয়োজন।
  2. টেবিল সনাক্তকরণের জন্য অপেক্ষা করুন: PDF.js টেক্সট আইটেম এবং তাদের অবস্থান নির্যাস. কনভার্টার অনুভূমিক এবং উল্লম্ব প্রান্তিককরণ বিশ্লেষণ করে আইটেমগুলিকে সারি এবং কলামে ভাগ করে। শর্ট ডকুমেন্টের জন্য শনাক্তকরণে কয়েক সেকেন্ড এবং বহু-পৃষ্ঠার টেবিলের জন্য বেশি সময় লাগে।
  3. সনাক্ত করা টেবিল পর্যালোচনা করুন: সনাক্ত করা টেবিল ডাউনলোড করার আগে পূর্বরূপ দেখা হয়. কলাম এবং সারি আপনার প্রত্যাশার সাথে মিলে যায় তা নিশ্চিত করুন; এখানে মিসলাইনমেন্ট পরে এক্সেল ক্লিনআপ হয়ে যায়।
  4. XLSX হিসাবে ডাউনলোড করুন: রূপান্তরকারী প্রতিটি শনাক্ত করা টেবিলকে SheetJS ব্যবহার করে একটি .xlsx ওয়ার্কবুকে একটি পৃথক শীটে লেখে। Excel বা Google Sheets-এ ফলাফলটি খুলুন এবং যেকোন অবশিষ্ট সমস্যা পরিষ্কার করুন।

সাধারণ ব্যবহারের ক্ষেত্রে

প্রযুক্তিগত বিবরণ

PDF.js একটি getTextContent API প্রকাশ করে যা পাঠ্য আইটেমগুলিকে তাদের বাউন্ডিং বাক্সের সাথে ফেরত দেয়। প্রতিটি আইটেমের একটি স্ট্রিং, একটি রূপান্তর ম্যাট্রিক্স (অবস্থান এবং ঘূর্ণনের জন্য), এবং প্রস্থ/উচ্চতা রয়েছে। কনভার্টার আইটেমগুলিকে Y-কোঅর্ডিনেট অনুসারে সাজায় লাইন শনাক্ত করতে, তারপর প্রতিটি লাইনের মধ্যে X-কোঅর্ডিনেট দ্বারা। খুব অনুরূপ Y অবস্থানে আইটেম একটি সারি গঠন.

কলাম সনাক্তকরণ ফাঁক বিশ্লেষণ ব্যবহার করে: একটি সারিতে থাকা আইটেমগুলির মধ্যে X-দূরত্ব নির্দেশ করে যে তারা একই কক্ষ বা সংলগ্ন কোষের অন্তর্গত কিনা। একটি থ্রেশহোল্ডের চেয়ে বড় একটি ফাঁক (সাধারণত 1-2 অক্ষর প্রস্থ) একটি কলামের সীমানা নির্দেশ করে। থ্রেশহোল্ড টিউনিং সংলগ্ন কলাম একত্রিত করা এবং একক কলাম বিভক্ত করার মধ্যে ট্রেড বন্ধ করে।

এক্সেল আউটপুট মেমরিতে একটি ওয়ার্কবুক তৈরি করতে SheetJS ব্যবহার করে, প্রতিটি শনাক্ত করা টেবিলের সাথে তার নিজস্ব শীটে Sheet1, Sheet2, ইত্যাদি। ওয়ার্কবুকটি .xlsx (অফিস ওপেন XML) ফরম্যাটে সিরিয়াল করা হয় এবং ডাউনলোড হিসাবে দেওয়া হয়। ফলাফলটি Excel 2007+, Google Sheets, LibreOffice Calc, এবং Apple Numbers-এ খোলে।

সর্বোত্তম অনুশীলন

সচরাচর জিজ্ঞাসিত প্রশ্নাবলী

পিডিএফকে EXCEL-এ রূপান্তর করা কি বিষয়বস্তু পরিবর্তন করে?
বিষয়বস্তু যথাসম্ভব নির্ভুলভাবে সংরক্ষণ করা হয়. যাইহোক, কিছু বিন্যাস-নির্দিষ্ট বৈশিষ্ট্যের সরাসরি সমতুল্য নাও থাকতে পারে, তাই ছোটখাটো বিন্যাসগত পার্থক্য ঘটতে পারে।
EXCEL ফরম্যাট কিসের জন্য ব্যবহৃত হয়?
XLSX (Microsoft Excel Spreadsheet) প্রাথমিকভাবে সূত্র, চার্ট এবং ডেটা বিশ্লেষণ সহ স্প্রেডশীটগুলির জন্য ব্যবহৃত হয়।
সচেতন হতে কোন সীমাবদ্ধতা আছে?
50MB পর্যন্ত ফাইল সমর্থিত। খুব বড় বা জটিল ফাইলগুলি প্রক্রিয়া করতে বেশি সময় লাগতে পারে। সমস্ত রূপান্তর আপনার ব্রাউজারে ঘটে, তাই প্রক্রিয়াকরণের গতি আপনার ডিভাইসের উপর নির্ভর করে।
আমার ডকুমেন্ট ডেটা নিরাপদ?
হ্যাঁ। ডকুমেন্ট প্রসেসিং সম্পূর্ণরূপে আপনার ব্রাউজারে চলে। আপনার ফাইল এবং তাদের বিষয়বস্তু কোনো সার্ভারে আপলোড করা হয় না. এটি সংবেদনশীল বা গোপনীয় নথিগুলিকে রূপান্তর করা নিরাপদ করে তোলে।
কি আউটপুট বিন্যাস উত্পাদিত হয়?
.xlsx (অফিস ওপেন XML), আধুনিক এক্সেল বিন্যাস। ফাইলটি Excel 2007+, Google Sheets, LibreOffice Calc, Apple Numbers, এবং অন্য যেকোনো আধুনিক স্প্রেডশীটে খোলে।
আমার পিডিএফ কি একটি সার্ভারে আপলোড করা হয়েছে?
না। আপনার ব্রাউজারে PDF.js এবং SheetJS ব্যবহার করে পার্সিং এবং এক্সেল জেনারেশন হয়।
সর্বোচ্চ ফাইলের আকার কত?
50 এমবি। রূপান্তরের সময় একা ফাইলের আকারের চেয়ে নথির জটিলতার উপর নির্ভর করে — একটি গ্রাফিক্স-ভারী 50 এমবি পিডিএফ একটি পাঠ্য-ভারী পিডিএফের চেয়ে বেশি সময় নিতে পারে।
আমার নম্বর ভুল কলামে কেন?
প্রায় সবসময় কারণ কনভার্টারের কলাম সনাক্তকরণ থ্রেশহোল্ড PDF এর প্রকৃত লেআউটের সাথে মেলে না। সোর্স পিডিএফ খুলুন, কলামগুলি দৃশ্যত ভাঙ্গন কোথায় তা দেখুন এবং প্রয়োজন অনুসারে ম্যানুয়ালি এক্সেলে সেলগুলি স্থানান্তর করুন৷