বিনামূল্যে কনভার্টার

PDF থেকে শব্দ (DOCX)

PDF থেকে টেক্সট এক্সট্র্যাক্ট করুন এবং আপনার ব্রাউজারেই সরাসরি এডিটযোগ্য Word ফরম্যাটে রূপান্তর করুন। দ্রুত, নিরাপদ এবং ব্যক্তিগত।

এখানে PDF ফাইল ড্রপ করুন

সর্বোচ্চ 50MB সমর্থিত

অথবা

এই টুল সম্পর্কে

PDF এবং DOCX (Microsoft Word) মৌলিকভাবে ভিন্ন মডেল ব্যবহার করে নথি বর্ণনা করে। পিডিএফ হল একটি ফিক্সড-লেআউট ফরম্যাট: প্রতিটি গ্লিফের একটি নির্দিষ্ট-আকারের পৃষ্ঠায় একটি স্পষ্ট অবস্থান থাকে, যাতে নথিটিকে যেখানেই রেন্ডার করা হয় সেখানে একই রকম দেখায়। DOCX হল একটি ফ্লো-লেআউট ফর্ম্যাট: অনুচ্ছেদ, টেবিল এবং শিরোনামগুলি শব্দার্থকভাবে বর্ণনা করা হয় এবং রেন্ডারিং ইঞ্জিন বর্তমান পৃষ্ঠার আকার এবং ফন্টের উপলব্ধতার উপর ভিত্তি করে পৃষ্ঠায় কোথায় পড়বে তা নির্ধারণ করে। PDF থেকে DOCX-এ রূপান্তর করার অর্থ হল স্থির লেআউটটিকে একটি শব্দার্থিক কাঠামোতে বিপরীত-ইঞ্জিনিয়ারিং করা যা Word পুনরায় প্রবাহিত হতে পারে।

এই রূপান্তর স্বভাবতই ক্ষতিকর। PDF সাধারণত শিরোনাম স্তর, অনুচ্ছেদের সীমানা, তালিকা কাঠামো, বা টেবিল শব্দার্থ সংরক্ষণ করে না; রূপান্তরকারীকে ফন্টের আকার, অবস্থান এবং বুলেট অক্ষর থেকে এগুলি অনুমান করতে হবে। সহজ পাঠ্য-ভিত্তিক পিডিএফ পরিষ্কারভাবে রূপান্তর করুন। মাল্টি-কলাম লেআউট, এমবেডেড ইমেজ, পাদটীকা বা অস্বাভাবিক টাইপোগ্রাফি সহ জটিল PDFগুলির সাধারণত রূপান্তরের পরে ম্যানুয়াল ক্লিনআপের প্রয়োজন হয়।

এই টুলটি পার্সিংয়ের জন্য PDF.js ব্যবহার করে আপনার ব্রাউজারে রূপান্তর চালায় এবং একটি কাস্টম লেআউট-টু-DOCX লেখক যা স্ট্যান্ডার্ড Office Open XML আউটপুট তৈরি করে। ফলাফলটি Microsoft Word, LibreOffice Writer, Google Docs এবং অন্য DOCX- সামঞ্জস্যপূর্ণ সম্পাদকে খোলে। কোন আপলোড হয় না; ফাইলটি আপনার ডিভাইসে থাকে।

কেন পিডিএফকে DOCX এ রূপান্তর করুন

সম্পাদনাযোগ্যতা সম্পূর্ণ কারণ। PDF সম্পাদনা করার জন্য প্রতিকূল — আপনি ফর্ম ক্ষেত্রগুলি পূরণ করতে এবং টীকা করতে পারেন, কিন্তু আপনি টেক্সট পুনঃপ্রবাহ করতে পারবেন না, অনুচ্ছেদের শৈলী পরিবর্তন করতে পারবেন, বা বিশেষায়িত PDF সম্পাদক ছাড়া বিষয়বস্তু পুনর্গঠন করতে পারবেন না যার জন্য অর্থ ব্যয় হয় এবং অসামঞ্জস্যপূর্ণ ফলাফল পাওয়া যায়। DOCX সম্পাদনার জন্য নির্মিত। একটি পিডিএফকে DOCX-এ রূপান্তর করা বিষয়বস্তুকে পুনর্বিবেচনা, অনুবাদ, পুনঃউদ্দেশ্য বা পুনঃডিজাইন করার জন্য সহজ করে তোলে।

অন্য কারণ হল সহযোগিতা। Word এবং Google ডক্স হল অফিস, স্কুল এবং বেশিরভাগ প্রতিষ্ঠানে নথি সহযোগিতার ভাষা। মন্তব্য থ্রেড, ট্র্যাক পরিবর্তন, এবং ভাগ করা সম্পাদনা সব DOCX বা তার ক্লাউড সমতুল্য অনুমান. পর্যালোচনার জন্য পাঠানো পিডিএফগুলি বাধা হয়ে দাঁড়ায়; DOCX স্ট্যান্ডার্ড সহযোগিতা টুলের মাধ্যমে প্রবাহিত হয়।

কিভাবে ব্যবহার করবেন

পিডিএফ ড্রপ করুন, জেনারেট করুন, ডাউনলোড করুন। পরে Word এ কিছু পরিস্কার করার আশা করুন।

  1. আপনার পিডিএফ আপলোড করুন: ফাইলটিকে আপলোড এলাকায় টেনে আনুন বা ব্রাউজ করতে ক্লিক করুন। 50 MB পর্যন্ত ফাইল সমর্থিত। পাসওয়ার্ড-সুরক্ষিত PDF সমর্থিত নয়; একটি ডেস্কটপ টুল ব্যবহার করে প্রথমে পাসওয়ার্ড সরান।
  2. পার্সিংয়ের জন্য অপেক্ষা করুন: PDF.js প্রতিটি পৃষ্ঠা থেকে টেক্সট, ফন্ট তথ্য, এবং লেআউট অবস্থান বের করে। সংক্ষিপ্ত নথিগুলির জন্য পার্সিং সেকেন্ড এবং এমবেডেড চিত্র বা জটিল গ্রাফিক্স সহ নথিগুলির জন্য বেশি সময় নেয়৷
  3. রূপান্তর করুন: রূপান্তরকারী পার্স করা বিষয়বস্তুতে চলে, ফন্টের আকার এবং অবস্থান থেকে অনুচ্ছেদ এবং শিরোনামের সীমানা নির্ধারণ করে এবং একটি ইন-মেমরি জিপ ফাইলে অফিস ওপেন XML লিখে। শিরোনাম, অনুচ্ছেদ এবং বুলেট তালিকা সমতুল্য DOCX শৈলীতে ম্যাপ করা হয়েছে।
  4. ডাউনলোড করুন এবং পরিষ্কার করুন: .docx ফাইলটি সংরক্ষণ করুন এবং এটিকে Word বা আপনার পছন্দের সম্পাদকে খুলুন। অবশিষ্ট সমস্যাগুলি ঠিক করার জন্য কয়েক মিনিট ব্যয় করার পরিকল্পনা করুন — শিরোনাম শ্রেণিবিন্যাস, তালিকা বিন্যাস, টেবিলের সীমানা — যা রূপান্তরকারী PDF থেকে পুরোপুরি অনুমান করতে পারে না।

সাধারণ ব্যবহারের ক্ষেত্রে

প্রযুক্তিগত বিবরণ

PDF.js প্রতিটি PDF পৃষ্ঠাকে টেক্সট এবং গ্রাফিক্স অপারেশনের একটি স্ট্রীমে পার্স করে। টেক্সট-এক্সট্রাকশন API তাদের বাউন্ডিং বাক্স, ফন্ট তথ্য এবং ইউনিকোড-ডিকোডেড স্ট্রিং সহ পাঠ্য আইটেমগুলি ফেরত দেয়। এই আইটেমগুলি থেকে কনভার্টারটি উপরের-থেকে-নিচে এবং বাম-থেকে-ডানে সাজানোর মাধ্যমে পড়ার ক্রম পুনর্গঠন করে, অনুরূপ বেসলাইন সহ আইটেমগুলিকে লাইনে এবং লাইনে অনুচ্ছেদে গোষ্ঠীবদ্ধ করে।

DOCX হল একটি জিপ সংরক্ষণাগার যেখানে XML ফাইল রয়েছে (document.xml, styles.xml, প্লাস বিষয়বস্তুর ধরন এবং সম্পর্ক প্রকাশ)। কনভার্টারটি অনুচ্ছেদ (w:p) এবং রান (w:r) উপাদানগুলির একটি সিরিজ ব্যবহার করে document.xml বিষয়বস্তু তৈরি করে, শিরোনামগুলির জন্য স্টাইল রেফারেন্স প্রয়োগ করে (শিরোনাম 1, শিরোনাম 2) যেখানে ফন্টের আকার একটি শিরোনাম প্রস্তাব করে এবং JSZip ব্যবহার করে মেমরিতে জিপকে একত্রিত করে।

সীমাবদ্ধতা: কলাম লেআউট সবসময় সঠিকভাবে পুনর্গঠিত হয় না। পিডিএফ-এ টেবিলগুলি অনুচ্ছেদ হিসাবে পুনরুদ্ধার করা হয় যদি না লেআউটটি সারণী কাঠামোর দৃঢ় পরামর্শ দেয়। শিরোনাম, পাদচরণ এবং পাদটীকাগুলি সাধারণত সংশ্লিষ্ট DOCX অঞ্চলের পরিবর্তে বডিতে ইনলাইনে শেষ হয়৷ PDF এ এমবেড করা ছবি বর্তমানে DOCX আউটপুটে সংরক্ষিত নেই।

সর্বোত্তম অনুশীলন

সচরাচর জিজ্ঞাসিত প্রশ্নাবলী

পিডিএফকে DOCX এ রূপান্তর করলে কি বিষয়বস্তু পরিবর্তন হয়?
বিষয়বস্তু যথাসম্ভব নির্ভুলভাবে সংরক্ষণ করা হয়. যাইহোক, কিছু বিন্যাস-নির্দিষ্ট বৈশিষ্ট্যের সরাসরি সমতুল্য নাও থাকতে পারে, তাই ছোটখাটো বিন্যাসগত পার্থক্য ঘটতে পারে।
DOCX বিন্যাস কি জন্য ব্যবহৃত হয়?
DOCX (Microsoft Word Document) প্রাথমিকভাবে বিন্যাস সহ সম্পাদনাযোগ্য পাঠ্য নথির জন্য ব্যবহৃত হয়।
সচেতন হতে কোন সীমাবদ্ধতা আছে?
50MB পর্যন্ত ফাইল সমর্থিত। খুব বড় বা জটিল ফাইলগুলি প্রক্রিয়া করতে বেশি সময় লাগতে পারে। সমস্ত রূপান্তর আপনার ব্রাউজারে ঘটে, তাই প্রক্রিয়াকরণের গতি আপনার ডিভাইসের উপর নির্ভর করে।
আমার ডকুমেন্ট ডেটা নিরাপদ?
হ্যাঁ। ডকুমেন্ট প্রসেসিং সম্পূর্ণরূপে আপনার ব্রাউজারে চলে। আপনার ফাইল এবং তাদের বিষয়বস্তু কোনো সার্ভারে আপলোড করা হয় না. এটি সংবেদনশীল বা গোপনীয় নথিগুলিকে রূপান্তর করা নিরাপদ করে তোলে।
টেবিল সংরক্ষণ করা হবে?
সাধারণ টেবিল কখনও কখনও Word টেবিলে রূপান্তরিত হয়; জটিল টেবিলগুলি সাধারণত ফরম্যাট করা অনুচ্ছেদে রূপান্তরিত হয় যার জন্য ম্যানুয়াল পুনর্গঠন প্রয়োজন। নির্ভুলতা গুরুত্বপূর্ণ হলে ম্যানুয়ালি সমালোচনামূলক টেবিল পুনরায় তৈরি করার পরিকল্পনা করুন।
আমার পিডিএফ কি একটি সার্ভারে আপলোড করা হয়েছে?
না। PDF পার্সিং PDF.js ব্যবহার করে এবং DOCX লেখা JSZip ব্যবহার করে — উভয়ই আপনার ব্রাউজারে সম্পূর্ণভাবে চলে।
সর্বোচ্চ ফাইলের আকার কত?
50 এমবি। ব্যবহারিক সীমা নথি জটিলতার উপর নির্ভর করে; সেই আকারের একটি পাঠ্য-ভারী PDF সেকেন্ডে রূপান্তরিত হয়, যখন একই আকারের একটি গ্রাফিক্স-ভারী নথি সংগ্রাম করতে পারে।
আমি কি পাসওয়ার্ড-সুরক্ষিত PDF রূপান্তর করতে পারি?
না। PDF.js ডিক্রিপশন প্রয়োগ করে না। একটি ডেস্কটপ টুল যেমন qpdf বা Acrobat এর নিরাপত্তা সেটিংস ব্যবহার করে প্রথমে পাসওয়ার্ডটি সরান।