مبدل رایگان

PDF به Word (DOCX)

متن را از PDF استخراج کنید و آن را به طور کامل در مرورگر خود به فرمت Word قابل ویرایش تبدیل کنید. سریع، امن و خصوصی.

فایل PDF را اینجا رها کنید

تا 50 مگابایت پشتیبانی می کند

یا

درباره این ابزار

PDF و DOCX (Microsoft Word) اسناد را با استفاده از مدل‌های اساساً متفاوت توصیف می‌کنند. PDF یک فرمت طرح‌بندی ثابت است: هر علامت دارای موقعیت صریح در یک صفحه با اندازه ثابت است، که باعث می‌شود سند در هر جایی که ارائه می‌شود یکسان به نظر برسد. DOCX یک قالب طرح‌بندی جریان است: پاراگراف‌ها، جداول، و سرفصل‌ها به صورت معنایی توصیف می‌شوند و موتور رندر بر اساس اندازه صفحه فعلی و فونت موجود تصمیم می‌گیرد کجا قرار گیرند. تبدیل از PDF به DOCX به معنای مهندسی معکوس طرح‌بندی ثابت به یک ساختار معنایی است که Word می‌تواند دوباره جریان یابد.

این تبدیل ذاتا ضرر دارد. PDF به طور کلی سطوح عنوان، مرزهای پاراگراف، ساختار فهرست یا معنای جدول را حفظ نمی کند. مبدل باید این موارد را از اندازه فونت، موقعیت و کاراکترهای گلوله استنتاج کند. PDF های مبتنی بر متن ساده به صورت تمیز تبدیل می شوند. PDF های پیچیده با طرح بندی چند ستونی، تصاویر جاسازی شده، پاورقی ها یا تایپوگرافی غیر معمول معمولاً پس از تبدیل نیاز به پاکسازی دستی دارند.

این ابزار تبدیل را در مرورگر شما با استفاده از PDF.js برای تجزیه و یک طرح‌بندی سفارشی به DOCX writer اجرا می‌کند که خروجی استاندارد Office Open XML را تولید می‌کند. نتیجه در Microsoft Word، LibreOffice Writer، Google Docs و هر ویرایشگر سازگار با DOCX دیگر باز می شود. هیچ آپلودی اتفاق نمی افتد. فایل در دستگاه شما باقی می ماند.

چرا PDF را به DOCX تبدیل کنیم؟

قابلیت ویرایش تمام دلیل است. PDF با ویرایش مخالف است - می توانید فیلدهای فرم را پر کنید و حاشیه نویسی کنید، اما نمی توانید بدون ویرایشگرهای PDF تخصصی که هزینه زیادی دارند و نتایج متناقضی ایجاد می کنند، متن را دوباره جریان دهید، سبک پاراگراف را تغییر دهید یا محتوا را بازسازی کنید. DOCX برای ویرایش ساخته شده است. تبدیل PDF به DOCX محتوا را برای بازبینی، ترجمه، تغییر منظور یا طراحی مجدد قابل حمل و نقل می کند.

دلیل دیگر همکاری است. Word و Google Docs زبان همکاری اسناد در دفاتر، مدارس و بیشتر سازمان‌ها هستند. موضوعات نظرات، تغییرات ردیابی و ویرایش مشترک همه DOCX یا معادل‌های ابری آن را فرض می‌کنند. فایل های PDF ارسال شده برای بررسی به گلوگاه تبدیل می شوند. DOCX از طریق ابزارهای استاندارد همکاری جریان دارد.

نحوه استفاده

PDF را رها کنید، تولید کنید، دانلود کنید. انتظار داشته باشید بعد از آن مقداری پاکسازی در Word انجام دهید.

  1. PDF خود را آپلود کنید: فایل را به قسمت آپلود بکشید یا برای مرور کلیک کنید. فایل های تا 50 مگابایت پشتیبانی می شوند. PDF های محافظت شده با رمز عبور پشتیبانی نمی شوند. ابتدا با استفاده از ابزار دسکتاپ رمز عبور را حذف کنید.
  2. منتظر تجزیه باشید: PDF.js متن، اطلاعات فونت و موقعیت های چیدمان را از هر صفحه استخراج می کند. تجزیه برای اسناد کوتاه چند ثانیه و برای اسناد دارای تصاویر جاسازی شده یا گرافیک پیچیده بیشتر طول می کشد.
  3. تبدیل کنید: مبدل محتوای تجزیه شده را بررسی می کند، مرزهای پاراگراف و عنوان را از اندازه و موقعیت فونت استنباط می کند و Office Open XML را در یک فایل فشرده در حافظه می نویسد. سرفصل ها، پاراگراف ها و لیست های گلوله ای به سبک های معادل DOCX نگاشت می شوند.
  4. دانلود و پاکسازی کنید: فایل .docx را ذخیره کنید و آن را در Word یا ویرایشگر دلخواه خود باز کنید. برنامه‌ریزی کنید که چند دقیقه برای رفع مشکلات باقی‌مانده - سلسله‌مراتب سرفصل، قالب‌بندی فهرست، مرزهای جدول - که مبدل نمی‌تواند کاملاً از PDF استنتاج کند، صرف کنید.

موارد استفاده رایج

جزئیات فنی

PDF.js هر صفحه PDF را در جریانی از عملیات متن و گرافیک تجزیه می کند. API استخراج متن، آیتم های متنی را با کادرهای محدود، اطلاعات فونت و رشته های رمزگشایی شده با یونیکد برمی گرداند. مبدل از میان این موارد، ترتیب خواندن را با مرتب‌سازی از بالا به پایین و چپ به راست، گروه‌بندی موارد با خطوط پایه مشابه به خطوط و خطوط در پاراگراف بازسازی می‌کند.

DOCX یک بایگانی فشرده حاوی فایل‌های XML (document.xml، styles.xml، به‌علاوه مانیفست‌های نوع محتوا و روابط) است. مبدل محتوای document.xml را با استفاده از یک سری عناصر پاراگراف (w:p) و run (w:r) می‌سازد، ارجاعات سبک را برای سرفصل‌ها اعمال می‌کند (هدینگ 1، سرفصل 2) که در آن اندازه فونت یک عنوان را نشان می‌دهد، و زیپ را در حافظه با استفاده از JSZip جمع‌آوری می‌کند.

محدودیت ها: طرح بندی ستون ها همیشه به درستی بازسازی نمی شوند. جداول موجود در PDF به صورت پاراگراف بازیابی می شوند مگر اینکه طرح به شدت ساختار جدولی را پیشنهاد کند. سرصفحه‌ها، پاورقی‌ها و پاورقی‌ها معمولاً به‌جای نواحی DOCX مربوطه، به‌طور درون خطی در بدنه قرار می‌گیرند. تصاویر جاسازی شده در PDF در حال حاضر در خروجی DOCX حفظ نمی شوند.

بهترین شیوه ها

سوالات متداول

آیا تبدیل PDF به DOCX محتوا را تغییر می دهد؟
محتوا تا حد امکان دقیق حفظ می شود. با این حال، برخی از ویژگی های خاص قالب ممکن است معادل مستقیم نداشته باشند، بنابراین تفاوت های قالب بندی جزئی ممکن است رخ دهد.
فرمت DOCX برای چه مواردی استفاده می شود؟
DOCX (Microsoft Word Document) در درجه اول برای اسناد متنی قابل ویرایش با قالب بندی استفاده می شود.
آیا محدودیتی وجود دارد که باید از آن آگاه بود؟
فایل های تا 50 مگابایت پشتیبانی می شوند. پردازش فایل های بسیار بزرگ یا پیچیده ممکن است بیشتر طول بکشد. تمام تبدیل ها در مرورگر شما انجام می شود، بنابراین سرعت پردازش به دستگاه شما بستگی دارد.
آیا داده های سند من امن است؟
بله. پردازش اسناد به طور کامل در مرورگر شما اجرا می شود. فایل های شما و محتویات آنها هرگز در هیچ سروری آپلود نمی شوند. این امر تبدیل اسناد حساس یا محرمانه را ایمن می کند.
آیا جداول حفظ خواهند شد؟
جداول ساده گاهی اوقات به جداول Word تبدیل می شوند. جداول پیچیده معمولاً به پاراگراف های قالب بندی شده تبدیل می شوند که نیاز به بازسازی دستی دارند. اگر دقت مهم است، برنامه ریزی کنید تا جداول مهم را به صورت دستی بازسازی کنید.
آیا پی دی اف من روی سرور آپلود می شود؟
نه. تجزیه PDF از PDF.js استفاده می کند و نوشتن DOCX از JSZip استفاده می کند — هر دو به طور کامل در مرورگر شما اجرا می شوند.
حداکثر اندازه فایل چقدر است؟
50 مگابایت محدودیت های عملی به پیچیدگی سند بستگی دارد. یک PDF سنگین متنی با آن اندازه در چند ثانیه تبدیل می شود، در حالی که یک سند گرافیکی سنگین با همان اندازه ممکن است مشکل داشته باشد.
آیا می توانم PDF های محافظت شده با رمز عبور را تبدیل کنم؟
خیر. PDF.js رمزگشایی را اجرا نمی کند. ابتدا رمز عبور را با استفاده از ابزار دسکتاپ مانند qpdf یا تنظیمات امنیتی Acrobat حذف کنید.