PDF به Word (DOCX)
متن را از PDF استخراج کنید و آن را به طور کامل در مرورگر خود به فرمت Word قابل ویرایش تبدیل کنید. سریع، امن و خصوصی.
فایل PDF را اینجا رها کنید
تا 50 مگابایت پشتیبانی می کند
متن را از PDF استخراج کنید و آن را به طور کامل در مرورگر خود به فرمت Word قابل ویرایش تبدیل کنید. سریع، امن و خصوصی.
تا 50 مگابایت پشتیبانی می کند
PDF و DOCX (Microsoft Word) اسناد را با استفاده از مدلهای اساساً متفاوت توصیف میکنند. PDF یک فرمت طرحبندی ثابت است: هر علامت دارای موقعیت صریح در یک صفحه با اندازه ثابت است، که باعث میشود سند در هر جایی که ارائه میشود یکسان به نظر برسد. DOCX یک قالب طرحبندی جریان است: پاراگرافها، جداول، و سرفصلها به صورت معنایی توصیف میشوند و موتور رندر بر اساس اندازه صفحه فعلی و فونت موجود تصمیم میگیرد کجا قرار گیرند. تبدیل از PDF به DOCX به معنای مهندسی معکوس طرحبندی ثابت به یک ساختار معنایی است که Word میتواند دوباره جریان یابد.
این تبدیل ذاتا ضرر دارد. PDF به طور کلی سطوح عنوان، مرزهای پاراگراف، ساختار فهرست یا معنای جدول را حفظ نمی کند. مبدل باید این موارد را از اندازه فونت، موقعیت و کاراکترهای گلوله استنتاج کند. PDF های مبتنی بر متن ساده به صورت تمیز تبدیل می شوند. PDF های پیچیده با طرح بندی چند ستونی، تصاویر جاسازی شده، پاورقی ها یا تایپوگرافی غیر معمول معمولاً پس از تبدیل نیاز به پاکسازی دستی دارند.
این ابزار تبدیل را در مرورگر شما با استفاده از PDF.js برای تجزیه و یک طرحبندی سفارشی به DOCX writer اجرا میکند که خروجی استاندارد Office Open XML را تولید میکند. نتیجه در Microsoft Word، LibreOffice Writer، Google Docs و هر ویرایشگر سازگار با DOCX دیگر باز می شود. هیچ آپلودی اتفاق نمی افتد. فایل در دستگاه شما باقی می ماند.
قابلیت ویرایش تمام دلیل است. PDF با ویرایش مخالف است - می توانید فیلدهای فرم را پر کنید و حاشیه نویسی کنید، اما نمی توانید بدون ویرایشگرهای PDF تخصصی که هزینه زیادی دارند و نتایج متناقضی ایجاد می کنند، متن را دوباره جریان دهید، سبک پاراگراف را تغییر دهید یا محتوا را بازسازی کنید. DOCX برای ویرایش ساخته شده است. تبدیل PDF به DOCX محتوا را برای بازبینی، ترجمه، تغییر منظور یا طراحی مجدد قابل حمل و نقل می کند.
دلیل دیگر همکاری است. Word و Google Docs زبان همکاری اسناد در دفاتر، مدارس و بیشتر سازمانها هستند. موضوعات نظرات، تغییرات ردیابی و ویرایش مشترک همه DOCX یا معادلهای ابری آن را فرض میکنند. فایل های PDF ارسال شده برای بررسی به گلوگاه تبدیل می شوند. DOCX از طریق ابزارهای استاندارد همکاری جریان دارد.
PDF را رها کنید، تولید کنید، دانلود کنید. انتظار داشته باشید بعد از آن مقداری پاکسازی در Word انجام دهید.
PDF.js هر صفحه PDF را در جریانی از عملیات متن و گرافیک تجزیه می کند. API استخراج متن، آیتم های متنی را با کادرهای محدود، اطلاعات فونت و رشته های رمزگشایی شده با یونیکد برمی گرداند. مبدل از میان این موارد، ترتیب خواندن را با مرتبسازی از بالا به پایین و چپ به راست، گروهبندی موارد با خطوط پایه مشابه به خطوط و خطوط در پاراگراف بازسازی میکند.
DOCX یک بایگانی فشرده حاوی فایلهای XML (document.xml، styles.xml، بهعلاوه مانیفستهای نوع محتوا و روابط) است. مبدل محتوای document.xml را با استفاده از یک سری عناصر پاراگراف (w:p) و run (w:r) میسازد، ارجاعات سبک را برای سرفصلها اعمال میکند (هدینگ 1، سرفصل 2) که در آن اندازه فونت یک عنوان را نشان میدهد، و زیپ را در حافظه با استفاده از JSZip جمعآوری میکند.
محدودیت ها: طرح بندی ستون ها همیشه به درستی بازسازی نمی شوند. جداول موجود در PDF به صورت پاراگراف بازیابی می شوند مگر اینکه طرح به شدت ساختار جدولی را پیشنهاد کند. سرصفحهها، پاورقیها و پاورقیها معمولاً بهجای نواحی DOCX مربوطه، بهطور درون خطی در بدنه قرار میگیرند. تصاویر جاسازی شده در PDF در حال حاضر در خروجی DOCX حفظ نمی شوند.