PDF به مبدل HTML
اسناد PDF را مستقیماً در مرورگر خود به فایل های HTML تمیز و معنایی تبدیل کنید. سریع، ایمن و ساختار سند را حفظ می کند.
فایل PDF را انتخاب کنید
یا اینجا بکشید و رها کنید
اسناد PDF را مستقیماً در مرورگر خود به فایل های HTML تمیز و معنایی تبدیل کنید. سریع، ایمن و ساختار سند را حفظ می کند.
یا اینجا بکشید و رها کنید
تبدیل PDF به HTML یک سند با طرح بندی ثابت را به یک صفحه وب روان تبدیل می کند. این تبدیل محتوای متن، سرفصلها، پاراگرافها و استایل اولیه را حفظ میکند و در عین حال طرحبندی پیکسلی دقیق PDF را به نفع جریان پاسخگوی HTML رها میکند. این تجارت مناسب برای اسنادی است که به عنوان محتوای وب بازنشر می شوند - مقالات، گزارش ها، اسناد فنی - و تجارت اشتباه برای اسنادی که طرح بندی آنها ضروری است - فرم ها، فاکتورها با موقعیت دقیق، قطعات بازاریابی طراحی شده.
این ابزار از PDF.js برای استخراج متن، فونت و ساختار اصلی از PDF استفاده می کند، سپس نشانه گذاری HTML مربوطه را با CSS جاسازی شده برای تایپوگرافی می نویسد. خروجی یک فایل html. مستقل است که میتوانید آن را در هر مرورگری باز کنید، در یک CMS جایگذاری کنید، یا با CSS سفارشی استایلهای بیشتری انجام دهید. هیچ آپلودی اتفاق نمی افتد. تبدیل در مرورگر شما اجرا می شود.
دو سبک خروجی پشتیبانی می شود. HTML معنایی نشانه گذاری تمیزی را با عناصر پاراگراف و عنوان تولید می کند که برای بازنشر محتوا در وبلاگ یا سایت اسناد مناسب است. Visual HTML بیشتر از طرحبندی PDF را از طریق موقعیتیابی مطلق حفظ میکند، مناسب زمانی که ظاهر سند بیش از جریانپذیری مجدد اهمیت دارد.
فایل های PDF به خوبی در وب کار نمی کنند. مرورگرهای تلفن همراه PDF ها را به طرز ناخوشایندی ارائه می کنند، صفحه خوان ها آنها را به طور متناقض مدیریت می کنند، موتورهای جستجو آنها را می خزند اما آنها را پایین تر از HTML معادل رتبه بندی می کنند، و جاسازی یک PDF در یک صفحه وب، به جای یک تجربه بومی، یک بیننده در iframe بد ایجاد می کند. تبدیل به HTML محتوایی تولید می کند که به روش وب کار می کند.
HTML نیز قابل ویرایش است. هنگامی که محتوای PDF به شکل HTML است، می توانید تایپوگرافی را تغییر دهید، بخش ها را بازسازی کنید، عناصر تعاملی را اضافه کنید و محتوا را با سایر صفحات وب ادغام کنید. PDF در برابر تمام آن عملیات مقاومت می کند.
PDF را رها کنید، سبک خروجی را انتخاب کنید، تولید کنید.
PDF.js محتوای متنی را به صورت آیتم هایی با کادرهای محدود، فونت ها و رشته های یونیکد نشان می دهد. مبدل آیتم ها را بر اساس Y و سپس X مرتب می کند تا ترتیب خواندن را بازیابی کند، موارد را در خطوط پایه مشابه به خطوط گروه بندی می کند و خطوط را بر اساس فاصله عمودی به پاراگراف ها خوشه می کند.
تشخیص سرفصل از تجزیه و تحلیل اندازه فونت استفاده می کند: اندازه هایی که به طور قابل توجهی بزرگتر از فونت بدنه هستند به عنوان تبدیل می شوند، که بزرگترین آنها به h1، بزرگ ترین بعدی به h2 و غیره نگاشت می شوند. تشخیص فهرست به دنبال خطوطی می گردد که با کاراکترهای گلوله یا دنباله های عددی شروع می شوند.
HTML خروجی مستقل است: doctype، سر با CSS جاسازی شده برای تایپوگرافی، بدنه با محتوای تبدیل شده. تصاویر درون خطی از PDF در حال حاضر تعبیه نشده اند. آنها یک محدودیت شناخته شده باقی می مانند. خروجی به صورت HTML5 تایید می شود.