PDF to ایچ ٹی ایم ایل کنورٹر
پی ڈی ایف دستاویزات کو اپنے براؤزر میں صاف، سیمنٹک HTML فائلوں میں تبدیل کریں۔ تیز، محفوظ، اور دستاویز کے ڈھانچے کو محفوظ رکھتا ہے۔
پی ڈی ایف فائل کو منتخب کریں۔
یا یہاں گھسیٹیں اور چھوڑیں۔
پی ڈی ایف دستاویزات کو اپنے براؤزر میں صاف، سیمنٹک HTML فائلوں میں تبدیل کریں۔ تیز، محفوظ، اور دستاویز کے ڈھانچے کو محفوظ رکھتا ہے۔
یا یہاں گھسیٹیں اور چھوڑیں۔
پی ڈی ایف کو ایچ ٹی ایم ایل میں تبدیل کرنا ایک فکسڈ لے آؤٹ دستاویز کو بہتے ہوئے ویب پیج میں بدل دیتا ہے۔ تبدیلی متنی مواد، عنوانات، پیراگراف، اور بنیادی اسٹائل کو محفوظ رکھتی ہے جبکہ HTML کے جوابی بہاؤ کے حق میں پی ڈی ایف کے عین مطابق پکسل لے آؤٹ کو ترک کرتی ہے۔ ویب مواد کے طور پر دوبارہ شائع ہونے والی دستاویزات کے لیے یہ صحیح تجارت ہے — مضامین، رپورٹس، تکنیکی دستاویزات — اور ان دستاویزات کے لیے غلط تجارت جن کی ترتیب ضروری ہے — فارم، سخت پوزیشننگ کے ساتھ رسیدیں، ڈیزائن کردہ مارکیٹنگ کے ٹکڑے۔
یہ ٹول PDF سے متن، فونٹس اور بنیادی ڈھانچہ نکالنے کے لیے PDF.js کا استعمال کرتا ہے، پھر ٹائپوگرافی کے لیے ایمبیڈڈ CSS کے ساتھ متعلقہ HTML مارک اپ لکھتا ہے۔ آؤٹ پٹ ایک اسٹینڈ .html فائل ہے جسے آپ کسی بھی براؤزر میں کھول سکتے ہیں، CMS میں پیسٹ کر سکتے ہیں، یا حسب ضرورت CSS کے ساتھ مزید اسٹائل۔ کوئی اپ لوڈ نہیں ہوتا ہے۔ تبدیلی آپ کے براؤزر میں چلتی ہے۔
دو آؤٹ پٹ اسٹائل سپورٹ ہیں۔ سیمنٹک ایچ ٹی ایم ایل پیراگراف اور ہیڈنگ عناصر کے ساتھ صاف مارک اپ تیار کرتا ہے، جو بلاگ یا دستاویزی سائٹ پر مواد کو دوبارہ شائع کرنے کے لیے موزوں ہے۔ بصری ایچ ٹی ایم ایل پی ڈی ایف کے زیادہ سے زیادہ لے آؤٹ کو مطلق پوزیشننگ کے ذریعے محفوظ کرتا ہے، جب دستاویز کی ظاہری شکل دوبارہ بہاؤ سے زیادہ اہمیت رکھتی ہو۔
پی ڈی ایف ویب پر اچھی طرح سے کام نہیں کرتی ہیں۔ موبائل براؤزرز پی ڈی ایف کو عجیب و غریب انداز میں پیش کرتے ہیں، اسکرین ریڈرز انہیں متضاد طریقے سے ہینڈل کرتے ہیں، سرچ انجن انہیں کرال کرتے ہیں لیکن انہیں مساوی ایچ ٹی ایم ایل سے کم درجہ دیتے ہیں، اور پی ڈی ایف کو ویب پیج میں ایمبیڈ کرنے سے مقامی تجربے کے بجائے ان-فریم ناظرین کی تخلیق ہوتی ہے۔ HTML میں تبدیل کرنے سے ایسا مواد تیار ہوتا ہے جو ویب کے کام کرنے کے طریقے سے کام کرتا ہے۔
ایچ ٹی ایم ایل بھی قابل تدوین ہے۔ ایک بار جب پی ڈی ایف کا مواد ایچ ٹی ایم ایل کی شکل میں آجاتا ہے، تو آپ ٹائپوگرافی کو تبدیل کر سکتے ہیں، سیکشنز کو ری اسٹرکچر کر سکتے ہیں، انٹرایکٹو عناصر شامل کر سکتے ہیں، اور مواد کو دوسرے ویب صفحات کے ساتھ مربوط کر سکتے ہیں۔ پی ڈی ایف ان تمام کارروائیوں کے خلاف مزاحمت کرتا ہے۔
پی ڈی ایف ڈراپ کریں، آؤٹ پٹ اسٹائل کا انتخاب کریں، جنریٹ کریں۔
PDF.js متنی مواد کو باؤنڈنگ بکس، فونٹس اور یونیکوڈ سٹرنگ کے ساتھ آئٹمز کے طور پر ظاہر کرتا ہے۔ کنورٹر آئٹمز کو Y پھر X کے حساب سے ترتیب دیتا ہے تاکہ ریڈنگ آرڈر کو بحال کیا جا سکے، اسی طرح کی بیس لائنوں پر آئٹمز کو لائنوں میں گروپ کرتا ہے، اور عمودی وقفہ کاری کی بنیاد پر پیراگراف میں کلسٹر لائنز بناتا ہے۔
سرخی کا پتہ لگانے میں فونٹ کے سائز کے تجزیہ کا استعمال کیا جاتا ہے: باڈی فونٹ سے نمایاں طور پر بڑے سائز ہیڈنگ بن جاتے ہیں، جس میں سب سے بڑے کو h1، اگلا سب سے بڑا h2 پر میپ کیا جاتا ہے، وغیرہ۔ فہرست کا پتہ لگانا گولی کے حروف یا عددی ترتیب سے شروع ہونے والی لائنوں کو تلاش کرتا ہے۔
آؤٹ پٹ ایچ ٹی ایم ایل خود موجود ہے: ڈاک ٹائپ، ٹائپوگرافی کے لیے ایمبیڈڈ سی ایس ایس کے ساتھ ہیڈ، تبدیل شدہ مواد کے ساتھ باڈی۔ پی ڈی ایف سے ان لائن امیجز فی الحال ایمبیڈڈ نہیں ہیں۔ وہ ایک معلوم حد بنی ہوئی ہیں۔ آؤٹ پٹ HTML5 کے بطور تصدیق کرتا ہے۔