محول مجاني

PDF إلى Excel (XLSX)

استخرج الجداول والنصوص من ملفات PDF وقم بتحويلها إلى جداول بيانات Excel XLSX بأمان في متصفحك مجانًا.

أفلت ملف PDF هنا

أو انقر لاختيار ملف

أو

حول هذه الأداة

يعد سحب البيانات الجدولية من ملف PDF إلى جدول بيانات أحد أكثر عمليات سير عمل المستندات شيوعًا في المكاتب التي تتعامل مع الفواتير والتقارير المالية والأوراق العلمية والبيانات الحكومية. لا يفهم تنسيق PDF الجداول أصلاً - فهو يصف فقط مواضع الحروف الرسومية على الصفحة - لذا فإن التحويل إلى Excel يتطلب استنتاج بنية الجدول من هندسة النص. يجب تخمين المكان الذي تنتهي فيه خلية واحدة وتبدأ الخلية التالية من مسافة بيضاء أفقية؛ حيث ينتهي صف واحد ويبدأ الصف التالي، من مسافة بيضاء عمودية.

تقوم هذه الأداة بتوزيع ملف PDF باستخدام PDF.js، واستخراج العناصر النصية مع مربعاتها المحيطة، وتجميع العناصر في صفوف وأعمدة بناءً على موضعها. تتم كتابة الجدول المكتشف في مصنف Excel باستخدام مكتبة SheetJS xlsx. الإخراج هو ملف .xlsx قياسي يتم فتحه في Excel أو Google Sheets أو Numbers أو أي تطبيق آخر لجداول البيانات.

يعد استخراج جدول PDF أمرًا صعبًا حقًا، ولا ينتج أي مستخرج نتائج مثالية لكل ملف PDF. يتم تحويل الجداول التي تحتوي على حدود أعمدة متسقة، ولا تحتوي على خلايا مدمجة، ومحاذاة رأسية واضحة بشكل واضح. تحتاج الجداول التي تحتوي على خلايا مدمجة أو إدخالات متعددة الأسطر أو حواشي سفلية أو تخطيطات غير عادية إلى التنظيف اليدوي بعد الاستخراج. خطة للمراجعة.

لماذا تحويل PDF إلى Excel

والسبب هو دائمًا التحليل. لا يمكن فرز البيانات المحتبسة في ملف PDF، أو تصفيتها، أو جمعها، أو تخطيطها، أو محوريتها. بمجرد إدخالها في برنامج Excel، تصبح كل عملية قياسية في جدول البيانات متاحة - وهذا يفتح الفرق بين التحديق في تقرير ثابت والعمل فعليًا مع الأرقام الموجودة فيه.

العمل على البيانات المجمعة مستحيل في PDF. يتطلب تجميع الأرقام ربع السنوية عبر تقارير PDF متعددة، أو مقارنة العناصر عبر البائعين، أو سحب أعمدة محددة للتحليل النهائي، الحصول على البيانات في تنسيق يدعم تلك العمليات. Excel وCSV هما تلك التنسيقات. التحويل هو الجسر.

كيفية الاستخدام

قم بإسقاط ملف PDF يحتوي على بيانات جدولية، واحصل على مصنف يحتوي على كل جدول في الورقة الخاصة به.

  1. قم بتحميل ملف PDF الخاص بك: اسحب الملف إلى منطقة التحميل أو انقر للتصفح. يتم دعم الملفات التي يصل حجمها إلى 50 ميجابايت. يجب أن يحتوي ملف PDF على نص فعلي؛ تحتاج ملفات PDF الممسوحة ضوئيًا إلى التعرف الضوئي على الحروف (OCR) أولاً.
  2. انتظر الكشف عن الجدول: يقوم PDF.js باستخراج العناصر النصية ومواقعها. يقوم المحول بتجميع العناصر في صفوف وأعمدة عن طريق تحليل المحاذاة الأفقية والرأسية. يستغرق الاكتشاف ثوانٍ للمستندات القصيرة ويستغرق وقتًا أطول للجداول متعددة الصفحات.
  3. مراجعة الجداول المكتشفة: تتم معاينة الجداول المكتشفة قبل التنزيل. تأكد من تطابق الأعمدة والصفوف مع ما تتوقعه؛ تصبح المحاذاة الخاطئة هنا بمثابة تنظيف Excel لاحقًا.
  4. قم بالتنزيل بتنسيق XLSX: يقوم المحول بكتابة كل جدول تم اكتشافه في ورقة منفصلة في مصنف .xlsx باستخدام SheetJS. افتح النتيجة في Excel أو Google Sheets وقم بتنظيف أي مشكلات متبقية.

حالات الاستخدام الشائعة

التفاصيل الفنية

يعرض PDF.js واجهة برمجة تطبيقات getTextContent التي تقوم بإرجاع العناصر النصية مع المربعات المحيطة بها. يحتوي كل عنصر على سلسلة، ومصفوفة تحويل (للموضع والتدوير)، والعرض/الارتفاع. يقوم المحول بفرز العناصر حسب الإحداثي Y لتحديد الخطوط، ثم داخل كل سطر حسب الإحداثي X. تشكل العناصر الموجودة في مواضع Y المتشابهة جدًا صفًا.

يستخدم اكتشاف العمود تحليل الفجوة: تشير المسافة X بين العناصر المتتالية في الصف إلى ما إذا كانت تنتمي إلى نفس الخلية أو الخلايا المجاورة. تشير الفجوة الأكبر من العتبة (عادةً ما يتراوح عرضها من 1 إلى 2 حرف) إلى حد العمود. يتم ضبط العتبة بين دمج الأعمدة المجاورة وتقسيم الأعمدة الفردية.

يستخدم إخراج Excel SheetJS لإنشاء مصنف في الذاكرة، مع كل جدول تم اكتشافه على الورقة الخاصة به يسمى Sheet1، Sheet2، وما إلى ذلك. يتم إجراء تسلسل للمصنف إلى تنسيق .xlsx (Office Open XML) ويتم تقديمه كتنزيل. يتم فتح النتيجة في Excel 2007+ وGoogle Sheets وLibreOffice Calc وApple Numbers.

أفضل الممارسات

الأسئلة الشائعة

هل يؤدي تحويل PDF إلى EXCEL إلى تغيير المحتوى؟
يتم الحفاظ على المحتوى بأكبر قدر ممكن من الدقة. ومع ذلك، قد لا تحتوي بعض الميزات الخاصة بالتنسيق على مكافئات مباشرة، لذلك يمكن أن تحدث اختلافات بسيطة في التنسيق.
ما هو تنسيق EXCEL المستخدم؟
يُستخدم XLSX (جدول بيانات Microsoft Excel) بشكل أساسي لجداول البيانات التي تحتوي على الصيغ والمخططات وتحليل البيانات.
هل هناك أي قيود يجب أن تكون على علم بها؟
يتم دعم الملفات التي يصل حجمها إلى 50 ميجابايت. قد تستغرق معالجة الملفات الكبيرة أو المعقدة وقتًا أطول. تتم جميع التحويلات في متصفحك، لذا تعتمد سرعة المعالجة على جهازك.
هل بيانات المستند الخاصة بي آمنة؟
نعم. تتم معالجة المستندات بالكامل في متصفحك. لا يتم أبدًا تحميل ملفاتك ومحتوياتها إلى أي خادم. وهذا يجعل من الآمن تحويل المستندات الحساسة أو السرية.
ما هو تنسيق الإخراج الذي يتم إنتاجه؟
.xlsx (Office Open XML)، تنسيق Excel الحديث. يتم فتح الملف في Excel 2007+ وGoogle Sheets وLibreOffice Calc وApple Numbers وأي جداول بيانات حديثة أخرى.
هل تم تحميل ملف PDF الخاص بي إلى خادم؟
لا، يتم إجراء التحليل وإنشاء Excel في متصفحك باستخدام PDF.js وSheetJS.
ما هو الحد الأقصى لحجم الملف؟
50 ميجابايت. يعتمد وقت التحويل على مدى تعقيد المستند بدلاً من حجم الملف وحده - قد يستغرق استخراج ملف PDF مثقل بالرسومات بحجم 50 ميجابايت وقتًا أطول من استخراج ملف مثقل بالنص.
لماذا أرقامي في الأعمدة الخاطئة؟
دائمًا تقريبًا لأن عتبة الكشف عن عمود المحول لا تتطابق مع التخطيط الفعلي لملف PDF. افتح ملف PDF المصدر، وانظر إلى الأماكن التي تنكسر فيها الأعمدة بشكل مرئي، وقم بتغيير الخلايا يدويًا في Excel حسب الحاجة.