1. المنتجات
  2.   استخراج نص PDF

مستخرج نصوص PDF لـ .NET

استخراج النص النقي أو الخام أو العادي من مستندات PDF باستخدام مكون إضافي Documentize .NET

مستخرج النصوص لـ .NET

تقدم مكون إضافة استخراج النص من Documentize لـ .NET - أداة قوية تبسط عملية استخراج النص من مستندات PDF الخاصة بك. هذا المكون هو أكثر من مجرد مستخرج نصوص - إنه حلاً شاملاً يعزز كفاءة وتنوع عملية إدارة المستندات الخاصة بك. يعمل البرنامج الإضافي عن طريق مسح مستندات PDF الخاصة بك وتحديد النص المضمن. ثم يستخرج هذا النص مع الحفاظ على تنسيقه وبنيته الأصلية. تتعلق هذه العملية كلها بتحسين إمكانية الوصول واستخدام المحتوى الخاص بك. تعد واحدة من الميزات البارزة لهذه الإضافة هي قدرتها على تقديم ثلاثة أوضاع تشغيل: الوضع النقي، والوضع الخام، والوضع العادي. يقوم الوضع النقي باستخراج النص مع الحفاظ على تنسيقه الأصلي. يقوم الوضع الخام باستخراج النص كما هو، دون أي تنسيق. يقوم الوضع العادي باستخراج النص وإزالة أي رموز خاصة أو تنسيق. توفر هذه الأوضاع المرونة والراحة لمهام استخراج النصوص في تطبيقات .NET، مما يضمن لك اختيار أفضل وضع يناسب احتياجاتك. ومع ذلك، فإن فوائد هذه الإضافة تتجاوز استخراج النص. إنها تقدم أيضًا عملية استخراج سلسة وفعالة، مما يقلل من الوقت والجهد المطلوبين لاستخراج النص من ملف PDF الخاص بك. مع هذه الإضافة، يمكنك تجربة راحة استخراج النصوص بسرعة وسهولة. باختصار، إضافة Documentize Text Extractor for .NET هي حلا شاملا يسهل عملية استخراج النص من مستندات PDF الخاصة بك، ويعزز إمكانية الوصول إلى محتواك، وييسّر عملية إدارة الوثائق الخاصة بك. جربها الآن واستمتع بالراحة والكفاءة التي يوفرها البرنامج المساعد اليوم. اكتشف مستوى جديد من الكفاءة!

كيفية استخراج النص من PDF عبر .NET

  • وثيقة المرجعية Documentize في مشروعك
  • ضع مفاتيح الترخيص الخاصة بك
  • إنشاء حالات من TextExtractorOptions
  • ʕAdd input PDF documents using TextExtractorOptions.AddDataSourceʔ
  • واستدعِ TextExtractorOptions.Process وسنوفّر نتيجته لِـ ResultContainer
  • ResultContainer.ResultCollection` را استفاده کنید تا متن استخراج شده را به دست آورید

البدء مع استخراج نصوص PDF

احصل على ملفات التجميع من التنزيلات أو احصل على الحزمة من NuGet لإضافة Documentize مباشرة إلى مساحة العمل الخاصة بك.

  • Windows 7-11, Windows Server 2003-2022, macOS (10.12+)، و Linux يشمل أنظمة التشغيل المدعومة
  • تتراوح الأطر الداعمة من 4.0 إلى 7.0
  • متوافق مع مختلف إصدارات Microsoft Visual Studio


كيفية استخراج النصوص من عدة ملفات PDF

  • الرجاء إعادة صياغة النص بواضحية واضافة المزيد من التفاصيل.
  • ضع مفاتيح الترخيص الخاصة بك
  • تكوين حالات من “TextExtractor” و “TextExtractorOptions”
  • ʕAdd input PDF documents using TextExtractorOptions.AddDataSourceʔ
  • يُرجى استدعاء TextExtractor.Process بمعلمة يتم تمريرها كمثيل من TextExtractorOptions
  • احصل على النتيجة في مثيل من ResultContainer
  • نفذ النص المستخرج باستخدام ‘ResultContainer.ResultCollection’

أوضاع تشغيل مستخرج النصوص

  • الخيار الصافي يمكن استخراج النص من ملف PDF بإجراءات تنسيق مختلفة، مع إدراج المواقع النسبية وإضافة مسافات إضافية لمحاذاة النص بعرض الصفحة
  • يقوم وضع الـ Raw بإستخراج النص من ملف PDF دون تطبيق أي تنسيق
  • يستخرج وضع العادي النص من ملف PDF، مع مراعاة التموضع النسبي لشظايا النص، ولكن على عكس وضع “الخالص”، فهو لا يضيف مساحة إضافية.

الأسئلة الشائعة

ماذا يفعل مستخرج نصوص Documentize لـ .NET؟

تُعد قارئ النصوص من Documentize لـ .NET إضافة مصممة لتطبيقات .NET، توفر استخراج النص من مستندات PDF بثلاثة أوضاع للعمل؛ خام، نقي، وعادي. يعتمد افتراضيًا على الوضع ‘الخام’، ويدعم خيارات متنوعة للإدخال والإخراج، ويسمح بمعالجة متزامنة لملفات PDF متعددة، كما يوفر تخصيصًا للمطورين، مما يجعله حلاً مريحًا لاستخراج النصوص داخل بيئات .NET.

ما هو الفرق بين Documentize لـ .NET و Documentize Text Extractor لـ .NET؟

Documentize لـ .NET هو واجهة برمجة تطبيقات قوية لـ .NET لمجموعة واسعة من مهام PDF ، بما في ذلك إنشاء الوثائق ، والضغط ، وإنشاء الجداول ، والميزات المتقدمة مثل استيراد وتصدير بيانات PDF. من ناحية أخرى، Documentize Text Extractor for .NET هو إضافة متخصصة تركز فقط على استخراج النص من وثائق PDF ، مع التركيز على قدرات استخراج النص.

هل يقتصر مستخرج نصوص Documentize لـ .NET على استخراج النصوص فقط من ملفات PDF؟

نعم، تم تصميم PDF Text Extractor لـ .NET خصيصًا لاستخراج النص من ملف PDF. بالنسبة لعمليات أخرى، يمكنك استخدام إضافات PDF أخرى أو استخدام القدرات الكاملة لمكتبة Documentize.

هل تقدم دوكيومنتايز أداة عبر الإنترنت لاستخراج نصوص ملفات PDF؟

نعم، يوفر Documentize أداة محلل نصوص PDF عبر الإنترنت مجانية للاحتياجات الأساسية.

أين يمكنني العثور على أمثلة استخراج نصوص Documentize في C#؟

اكتشف صفحات الهبوط الخاصة بنا لـ استخراج النص من PDF لـ .NET

 عربي