1. Produk
  2.   PDF Extractor

PDF Extractor di C# .NET

Ekstrak gambar, teks, metadata, dan data formulir dalam dokumen PDF menggunakan Documentize .NET Plugin

PDF Extractor di C#

Ekstrak Data dari PDF di C# dengan PdfExtractor.
PDF banyak digunakan untuk menyimpan dokumen karena dapat mempertahankan format di berbagai perangkat. Namun, bekerja dengan PDF sering memerlukan ekstraksi konten spesifik—seperti gambar, teks, metadata, atau data terstruktur—untuk digunakan kembali, analisis, atau penyuntingan. Dengan menguasai ekstraksi PDF, Anda dapat menghemat waktu, memperbaiki alur kerja, dan mendapatkan wawasan lebih dalam dari file yang Anda gunakan.

Fitur Utama

PDF sering berisi logo, grafik, foto, atau gambar hasil pemindaian. Mengekstrak gambar-gambar ini memungkinkan Anda menggunakannya kembali tanpa harus menyalin seluruh halaman.

Ekstraksi teks memungkinkan Anda mengonversi konten yang dapat dibaca dalam PDF menjadi teks yang dapat diedit. Ini sangat membantu ketika Anda perlu memanfaatkan kembali atau menganalisis konten tertulis.

Ekstraksi properti memberikan informasi tentang dokumen PDF. Properti yang mungkin menarik bagi Anda: Title, Author, Subject, Keywords, Number of Pages.

Formulir PDF banyak digunakan dalam aplikasi, survei, faktur, dan kontrak. Formulir memungkinkan pengguna memasukkan informasi langsung ke bidang interaktif. Namun begitu formulir diisi, organisasi sering perlu mengekspor data tersebut untuk penyimpanan, pelaporan, atau analisis.

Memulai

  • Dapatkan file assembly dari unduhan atau ambil paket dari NuGet untuk menambahkan Documentize langsung ke ruang kerja Anda.
  • Referensikan Documentize dalam proyek .NET Anda
  • Setel lisensi Anda License.Set("license.lic"); Opsional

Mengapa Memilih PDF Extractor

  • Ideal untuk pengembang dan bisnis yang mengelola konten visual dalam laporan, presentasi, dan arsip.
  • Ekstraksi cepat dan efisien untuk penggunaan ulang konten yang mudah.
  • Berbagai mode ekstraksi untuk fleksibilitas maksimum.
  • Integrasi .NET yang mulus untuk alur kerja yang disederhanakan.
  • Sistem operasi yang didukung meliputi Windows 7‑11, Windows Server 2003‑2022, macOS (10.12+), dan Linux.
  • Framework yang didukung dari versi 4.0 hingga 8.0.
  • Kompatibel dengan berbagai versi Microsoft Visual Studio.
  • Dokumentasi yang rinci dan high-quality documentation

Cara Mengekstrak Gambar dengan PDF Extractor

  • Konfigurasikan ImageExtractorOptions dengan jalur file input dan pengaturan lainnya yang diperlukan
  • Panggil PdfExtractor.ExtractImages dengan sebuah instance dari ExtractImagesOptions sebagai parameter
  • Akses gambar yang diekstrak melalui ResultContainer.ResultCollection

Via .NET


Cara Mengekstrak Teks dari PDF

  • Buat instance dari TextExtractorOptions
  • Tambahkan dokumen PDF input menggunakan TextExtractorOptions.AddInput
  • Panggil PdfExtractor.ExtractText dengan sebuah instance dari TextExtractorOptions sebagai parameter
  • Akses teks yang diekstrak menggunakan ResultContainer.ResultCollection

Via .NET


Cara Mengekspor Data PDF

  • Buat sebuah instance dari ExtractFormDataToDsvOptions untuk mengonfigurasi proses ekspor data ke CSV
  • Tambahkan file input dan output ke opsi tersebut
  • Panggil metode FormExporter.ExtractFormData, memberikan opsi sebagai parameter

Via .NET


Cara Mengekstrak Properti dari PDF

Via .NET


Pertanyaan yang Sering Diajukan

Apa itu PDF Extractor?

PDF Extractor untuk .NET adalah alat yang kuat dirancang untuk mengekstrak gambar, teks, metadata dari dokumen PDF, atau Data Formulir dalam PDF secara cepat dan mudah. Ia terintegrasi mulus ke dalam aplikasi .NET Anda, menawarkan solusi yang ramah pengguna untuk mengakses konten visual dari PDF.

Bisakah saya menggunakan PDF Extractor untuk .NET untuk operasi PDF lainnya?

Tidak, plugin ini khusus untuk ekstraksi dari PDF. Untuk tugas PDF lainnya, Anda dapat menjelajahi plugin tambahan yang tersedia di perpustakaan Documentize atau memanfaatkan kemampuan lengkapnya untuk pemrosesan dokumen.

Mengapa saya perlu mengekstrak teks/gambar/metadata/data formulir dari PDF?

Mengekstrak data ini dapat berguna untuk menganalisis dokumen, menyiapkan laporan, bekerja dengan AI.

Format output apa yang didukung?

Saat ini plugin ini mengekstrak gambar dalam format PNG. Data formulir diekspor khusus ke format CSV. Jika Anda memerlukan format lain seperti JSON atau XML, Anda mungkin perlu menggunakan alat tambahan atau menyesuaikan output secara manual.

Bisakah saya mengekstrak teks dari PDF yang dipindai?

Jika PDF dipindai atau berisi gambar teks, proses OCR (Optical Character Recognition) mungkin diperlukan untuk mengonversi teks berbasis gambar menjadi format yang dapat diedit.

 Indonesia