1. Produk
  2.   Ekstraktor Teks

Pengekstrak Teks PDF untuk .NET

Ekstrak teks murni, mentah, atau polos dari dokumen PDF dengan Documentize .NET Plugin.

Pengekstrak Teks untuk .NET

Memperkenalkan Documentize Text Extractor untuk plugin .NET - alat yang kuat yang menyederhanakan proses ekstraksi teks dari dokumen PDF Anda. Plugin ini lebih dari sekadar ekstraktor teks - ini adalah solusi komprehensif yang meningkatkan efisiensi dan fleksibilitas proses manajemen dokumen Anda. Plugin ini bekerja dengan memindai dokumen PDF Anda dan mengidentifikasi teks yang tertanam. Kemudian, plugin ini mengekstrak teks tersebut sambil mempertahankan format dan strukturnya yang asli. Proses ini semua tentang meningkatkan aksesibilitas dan kegunaan konten Anda. Salah satu fitur menonjol dari plugin ini adalah kemampuannya untuk menawarkan tiga mode operasi: murni, mentah, dan biasa. Mode murni mengekstrak teks sambil mempertahankan format aslinya. Mode mentah mengekstrak teks apa adanya, tanpa format apapun. Mode biasa mengekstrak teks dan menghapus karakter atau format khusus. Mode-mode ini memberikan fleksibilitas dan kenyamanan untuk tugas ekstraksi teks dalam aplikasi .NET, memastikan Anda dapat memilih mode terbaik yang sesuai dengan kebutuhan Anda. Namun, manfaat dari plugin ini melampaui ekstraksi teks. Ini juga menawarkan proses ekstraksi yang lancar dan efisien, meminimalkan waktu dan upaya yang diperlukan untuk mengekstrak teks dari PDF Anda. Dengan plugin ini, Anda dapat merasakan kenyamanan ekstraksi teks yang cepat dan mudah. Ringkasnya, plugin Documentize Text Extractor untuk .NET adalah solusi komprehensif yang menyederhanakan proses pengambilan teks dari dokumen PDF Anda, meningkatkan aksesibilitas konten Anda, dan memperlancar proses manajemen dokumen Anda. Cobalah sekarang dan rasakan kenyamanan serta efisiensi plugin kami hari ini. Temukan tingkat efisiensi yang baru!

Cara Mengekstrak Teks dari PDF melalui .NET

  • Dokumentasikan Referensi dalam proyek Anda
  • Atur kunci lisensi Anda
  • Buatlah instance dari TextExtractorOptions
  • Tambahkan dokumen PDF masukan menggunakan TextExtractorOptions.AddDataSource
  • Panggil TextExtractorOptions.Process dan berikan hasilnya ke ResultContainer.
  • Akses teks yang diekstrak menggunakan ResultContainer.ResultCollection

Memulai dengan PDF Text Extractor

Ambil berkas assembly dari unduhan atau ambil paket dari NuGet untuk menambahkan Documentize langsung ke ruang kerja Anda.

  • Sistem operasi yang didukung termasuk Windows 7-11, dan Windows Server 2003-2022, macOS (10.12+), dan Linux
  • Kerangka kerja yang didukung mulai dari 4.0 hingga 7.0
  • Kompatibel dengan berbagai versi Microsoft Visual Studio


Cara Ekstrak Teks dari Beberapa PDF

  • Dokumen Referensi untuk .NET dalam proyek Anda
  • Atur kunci lisensi Anda
  • Buat instance dari TextExtractor & TextExtractorOptions
  • Tambahkan dokumen PDF masukan menggunakan TextExtractorOptions.AddDataSource
  • Panggil TextExtractor.Process dengan sebuah instance dari TextExtractorOptions sebagai parameter
  • Dapatkan hasil ke dalam sebuah instance dari ResultContainer.
  • Akses teks yang diekstrak menggunakan ResultContainer.ResultCollection

Mode Operasi Penarik Teks

  • Opsi Murni memungkinkan ekstraksi teks dari file PDF dengan berbagai prosedur pemformatan, menggabungkan posisi relatif, dan memperkenalkan spasi tambahan untuk meluruskan teks ke lebar halaman
  • mode Raw mengekstrak teks dari file PDF tanpa menerapkan format apapun
  • Mode Plain mengekstrak teks dari file PDF, dengan mempertimbangkan posisi relatif fragmen teks, tetapi tidak seperti mode “Pure”, ia tidak menambahkan ruang ekstra.

Pertanyaan yang Sering Diajukan

Apa yang dilakukan Documentize Text Extractor untuk .NET?

Documentize Text Extractor untuk .NET adalah plugin yang dirancang untuk aplikasi .NET, menawarkan ekstraksi teks dari dokumen PDF dengan tiga mode operasi; Pure, Raw, dan Plain. Secara default, mode yang digunakan adalah ‘Raw’, mendukung opsi input dan output yang beragam, memungkinkan pemrosesan simultan dari beberapa file PDF, dan memberikan kustomisasi untuk pengembang, menjadikannya solusi yang nyaman untuk ekstraksi teks di dalam lingkungan .NET.

Apa perbedaan antara Documentize untuk .NET & Documentize Text Extractor untuk .NET?

Documentize untuk .NET adalah API .NET yang kuat untuk berbagai tugas PDF, termasuk pembuatan dokumen, kompresi, pembuatan tabel, dan fitur canggih seperti impor dan ekspor data PDF. Di sisi lain, Documentize Text Extractor untuk .NET adalah plugin khusus yang fokus hanya pada ekstraksi teks dari dokumen PDF, mengedepankan kemampuan ekstraksi teks.

Apakah Documentize Text Extractor untuk .NET terbatas hanya untuk mengekstrak teks dari PDF?

Ya, PDF Text Extractor untuk .NET dirancang khusus untuk mengekstrak teks dari PDF. Untuk operasi lainnya, Anda dapat menggunakan plugin PDF lainnya atau kemampuan penuh dari pustaka Documentize.

Apakah Documentize menyediakan alat daring untuk Ekstraksi Teks PDF?

Ya, Documentize menyediakan alat pengurai teks PDF online gratis untuk kebutuhan dasar.

Di mana saya bisa menemukan contoh ekstraksi teks Documentize dalam C#?

Temukan Halaman Pendaratan kami untuk Ekstrak Teks dari PDF untuk .NET

 Indonesia