1. Ürünler
  2.   Metin Çıkarıcısı

C# için PDF Metin Çıkarıcısı

PDF belgelerinden saf, ham veya düz metin çıkarın Documentize .NET Eklentisi ile.

Metin Çıkarıcı için .NET

Dokümanızı PDF belgelerinizden metin çıkarmayı basit hale getiren .NET eklentisi Documentize Metin Çıkartıcı’yı tanıtıyoruz. Bu eklenti sadece bir metin çıkartıcıdan fazlasıdır - belge yönetim sürecinizin verimliliğini ve çok yönlülüğünü artıran kapsamlı bir çözümdür. Eklenti, PDF belgelerinizi tarayarak gömülü metni tanımlamak suretiyle çalışır. Ardından bu metni, orijinal biçimlendirmesini ve yapısını koruyarak çıkarır. Bu süreç, içeriğinizin erişilebilirliğini ve kullanılabilirliğini artırmakla ilgilidir. Bu eklentinin belirgin özelliklerinden biri, üç çalışma modunu sunma yeteneğidir: saf, ham ve düz. Saf mod, metni orijinal biçimlendirmesini koruyarak çıkarır. Ham mod, metni herhangi bir biçimlendirme olmadan olduğu gibi çıkarır. Düz mod, metni çıkarırken özel karakterleri veya biçimlendirmeleri kaldırır. Bu modlar, .NET uygulamalarında metin çıkarma görevleri için esneklik ve kolaylık sağlar ve ihtiyaçlarınıza en uygun modu seçebilmenizi garanti eder. Ancak, bu eklentinin faydaları metin çıkarmanın ötesine geçiyor. Ayrıca, metni PDF dosyanızdan çıkarmak için gereken zaman ve çabayı minimize ederek akıcı ve verimli bir çıkartma süreci sunuyor. Bu eklenti ile hızlı ve kolay metin çıkarmanın rahatlığını yaşayabilirsiniz. Özetle, .NET için Documentize Metin Çıkarıcı eklentisi, PDF belgelerinizden metin çıkarma sürecini basitleştiren, içeriğinizin erişilebilirliğini artıran ve belge yönetim sürecinizi kolaylaştıran kapsamlı bir çözümdür. Hemen deneyin ve eklentimizin sunduğu kolaylık ve verimliliği bugün yaşayın. Yeni bir verimlilik seviyesini keşfedin!

NET üzerinden PDF’den Metin Nasıl Çıkarılır

  • Projenizde Referans Belgesi oluşturun
  • Lisans anahtarlarınızı ayarlayın.
  • TextExtractorOptions` örneklerini oluşturun.
  • Giriş PDF belgelerini TextExtractorOptions.AddDataSource kullanarak ekleyin
  • TextExtractorOptions.Process'i çağırın ve sonucu ResultContainer`‘a atayın.
  • ResultContainer.ResultCollection` kullanarak çıkarılan metne erişin.

PDF Metin Çıkartıcı ile Başlarken

İndirmelerden derleme dosyalarını alın veya Documentize‘yi doğrudan çalışma alanınıza eklemek için paketi NuGet’ten alın.

  • Desteklenen işletim sistemleri arasında Windows 7-11, ve Windows Server 2003-2022, macOS (10.12+) ve Linux bulunmaktadır.
  • Desteklenen çerçeveler 4.0 ile 7.0 arasında değişmektedir.
  • Çeşitli Microsoft Visual Studio sürümleriyle uyumludur


Birden fazla PDF’den Metin Nasıl Çıkarılır

  • Referans Belgesi .NET’i projenize dahil edin
  • Lisans anahtarlarınızı ayarlayın.
  • TextExtractorveTextExtractorOptions` örnekleri oluşturun.
  • Giriş PDF belgelerini TextExtractorOptions.AddDataSource kullanarak ekleyin
  • TextExtractorOptionsörneği olarakTextExtractor.Process` çağırın
  • Sonucu ResultContainer örneğine alın.
  • ResultContainer.ResultCollection` kullanarak çıkarılan metne erişin

Metin Çıkartıcısının İşletme Modları

  • Pure` seçeneği, farklı biçimlendirme prosedürleriyle birlikte metin çıkarma işlemini mümkün kılar. Metni sayfa genişliğine hizalamak için ekstra boşluklar eklerken, metnin göreli konumlarını da içerir.
  • Ham` modu, herhangi bir biçimlendirme uygulamadan PDF dosyasından metin çıkarır.
  • Düz` modu, PDF dosyasından metni çıkarır ve metin parçalarının göreli konumunu dikkate alır, ancak “Saf” modun aksine, ekstra boşluk eklemez.

Sıkça Sorulan Sorular

Documentize Text Extractor for .NET ne yapar?

Documentize Metin Çıkarıcı, .NET uygulamaları için tasarlanmış bir eklentidir ve PDF belgelerinden metin çıkarımı için üç işlem modu sunar: Saf, Ham ve Düz. Varsayılan olarak ‘Ham’ modunda çalışır, çok çeşitli giriş ve çıkış seçeneklerini destekler, birden fazla PDF dosyasının aynı anda işlenmesine olanak tanır ve geliştiricilere özelleştirme imkanı sunarak .NET ortamlarında metin çıkarımı için pratik bir çözüm sağlar.

Documentize for .NET ve Documentize Text Extractor for .NET arasındaki fark nedir?

Documentize for .NET, belge oluşturma, sıkıştırma, tablo oluşturma gibi geniş bir PDF görev yelpazesi için sağlam bir .NET API’sidir ve PDF verilerini içe aktarma ve dışa aktarma gibi gelişmiş özellikler de sunar. Öte yandan, Documentize Text Extractor for .NET, yalnızca PDF belgelerinden metin çıkarmaya odaklanmış özel bir eklentidir ve metin çıkarma yeteneklerine vurgu yapmaktadır.

Documentize Metin Çıkarıcı, yalnızca PDF’den metin çıkarmakla mı sınırlıdır?

Evet, PDF Metin Çıkartıcı .NET için özellikle PDF’den metin çıkartmak amacıyla tasarlanmıştır. Diğer işlemler için farklı PDF eklentilerini veya Documentize kütüphanesinin tam yeteneklerini kullanabilirsiniz.

Documentize, PDF Metin Çıkartma için çevrimiçi bir araç sunuyor mu?

Evet, Documentize temel ihtiyaçlar için bir ücretsiz çevrimiçi PDF Metin Ayrıştırma aracı sağlar.

Documentize Metin Çıkartma örneklerini C#’ta nerede bulabilirim?

PDF için .NET PDF’den Metin Çıkarma Aşama Sayfalarımızı Keşfedin

 Türkçe