1. Produkter
  2.   Textutdragare

PDF Text Extractor för .NET

Extrahera ren, rå eller vanlig text från PDF-dokument med Documentize .NET Plugin

Textutdragare för .NET

Introducerar Documentize Text Extractor för .NET-plugin - ett kraftfullt verktyg som förenklar processen att extrahera text från dina PDF-dokument. Denna plugin är mer än bara en textextraktör - det är en omfattande lösning som förbättrar effektiviteten och mångsidigheten i din dokumenthanteringsprocess. Pluginet fungerar genom att skanna dina PDF-dokument och identifiera inbäddad text. Det extraherar sedan denna text samtidigt som den bevarar sin ursprungliga formatering och struktur. Denna process handlar helt om att förbättra tillgängligheten och användbarheten av ditt innehåll. En av de utmärkande funktionerna i denna plugin är dess förmåga att erbjuda tre driftslägen: ren, rå och vanlig. Det rena läget extraherar texten samtidigt som den behåller sin ursprungliga formatering. Det råa läget extraherar texten som den är, utan någon formatering. Det vanliga läget extraherar texten och tar bort eventuella specialtecken eller formatering. Dessa lägen ger flexibilitet och bekvämlighet för textextraktionsuppgifter i .NET-applikationer, vilket säkerställer att du kan välja det bästa läget som passar dina behov. Men fördelarna med den här pluginen sträcker sig bortom textextraktion. Den erbjuder även en smidig och effektiv extraktionsprocess, vilket minimerar den tid och det arbete som krävs för att extrahera text från din PDF. Med den här pluginen kan du uppleva bekvämligheten av snabba och enkla textextraktioner. Sammanfattningsvis är Documentize Text Extractor för .NET-pluginet en omfattande lösning som strömlinjeformar processen för att extrahera text från dina PDF-dokument, förbättrar tillgängligheten av ditt innehåll och effektiviserar din dokumenthanteringsprocess. Prova det nu och upplev bekvämligheten och effektiviteten med vårt plugin idag. Upptäck en ny nivå av effektivitet!

Hur man extraherar text från PDF via .NET

  • Referensdokumentera i ditt projekt
  • Ställ in dina licensnycklar
  • Skapa instanser av TextExtractorOptions.
  • Lägg till inmatnings-PDF-dokument med hjälp av TextExtractorOptions.AddDataSource
  • Anropa TextExtractorOptions.Process och tilldela resultatet till ResultContainer.
  • Kom åt den extraherade texten med hjälp av ResultContainer.ResultCollection

Kom igång med PDF Text Extractor

Få installationsfilerna från nedladdningarna eller hämta paketet från NuGet för att lägga till Documentize direkt i ditt arbetsutrymme.

  • Stödda operativsystem inkluderar Windows 7-11 och Windows Server 2003-2022, macOS (10.12+) och Linux
  • Stödda ramverk sträcker sig från 4.0 till 7.0.
  • Kompatibel med olika versioner av Microsoft Visual Studio


Hur man extraherar text från flera PDF-filer

  • Referensdokumentation för .NET i ditt projekt
  • Ställ in dina licensnycklar
  • Skapa instanser av TextExtractor och TextExtractorOptions.
  • Lägg till inmatnings-PDF-dokument med hjälp av TextExtractorOptions.AddDataSource
  • Anropa TextExtractor.Process med en instans av TextExtractorOptions som parameter
  • Få resultatet i en instans av ResultContainer.
  • Få åtkomst till extraherad text med ResultContainer.ResultCollection

Bildextraktorns Driftslägen

  • Alternativet Pure möjliggör textutvinning från en PDF-fil med olika formateringsprocedurer, införlivande av relativa positioner och in införande av ytterligare mellanslag för att justera texten till sidans bredd.
  • Raw`-läget extraherar text från PDF-filen utan att tillämpa någon formatering.
  • Plain`-läge extraherar text från PDF-filen, med hänsyn till den relativa positioneringen av textfragment, men till skillnad från “Pure”-läget lägger den inte till extra utrymme.

Vanliga Frågor

Vad gör Documentize Text Extractor för .NET?

Documentize Text Extractor för .NET är en plugin som är utformad för .NET-applikationer och erbjuder textutvinning från PDF-dokument med tre driftslägen: Pure, Raw och Plain. Den använder som standard ‘Raw’-läge, stödjer mångsidiga in- och utgångsalternativ, möjliggör samtidig behandling av flera PDF-filer och erbjuder anpassning för utvecklare, vilket gör det till en praktisk lösning för textutvinning inom .NET-miljöer.

Vad är skillnaden mellan Documentize för .NET och Documentize Text Extractor för .NET?

Documentize för .NET är ett robust .NET API för en mängd olika PDF-uppgifter, inklusive dokumentgenerering, komprimering, skapande av tabeller och avancerade funktioner som import och export av PDF-data. Å andra sidan är Documentize Text Extractor för .NET en specialiserad plugin som fokuserar enbart på att extrahera text från PDF-dokument, med betoning på textutvinningsmöjligheter.

Är Documentize Text Extractor för .NET begränsad till att bara extrahera text från PDF?

Ja, PDF Text Extractor för .NET är designad specifikt för att extrahera text från PDF. För andra operationer kan du använda andra PDF-plugin eller hela funktionerna i Documentize-biblioteket.

Erbjuder Documentize ett onlineverktyg för extrahering av PDF-text?

Ja, Documentize tillhandahåller ett gratis online PDF Text Parser-verktyg för grundläggande behov.

Var kan jag hitta exempel på Documentize Text Extraction i C#?

Upptäck våra landningssidor för Extrahera text från PDF för .NET

 Svenska