1. 제품
  2.   텍스트 추출기

NET용 PDF 텍스트 추출기

PDF 문서에서 순수하고 원시적인 또는 일반 텍스트를 추출하는 Documentize .NET 플러그인

NET용 텍스트 추출기

문서화 텍스트 추출기 for .NET 플러그인을 소개합니다 - PDF 문서에서 텍스트를 추출하는 프로세스를 단순화하는 강력한 도구입니다. 이 플러그인은 단순한 텍스트 추출기 그 이상입니다 - 문서 관리 프로세스의 효율성과 다재다능성을 향상시키는 종합 솔루션입니다. 플러그인은 PDF 문서를 스캔하고 포함된 텍스트를 식별하는 방식으로 작동합니다. 그런 다음 원래 형식과 구조를 유지하면서 이 텍스트를 추출합니다. 이 과정은 콘텐츠의 접근성과 사용성을 향상시키는 데 중점을 둡니다. 이 플러그인의 눈에 띄는 특징 중 하나는 세 가지 작업 모드를 제공할 수 있는 능력입니다: 순수, 원시 및 일반. 순수 모드는 원래의 형식을 유지하면서 텍스트를 추출합니다. 원시 모드는 텍스트를 형식 없이 있는 그대로 추출합니다. 일반 모드는 텍스트를 추출하면서 특수 문자나 형식을 제거합니다. 이러한 모드는 .NET 응용 프로그램에서 텍스트 추출 작업에 유연성 및 편리함을 제공하여, 필요에 맞는 최적의 모드를 선택할 수 있도록 합니다. 그러나 이 플러그인의 장점은 텍스트 추출을 넘어섭니다. 또한 원활하고 효율적인 추출 프로세스를 제공하여 PDF에서 텍스트를 추출하는 데 필요한 시간과 노력을 최소화합니다. 이 플러그인을 사용하면 빠르고 간편한 텍스트 추출의 편리함을 경험할 수 있습니다. 요약하자면, Documentize Text Extractor for .NET 플러그인은 PDF 문서에서 텍스트를 추출하는 과정을 간소화하고 콘텐츠의 접근성을 향상시키며 문서 관리 프로세스를 효율적으로 개선하는 종합적인 솔루션입니다. 지금 바로 사용해 보시고 우리의 플러그인으로 인한 편리함과 효율성을 경험해 보세요. 새로운 효율성의 차원을 발견하세요!

NET을 통해 PDF에서 텍스트 추출하는 방법

  • 프로젝트에 문서화 참조 추가
  • 라이센스 키를 설정하세요.
  • TextExtractorOptions`의 인스턴스를 생성합니다.
  • TextExtractorOptions.AddDataSource`를 사용하여 입력 PDF 문서를 추가합니다.
  • TextExtractorOptions.Process를 호출하고 결과를 ResultContainer`에 할당합니다.
  • ResultContainer.ResultCollection`을 사용하여 추출된 텍스트에 액세스하세요.

PDF 텍스트 추출기로 시작하기

다운로드에서 어셈블리 파일을 가져오거나 NuGet에서 패키지를 가져와 Documentize를 직접 작업 공간에 추가하세요.

  • Windows 7부터 11까지, 그리고 Windows Server 2003부터 2022까지, macOS (10.12 이상), 그리고 Linux을 지원합니다.
  • 지원되는 프레임워크는 4.0부터 7.0까지입니다.
  • 다양한 Microsoft Visual Studio 버전과 호환됩니다.


여러 개의 PDF에서 텍스트 추출하는 방법

  • NET에서 프로젝트에 대한 참조 문서화
  • 라이센스 키를 설정하세요.
  • TextExtractorTextExtractorOptions`의 인스턴스를 생성하세요.
  • TextExtractorOptions.AddDataSource`를 사용하여 입력 PDF 문서를 추가합니다.
  • TextExtractorOptions인스턴스를 매개변수로 사용하여TextExtractor.Process`를 호출하세요.
  • ResultContainer` 인스턴스에 결과를 얻으세요.
  • ResultContainer.ResultCollection`를 사용하여 추출된 텍스트에 액세스합니다.

텍스트 추출기의 작동 모드

  • Pure` 옵션은 PDF 파일에서 텍스트 추출을 활성화하며 다양한 형식 설정 절차를 포함하며 상대적 위치를 통합하고 텍스트를 페이지 너비에 맞게 정렬하기 위해 추가 공간을 도입합니다.
  • Raw` 모드는 어떠한 서식도 적용하지 않고 PDF 파일에서 텍스트를 추출합니다.
  • Plain` 모드는 PDF 파일에서 텍스트를 추출하며 텍스트 조각의 상대적 위치를 고려하지만, “Pure” 모드와 달리 추가 공간을 추가하지 않습니다.

자주 묻는 질문

Documentize Text Extractor for .NET은 무엇을 하나요?

Documentize Text Extractor for .NET는 .NET 애플리케이션을 위해 설계된 플러그인으로, PDF 문서에서 텍스트를 추출하는 세 가지 작동 모드인 Pure, Raw, 및 Plain을 제공합니다. 기본값으로 ‘Raw’ 모드를 사용하며, 다양한 입력 및 출력 옵션을 지원하고, 여러 PDF 파일을 동시에 처리할 수 있으며, 개발자를 위한 사용자 정의를 제공하여 .NET 환경 내에서 텍스트 추출을 위한 편리한 솔루션입니다.

Documentize for .NET과 Documentize Text Extractor for .NET의 차이점은 무엇인가요?

Documentize for .NET은 문서 생성, 압축, 테이블 생성 및 PDF 데이터의 가져오기 및 내보내기와 같은 고급 기능을 포함하여 다양한 PDF 작업을 위한 강력한 .NET API입니다. 반면, Documentize Text Extractor for .NET은 PDF 문서에서 텍스트 추출에만 집중하는 전문 플러그인으로, 텍스트 추출 기능을 강조합니다.

Documentize Text Extractor for .NET은 PDF에서만 텍스트를 추출하는데 제한되어 있습니까?

네, PDF Text Extractor for .NET은 PDF에서 텍스트를 추출하기 위해 특별히 설계되었습니다. 다른 작업에는 다른 PDF 플러그인이나 Documentize 라이브러리의 전체 기능을 사용할 수 있습니다.

Documentize가 PDF 텍스트 추출을 위한 온라인 도구를 제공하나요?

네, Documentize는 기본적인 요구를 위한 무료 온라인 PDF 텍스트 파서 도구를 제공합니다.

C#에서 Documentize 텍스트 추출 예제를 어디에서 찾을 수 있나요?

우리의 랜딩 페이지를 확인하세요 PDF에서 텍스트 추출하기 .NET

 한국어