API for PDFNet SDK for Universal Windows Platform (UWP)

pdftron.PDF

Action Class

ActionEventArgs Class

ActionFormActionFlag Enumeration

ActionParameter Class

ActionType Enumeration

Annot Class

AnnotAnnotationState Enumeration

AnnotationOutputFlag Enumeration

AnnotBorderStyle Class

AnnotBorderStyleStyle Enumeration

AnnotEventType Enumeration

AnnotFlag Enumeration

AnnotType Enumeration

ColorSpaceType Enumeration

ContentReplacer Class

ConversionMonitor Class

Convert Class

CubicCurveBuilder Class

Date Class

Destination Class

DestinationFitType Enumeration

DiffOptions Class

DigitalSignatureField Class

DigitalSignatureFieldDocumentPermissions Enumeration

DigitalSignatureFieldFieldPermissions Enumeration

DigitalSignatureFieldIterator Class

DigitalSignatureFieldSubFilterType Enumeration

DisallowedChange Class

DisallowedChangeType Enumeration

DocumentConversion Class

DocumentConversionResult Enumeration

DocumentPreviewCache Class

DocumentPreviewCachePreviewResult Enumeration

DocumentPreviewCacheResponseDelgate Delegate

Element Class

ElementBuilder Class

ElementReader Class

ElementType Enumeration

ElementWriter Class

ElementWriterWriteMode Enumeration

EmbeddedTimestampVerificationResult Class

ExternalAnnotManager Class

ExternalAnnotManagerMode Enumeration

Field Class

FieldEventType Enumeration

FieldFlag Enumeration

FieldIterator Class

FieldTextJustification Enumeration

FieldType Enumeration

FileSpec Class

FlattenFlag Enumeration

FlattenThresholdFlag Enumeration

Font Class

FontCharCodeIterator Class

FontEncoding Enumeration

FontStandardType1Font Enumeration

FontType Enumeration

Function Class

FunctionType Enumeration

GeometryCollection Class

GeometryCollectionSnappingMode Enumeration

GSChangesIterator Class

GState Class

GStateBlendMode Enumeration

GStateGStateAttribute Enumeration

GStateLineCap Enumeration

GStateLineJoin Enumeration

GStateRenderingIntent Enumeration

GStateTextRenderingMode Enumeration

Highlights Class

HTTPRequestOptions Class

IAnnot Interface

IConversionOptions Interface

Image Class

ImageInputFilter Enumeration

InternalToolsLogBackend Enumeration

InternalToolsLogLevel Enumeration

IOptionsBase Interface

JobRequestResultState Enumeration

KeyStrokeActionResult Class

KeyStrokeEventData Class

MergeXFDFOptions Class

ModificationPermissionsStatus Enumeration

OCRModule Class

OfficeToPDFOptions Class

OnActionEventHandler Delegate

OnConversionEventHandler Delegate

OnDownloadEventHandler Delegate

OnLayoutChangedHandler Delegate

OnPageFlipFinishedEventHandler Delegate

OnPageNumberChangedEventHandler Delegate

OnRenderFinishedEventHandler Delegate

OnScaleEventHandler Delegate

OnSetDocEventHandler Delegate

OnSizeEventHandler Delegate

OnThumbnailGeneratedEventHandler Delegate

OnThumbnailRequestCompletedEventHandler Delegate

OnViewChangedEventHandler Delegate

Optimizer Class

OptimizerImageSettings Class

OptimizerImageSettingsCompressionMode Enumeration

OptimizerImageSettingsDownsampleMode Enumeration

OptimizerMonoImageSettings Class

OptimizerMonoImageSettingsCompressionMode Enumeration

OptimizerMonoImageSettingsDownsampleMode Enumeration

OptimizerOptimizerSettings Class

OptimizerTextSettings Class

OptionsHelpers Class

Page Class

PageBox Enumeration

PageEventType Enumeration

PageIterator Class

PageLabel Class

PageLabelStyle Enumeration

PageRotate Enumeration

PageSet Class

PageSetFilter Enumeration

PathData Class

PathDataPathSegmentType Enumeration

PatternColor Class

PatternColorTilingType Enumeration

PatternColorType Enumeration

PDFDoc Class

PDFDocEventType Enumeration

PDFDocExtractFlag Enumeration

PDFDocGenerator Class

PDFDocInfo Class

PDFDocInsertFlag Enumeration

PDFDocViewPrefs Class

PDFDocViewPrefsPageLayout Enumeration

PDFDocViewPrefsPageMode Enumeration

PDFDocViewPrefsViewerPref Enumeration

PDFDraw Class

PDFNetInternalTools Class

PDFPrintManager Class

PDFPrintTask Class

PDFPrintTaskCompletion Enumeration

PDFRasterizer Class

PDFRasterizerColorPostProcessMode Enumeration

PDFRasterizerOverprintPreviewMode Enumeration

PDFRasterizerType Enumeration

PDFViewCtrl Class

PDFViewCtrlConversionType Enumeration

PDFViewCtrlDownloadedType Enumeration

PDFViewCtrlLinkInfo Class

PDFViewCtrlPagePresentationMode Enumeration

PDFViewCtrlPageViewMode Enumeration

PDFViewCtrlSelection Class

PDFViewCtrlThumbnailRequestHandler Class

Point Class

PrinterContentTypes Enumeration

PrinterModeDuplexMode Enumeration

PrinterModeNUp Enumeration

PrinterModeNUpPageOrder Enumeration

PrinterModeOrientation Enumeration

PrinterModeOutputColor Enumeration

PrinterModeOutputQuality Enumeration

PrinterModePaperSize Enumeration

PrinterModePrintContentTypes Enumeration

PrinterModeScaleType Enumeration

PrintRequestedEventHandler Delegate

RedactorAppearance Class

RedactorRedaction Class

Reflow Class

ReflowProcessor Class

ReflowProcessorResponseDelgate Delegate

RefreshOptions Class

ScaleType Enumeration

Separation Class

Shading Class

ShadingType Enumeration

ShapedText Class

ShapedTextFailureReason Enumeration

ShapingStatus Enumeration

SignaturesVerificationStatus Enumeration

Stamper Class

StamperHorizontalAlignment Enumeration

StamperSizeType Enumeration

StamperTextAlignment Enumeration

StamperVerticalAlignment Enumeration

SVGOutputOptions Class

TextDiffOptions Class

TextExtractor Class

TextExtractorCharRange Structure

TextExtractorLine Class

TextExtractorProcessingFlags Enumeration

TextExtractorStyle Class

TextExtractorWord Class

TextExtractorXMLOutputFlags Enumeration

TextRange Class

TextSearch Class

TextSearchResultCode Enumeration

TextSearchSearchMode Enumeration

TextSelectionMode Enumeration

TimestampingConfiguration Class

TimestampingResult Class

TrustVerificationResult Class

VerificationOptions Class

VerificationOptionsCertificateTrustFlag Enumeration

VerificationOptionsSecurityLevel Enumeration

VerificationOptionsTimeMode Enumeration

VerificationResult Class

VerificationResultDigestStatus Enumeration

VerificationResultDocumentStatus Enumeration

VerificationResultTrustStatus Enumeration

ViewChangeCollection Class

WebFontDownloader Class

WordToPDFOptions Class

XODOutputOptions Class

XPSOutputOptions Class

ZoomLimitMode Enumeration

TextExtractorProcessingFlags Enumeration

Processing options that can be passed in Begin() method to direct the flow of content recognition algorithms.

Namespace: pdftron.PDF
Assembly: pdftron (in pdftron.dll) Version: 255.255.255.255

Syntax

C++

JavaScript

Copy

public enum TextExtractorProcessingFlags

Public Enumeration TextExtractorProcessingFlags

public enum class TextExtractorProcessingFlags

pdftron.PDF.TextExtractorProcessingFlags = function();
pdftron.PDF.TextExtractorProcessingFlags.createEnum('pdftron.PDF.TextExtractorProcessingFlags', false);

Members

Member name	Value	Description
e_none	0
e_no_ligature_exp	1	Disables expanding of ligatures using a predefined mapping. Default ligatures are: fi, ff, fl, ffi, ffl, ch, cl, ct, ll, ss, fs, st, oe, OE.
e_no_dup_remove	2	Disables removing duplicated text that is frequently used to achieve visual effects of drop shadow and fake bold.
e_punct_break	4	Treat punctuation (e.g. full stop, comma, semicolon, etc.) as word break Characters.
e_remove_hidden_text	8	Enables removal of text that is obscured by images or rectangles. Since this option has small performance penalty on performance of text extraction, by default it is not enabled.
e_no_invisible_text	16	Enables removing text that uses rendering mode 3 (i.e. invisible text). Invisible text is usually used in 'PDF Searchable Images' (i.e. scanned pages with a corresponding OCR text). As a result, invisible text will be extracted by default.
e_no_watermarks	128	Enables removal of text that is marked as part of a Watermark layer
e_extract_using_zorder	256	Use Z-order as reading order for text

Reference

pdftron.PDF Namespace