Bezeichnung
pdf.GetText -- ruft den Text auf der Seite ab (V1.1)
Übersicht
t$ = pdf.GetText(id, page, idx, len)
Beschreibung
Dieser Befehl kann verwendet werden, um den Text zu extrahieren, der bei dem von idx angegebenen Index beginnt und sich über die Anzahl der Zeichen einer Seite erstreckt. Beachten Sie, dass Zeichenindizes bei 0 beginnen, wenn Sie -1 in len übergeben, extrahiert pdf.GetText() automatisch alle verbleibenden Zeichen nach dem angegebenen Index.

Im Argument page geben Sie die zu verwendende Seite als Zahl an, die im Bereich von 1 bis zur Gesamtzahl der Seiten im Dokument liegen muss. Die Seite muss vorher mit pdf.LoadPage() mit dem Argument text auf True geladen und das durch id angegebene PDF-Dokument muss zuvor mit pdf.OpenDocument() geöffnet worden sein.

Eingaben
id
Kennung des zu verwendenden PDF-Dokuments
page
zu verwendende Seitenzahl (beginnend ab 1)
idx
zu verwendender Zeichenindex (beginnend mit 0)
len
Anzahl der zu verwendenden Zeichen oder -1 für alle übrigen Zeichen
Rückgabewerte
t$
Text, der extrahiert wurde

Navigation zeigen