Read Pdf Xref
Zuletzt geändert: 14.03.2026 05:56

Read-PdfXref #

Intern – Diese Funktion ist nicht exportiert und nur modulintern verfügbar.

ÜBERSICHT #

Parst die Xref-Tabelle(n) und -Streams einer PDF-Datei.

SYNTAX #

Read-PdfXref [-PdfText] <string> [-PdfBytes] <byte[]> [<CommonParameters>]

BESCHREIBUNG #

Liest die Cross-Reference-Struktur einer PDF-Datei und liefert einen Index aller Objekte als Hashtable. Unterstützt werden:

  • Klassische Xref-Tabellen (Text-Format)
  • XRef-Streams (komprimiertes Binärformat, PDF 1.5+)
  • Hybrid-PDFs (klassisch + /XRefStm)
  • Linearisierte PDFs (mehrere startxref, /Prev-Kette)
  • Type-2-Einträge (Objekte in Object Streams)

PARAMETER #

-PdfText #

Type: string

Der PDF-Inhalt als ISO-8859-1 Text (Single-Byte = Position == Byte-Offset).

-PdfBytes #

Type: byte[]

Der PDF-Inhalt als Byte-Array (für Stream-Dekomprimierung).

AUSGABEN #

hashtable

Gibt eine Hashtable zurück: Key = [int]ObjektNummer, Value = PSCustomObject mit den Eigenschaften Type (1 oder 2), Offset (Byte-Position für Type-1), StreamObj (ObjStm-Nummer für Type-2), StreamIndex (Index im ObjStm für Type-2), Generation (Generationsnummer).

BEISPIELE #

$xref = Read-PdfXref -PdfText $pdfText -PdfBytes $pdfBytes
$xref[42].Offset  # Byte-Offset von Objekt 42