Read-PdfXref #
Intern – Diese Funktion ist nicht exportiert und nur modulintern verfügbar.
ÜBERSICHT #
Parst die Xref-Tabelle(n) und -Streams einer PDF-Datei.
SYNTAX #
Read-PdfXref [-PdfText] <string> [-PdfBytes] <byte[]> [<CommonParameters>]
BESCHREIBUNG #
Liest die Cross-Reference-Struktur einer PDF-Datei und liefert einen Index aller Objekte als Hashtable. Unterstützt werden:
- Klassische Xref-Tabellen (Text-Format)
- XRef-Streams (komprimiertes Binärformat, PDF 1.5+)
- Hybrid-PDFs (klassisch + /XRefStm)
- Linearisierte PDFs (mehrere startxref, /Prev-Kette)
- Type-2-Einträge (Objekte in Object Streams)
PARAMETER #
-PdfText #
Type: string
Der PDF-Inhalt als ISO-8859-1 Text (Single-Byte = Position == Byte-Offset).
-PdfBytes #
Type: byte[]
Der PDF-Inhalt als Byte-Array (für Stream-Dekomprimierung).
AUSGABEN #
hashtable
Gibt eine Hashtable zurück: Key = [int]ObjektNummer, Value = PSCustomObject mit den Eigenschaften Type (1 oder 2), Offset (Byte-Position für Type-1), StreamObj (ObjStm-Nummer für Type-2), StreamIndex (Index im ObjStm für Type-2), Generation (Generationsnummer).
BEISPIELE #
$xref = Read-PdfXref -PdfText $pdfText -PdfBytes $pdfBytes
$xref[42].Offset # Byte-Offset von Objekt 42