PDF-Glossar: Extrahieren, Seitenbereich, Teilmenge, Seitenauswahl und Mehr
Definitionen wichtiger PDF-Begriffe rund um die Seitenextraktion: Extrahieren, Seitenbereich, Teilmenge, Seitenauswahl, Inhaltsstrom, gemeinsame Ressourcen, Berechtigungspasswort und WebAssembly.
- pdf extraktion glossar
- pdf seitenbereich definition
- pdf teilmenge bedeutung
- begriffe pdf seitenauswahl
- terminologie pdf extrahieren
- pdf me
Extrahieren
PDF-Seiten extrahieren bedeutet, eine oder mehrere Seiten aus einer vorhandenen PDF auszuwählen und sie in ein neues, separates Dokument zu kopieren. Die Originaldatei wird nicht verändert — das Ergebnis ist eine neue PDF, die nur die ausgewählten Seiten enthält. Extrahieren unterscheidet sich von Aufteilen (das alle Seiten auf mehrere Ausgabedateien verteilt) und von Löschen (das Seiten aus dem Original entfernt).
Seitenbereich
Ein Seitenbereich gibt einen zusammenhängenden Block von Seiten mit einer Startseite und einer Endseite an — zum Beispiel 'Seiten 5 bis 12' oder '5–12'. Die meisten Extraktionswerkzeuge akzeptieren Bereichsnotation in einem Texteingabefeld. Seitenbereiche sind der schnellste Weg, ein Kapitel, einen Abschnitt oder eine Gruppe aufeinanderfolgender Seiten aus einem langen Dokument zu extrahieren.
Seitenauswahl
Seitenauswahl bezeichnet den Akt, spezifische Seiten für eine Extraktionsoperation auszuwählen. Du kannst Seiten einzeln durch Klicken auf ihre Miniaturen in einer visuellen Vorschau auswählen, Seitenzahlen manuell eingeben oder Bereichsnotation mit individuellen Seitenzahlen kombinieren.
Teilmenge
Im Kontext der PDF-Extraktion ist eine Teilmenge die Gruppe von Seiten, die du aus dem vollständigen Dokument auswählst. Wenn eine PDF 100 Seiten hat und du die Seiten 10–20 sowie Seite 35 extrahierst, ist dein extrahiertes Dokument eine Teilmenge des Originals — es enthält 12 der 100 Seiten. Der Begriff wird auch in der PDF-Typografie verwendet, wo eine Schriftteilmenge nur die Zeichen einer Schriftart bezeichnet, die tatsächlich im Dokument verwendet werden.
Inhaltsstrom
Der Inhaltsstrom ist die Datenstruktur innerhalb einer PDF-Seite, die alle visuellen Elemente auf dieser Seite beschreibt: Textpositionierung, Schriftverweise, Bildplatzierungen, Vektorzeichenbefehle und Farbeinstellungen. Beim Extrahieren von Seiten kopiert das Werkzeug den Inhaltsstrom jeder ausgewählten Seite in das neue Dokument.
Seitenbaum
Der Seitenbaum ist der interne Index einer PDF-Datei, der die Reihenfolge der Seiten aufzeichnet und jede Seitenzahl ihrem Inhaltsstrom und den zugehörigen Ressourcen zuordnet. Beim Extrahieren von Seiten erstellt das Werkzeug einen neuen Seitenbaum für das extrahierte Dokument, der nur die ausgewählten Seiten enthält.
Gemeinsame Ressourcen
Gemeinsame Ressourcen sind Schriften, Bilder und Farbprofile, die einmal in eine PDF eingebettet und von mehreren Seiten referenziert werden. Beim Extrahieren einer Teilmenge von Seiten kann das extrahierte Dokument einige gemeinsame Ressourcen enthalten, die von nicht ausgewählten Seiten referenziert wurden — weil das Werkzeug alle Ressourcen einbeziehen muss, die die extrahierten Seiten für die korrekte Darstellung benötigen.
Berechtigungspasswort
Ein Berechtigungspasswort (auch Eigentümerpasswort oder Einschränkungspasswort genannt) ist eine Art PDF-Schutz, der den Benutzer nicht am Öffnen oder Lesen des Dokuments hindert, aber Vorgänge wie Bearbeitung, Druck, Kopieren und Seitenextraktion einschränkt. Wenn eine PDF ein Berechtigungspasswort hat, das die Inhaltsextraktion verhindert, schlägt ein Extraktionswerkzeug fehl, sofern die Einschränkung nicht zuerst entfernt wird.
WebAssembly (Wasm)
WebAssembly ist ein binäres Anweisungsformat, das es Code — einschließlich komplexer PDF-Verarbeitungsbibliotheken — ermöglicht, im Browser mit nahezu nativer Geschwindigkeit zu laufen. PDF ME verwendet WebAssembly, um die Seitenextraktion vollständig auf deinem Gerät zu verarbeiten, ohne deine Datei auf einen Server hochzuladen.
PDF Aufteilen vs PDF Extrahieren
Diese beiden Begriffe werden manchmal synonym verwendet, beschreiben aber verschiedene Vorgänge. Aufteilen verteilt alle Seiten einer PDF auf mehrere Ausgabedateien — jede Seite landet irgendwo. Extrahieren erstellt ein neues Dokument aus einer ausgewählten Teilmenge von Seiten und lässt das Original intakt. Verwende Extrahieren bei einer bestimmten Teilmenge; verwende Aufteilen, wenn du alle Seiten verteilen möchtest.
DPI (Punkte pro Zoll)
DPI misst die Auflösung von Rasterbildern, die in eine PDF eingebettet sind — höheres DPI bedeutet mehr Details und größere Dateigröße. Die PDF-Extraktion ändert das Bild-DPI nicht, da die Bilddaten direkt ohne Neukodierung kopiert werden. Wenn eine extrahierte Seite schlechter als erwartet aussieht, haben die Quellbilder wahrscheinlich von Anfang an ein niedriges DPI.