Seitenrahmen finden: Unterschied zwischen den Versionen

Aus Helper
Zur Navigation springen Zur Suche springen
 
(10 dazwischenliegende Versionen von 2 Benutzern werden nicht angezeigt)
Zeile 45: Zeile 45:


  Rahmenname - Die Bezeichnung für den Seitenrahmen
  Rahmenname - Die Bezeichnung für den Seitenrahmen
Reduzierte JPG-Dateien erstellen in Qualität XX Prozent


Zudem können Thumbnails erstellt werden mit der Option 'Reduzierte JPG-Dateien erstellen'. Diese Thumbnails werden in den Hilfsdatenordner gelegt. Die Originale werden nicht verändert.


==Befehle einrichten==
==Befehle einrichten==
Zeile 77: Zeile 79:
===Drehung finden aus Bild===
===Drehung finden aus Bild===


Ermittelt den Drehwinkel von nicht horizontal ausgerichtetem Text und speichert diesen.
Ermittelt den Drehwinkel eines Bildes und speichert diesen. Aus der Dokumentation ist leider nicht ersichtlich welcher Algorithmus dem zu Grunde liegt.


  MaxSuchwinkel - Alles darüber wird nicht berücksichtig
  Max Suchwinkel - Setzen Sie zB auf 10, dann werden Winkel bis +-10° gesucht. Ein Wert unter 15 wird empfohlen.
  Min Suchwinkel - Alles darunter wird nicht berücksichtigt
  Min Suchwinkel - Bestimmt den kleinsten Winkel der gefunden wird. 0.25 wird empfohlen. Grössere Werte haben schnellere Ergebnisse zur Folge.
  Optimistisch - Sollte gesetzt werden, wenn alle Bilder schrägen Text enthalten.
  Optimistisch - Sollte gesetzt werden, wenn Sie sicher sind, dass alle Bilder schrägen Text enthalten.
  Rotationsart - Standard = Bildgrösse beibehalten. Optional = Bild vergrössern. Sollte nur angewendet werden wenn,
  Rotationsart - Standard = Bildgrösse beibehalten. Optional = Bild vergrössern. Sollte nur angewendet werden wenn,
  Füllfarbe - Farbe mit welchen die entstehenden Spickel oder zusätzliche Bildbereiche gefüllt werden sollen. Sollte der Hintergrundsfarbe der Bilder entsprechen. Standard = Schwarz.
  Füllfarbe - Farbe mit welchen die entstehenden Spickel oder zusätzliche Bildbereiche gefüllt werden sollen. Sollte der Hintergrundsfarbe der Bilder entsprechen. Standard = Schwarz.
Zeile 91: Zeile 93:
===Drehung finden aus OCR===
===Drehung finden aus OCR===


Ananlog zu Drehung finden aus Bild. Der Drehwinkel wird hier durch auswerten der OCR Daten ermittel.
Analog zu Drehung finden aus Bild. Der Drehwinkel wird hier durch Auswerten der OCR Daten ermittelt: Es wird der Winkel des breitesten Textblocks genommen.


[[Datei: DrehungOCR_71.png]]
[[Datei: DrehungOCR_71.png]]
Zeile 114: Zeile 116:
Hauptfunktion des Schrittes, welcher damit die Koordinaten für die Seitenrahmen festlegt.
Hauptfunktion des Schrittes, welcher damit die Koordinaten für die Seitenrahmen festlegt.


Sucht nach Seitenränder, z.B. um weisse oder schwarze Bereiche rund um Text zu entfernen. Funktioniert nur mit vernünftigen Bildeingaben!
Sucht nach Seitenränder, z.B. um weisse oder schwarze Bereiche rund um Text zu entfernen.


  Referenzrand - Referenzpunkt auf dem Bild, welcher aus Ausgangslage für das finden von Rändern genommen werden soll. Bei zuvor geteilten Bildern sind ggf. die erweiterten, kombinierten Referenzen zu verwenden.  
  Referenzrand - Referenzpunkt auf dem Bild, welcher aus Ausgangslage für das finden von Rändern genommen werden soll. Bei zuvor geteilten Bildern sind ggf. die erweiterten, kombinierten Referenzen zu verwenden.  
Zeile 121: Zeile 123:
  Rahmenfarbe - Farbe mit welcher der ermittelte Seitenrahmen später dargestellt wird.
  Rahmenfarbe - Farbe mit welcher der ermittelte Seitenrahmen später dargestellt wird.


====Ranzugabe====
====Randzugabe====


Falls beim Befehl Region of Interest die ermittelten Ränder nicht exakt genug sind, kann zu diesen zusätzlicher Rand angefügt werden. Die Randermittlung wird damit um diesen Bereich erweitert.
Falls beim Befehl Region of Interest die ermittelten Ränder nicht exakt genug sind, kann zu diesen zusätzlicher Rand angefügt werden. Die Randermittlung wird damit um diesen Bereich erweitert.
Zeile 134: Zeile 136:
===Leere Seiten finden===
===Leere Seiten finden===


Versucht zu erkennen, ob eine Seite Inhalt halt. Speichert das Ergebniss beim zugehörigen Seitenrahmen. Ermöglicht das voraus bestimmen von leeren Seiten.
Versucht zu erkennen, ob eine Seite Inhalt hat. Speichert das Ergebniss beim zugehörigen Seitenrahmen. Ermöglicht das voraus bestimmen von leeren Seiten.
   
   
  Links / Rechts ist leer - Markiert die ausgewählten Seiten alle als leere Seiten.
  Links / Rechts ist leer - Markiert die ausgewählten Seiten alle als leere Seiten.
Zeile 140: Zeile 142:
  Stanzung - Versucht Stanzungen zu erkennen und schliesst diese für die Ermittlung aus.
  Stanzung - Versucht Stanzungen zu erkennen und schliesst diese für die Ermittlung aus.
  Ränder -  Versucht Ränder zu erkennen und schliesst diese für die Ermittlung aus.
  Ränder -  Versucht Ränder zu erkennen und schliesst diese für die Ermittlung aus.
[[Datei: Leerseitenfinden_71.png]]


[[Datei: Leerseitenfinden_71.png]]
== Nur Thumbnails erstellen==
Mit diesem Schritt können Sie auch Thumbnails, also reduzierte Bilddateien erstellen. Diese Dateien werden werden im Hilfsdatenordner abgelegt. Sie können in einem folgenden Schritt, zB Metadaten erfassen, dann auf diese Thumbnails zugreifen, indem sie dort konfigurieren, dass der Schritt 'Daten aus dem Hilfsordner beziehen soll'.
Im Seitenrahmen-Finden-Schritt muss ein 'sinnloser' Befehl konfiguriert werden, damit Helper den Schritt als gültig zulässt. Geben Sie zB eine Kontrasterhöhung um 0 ein.
 
[[Kategorie:Workflowschritt]]

Aktuelle Version vom 3. März 2026, 14:30 Uhr

Mantiseinträge
 3256
Systemtyp
 71

Beschreibung

Siehe auch: Zusätzliche Worklfow Informationen

Ermöglicht die Ermittlung von Seitenrahmen, welche als Bild Regionen von Interesse zu verstehen sind. Ist eine Vorstufe für die Schritte "Seitenrahmen Kontrollieren" und "Bilderstellung aus Rahmen".

Nutzt dafür Funktionen aus den GDPicture Komponenten, welche ebenfalls über das Testfenster "Fenstername" zur Verfügung stehen.

Nebst dem erkennen von Seitenrahmen, stehen Befehle für die Ausrichtung der Bilder und für die Erkennung von Leerseiten bereit.

Merke: Der Befehl Doppelseite teilen darf nur einmal angewendet werden!

Vertikales teilen ist aktuell noch nicht implementiert.


HZ Versionen

HZ Version >= 2.00

Erlaubt die ermittlung einer Region Of Interest (ROI) und teilt die Seiten über diese Region und nicht zwingend über die Seitenhälfte

HZ Version = 1.00

Teilt Seiten über die halbierung der Seitenlänge.

Zugehörige Arbeitsschritte

Seitenrahmen kontrollieren

Bilderstellung aus Rahmen

Konfigurationsfenster

Grundeinstellungen

Die Seitenrahmen müssen einen Namen erhalten. Dieser wird in späteren Arbeitschritte zur Identifikation verwendet.

Rahmenname - Die Bezeichnung für den Seitenrahmen
Reduzierte JPG-Dateien erstellen in Qualität XX Prozent

Zudem können Thumbnails erstellt werden mit der Option 'Reduzierte JPG-Dateien erstellen'. Diese Thumbnails werden in den Hilfsdatenordner gelegt. Die Originale werden nicht verändert.

Befehle einrichten

Neue Befehle werden über die grüne + Taste rechts unter der Liste hinzugefügt, welche beim drücken ein Kontextmenu mit den verfügbaren Befehlen anzeigt.

Sind bereits Befehle in der Liste vorhanden, so wird ein neuer Befehl jeweils unter einem bereits markierten Befehl angefügt.

Über die rote Kreuz (X) Taste lässt sich ein Befehl, welcher dabei in der Befehlsliste ausgewählt sein muss, wieder entfernen.

Die Befehlsreihenfolge kann über die grünen Pfeiltasten geändert werden.

Das Markieren eines Befehls in der Liste lädt automatisch unter der Liste die zugehörigen Parameter.

Verfügbare Befehle

Region of interest

Ermittel einen Bildbereich von Interesse für die weitere Bearbeitung. Funktionalität ist analog wie der Befehl "Ränder finden", es wird jedoch kein Rahmen daraus erzeugt.

Der Befehl eignet sich z.B. um einen ersten groben Randbereich zu erkennen und diesen für die folgenden Befehle auszuschliessen.

Referenzrand - Referenzpunkt auf dem Bild, welcher aus Ausgangslage für das finden von Rändern genommen werden soll. 
Typ - Handelt es sich um ein Bild oder um ein TextDokument
Konfidenz - Schwellenwert 0-99 für die Erkennung. Standard = 75. Der geeignetste Wert sollte mit dem Testfenster zuvor approximiert werden!

Drehung finden aus Bild

Ermittelt den Drehwinkel eines Bildes und speichert diesen. Aus der Dokumentation ist leider nicht ersichtlich welcher Algorithmus dem zu Grunde liegt.

Max Suchwinkel - Setzen Sie zB auf 10, dann werden Winkel bis +-10° gesucht. Ein Wert unter 15 wird empfohlen.
Min Suchwinkel - Bestimmt den kleinsten Winkel der gefunden wird. 0.25 wird empfohlen. Grössere Werte haben schnellere Ergebnisse zur Folge.
Optimistisch - Sollte gesetzt werden, wenn Sie sicher sind, dass alle Bilder schrägen Text enthalten.
Rotationsart - Standard = Bildgrösse beibehalten. Optional = Bild vergrössern. Sollte nur angewendet werden wenn,
Füllfarbe - Farbe mit welchen die entstehenden Spickel oder zusätzliche Bildbereiche gefüllt werden sollen. Sollte der Hintergrundsfarbe der Bilder entsprechen. Standard = Schwarz.

Drehung finden aus OCR

Analog zu Drehung finden aus Bild. Der Drehwinkel wird hier durch Auswerten der OCR Daten ermittelt: Es wird der Winkel des breitesten Textblocks genommen.

Doppelseite teilen

Erstellt aus einer Seite zwei getrennte Seiten, z.B. um Bücher in linke und rechte Seite zu splitten. Dieser Befehl führt zu einer getrennten Anwendung aller Folgebefehle auf die jeweilige Seite.

Die Seiten werden nur im Speicher getrennt weiter bearbeitet. Dabei wird das Bild nicht beschnitten, sondern die wegzuschneidende Fläche wird farblich aufgefüllt.

Unterstützt aktuell nur das Vertikale teilen (Option: Typ)

Typ - Auf welcher Achse soll die Datei geteilt werden. Standard = Vertikal teilen
Overlap - Anzahl Pixel um welche sich die Teilung überschneiden soll.
SuffixA - Suffix welcher der linke / obere Seitenrahmenname erhalten soll.
SuffixB - Suffix welcher der rechte / untere Seitenrahmenname erhalten soll.

Ränder finden

Hauptfunktion des Schrittes, welcher damit die Koordinaten für die Seitenrahmen festlegt.

Sucht nach Seitenränder, z.B. um weisse oder schwarze Bereiche rund um Text zu entfernen.

Referenzrand - Referenzpunkt auf dem Bild, welcher aus Ausgangslage für das finden von Rändern genommen werden soll. Bei zuvor geteilten Bildern sind ggf. die erweiterten, kombinierten Referenzen zu verwenden. 
Typ - Handelt es sich um ein Bild oder um ein TextDokument
Konfidenz - Schwellenwert 0-99 für die Erkennung. Standard = 75. Der geeignetste Wert sollte mit dem Testfenster zuvor approximiert werden!
Rahmenfarbe - Farbe mit welcher der ermittelte Seitenrahmen später dargestellt wird.

Randzugabe

Falls beim Befehl Region of Interest die ermittelten Ränder nicht exakt genug sind, kann zu diesen zusätzlicher Rand angefügt werden. Die Randermittlung wird damit um diesen Bereich erweitert.

Oben / Links / Rechts / Unten - Randbereiche


Leere Seiten finden

Versucht zu erkennen, ob eine Seite Inhalt hat. Speichert das Ergebniss beim zugehörigen Seitenrahmen. Ermöglicht das voraus bestimmen von leeren Seiten.

Links / Rechts ist leer - Markiert die ausgewählten Seiten alle als leere Seiten.
Konfidenz - Schwellenwert für die Unterscheidung. Der Wert sollte mit dem Testfenster auf dem Ausgangsmaterial ermittelt werden!
Stanzung - Versucht Stanzungen zu erkennen und schliesst diese für die Ermittlung aus.
Ränder -  Versucht Ränder zu erkennen und schliesst diese für die Ermittlung aus.

Nur Thumbnails erstellen

Mit diesem Schritt können Sie auch Thumbnails, also reduzierte Bilddateien erstellen. Diese Dateien werden werden im Hilfsdatenordner abgelegt. Sie können in einem folgenden Schritt, zB Metadaten erfassen, dann auf diese Thumbnails zugreifen, indem sie dort konfigurieren, dass der Schritt 'Daten aus dem Hilfsordner beziehen soll'. Im Seitenrahmen-Finden-Schritt muss ein 'sinnloser' Befehl konfiguriert werden, damit Helper den Schritt als gültig zulässt. Geben Sie zB eine Kontrasterhöhung um 0 ein.