Untergeordnete Seiten
  • Dauerhafte Verankerung von Annotationen mit jadice server
Zum Ende der Metadaten springen
Zum Anfang der Metadaten

Dauerhafte Verankerung von Annotationen (jadice server 5)

Um Dokumente und deren Annotationen mit Standardprogrammen anzeigen zu können, müssen diese als "normale" Objekte im Ausgangsformat verankert werden.
Dies kann mit jadice server 5 über den ReshapeNode realisiert werden. Die notwendige Assoziation zwischen dem Dokument- und den Annotationsdatenströmen zeigt das folgende Beispiel:

Dauerhafte Verankerung von Annotationen

In dieser Konfiguration sind zwei Einstellungen besonders relevant:
Dokument- und Annotationsdatenströme müssen über die StreamDescriptor-Hierarchie miteinander verknüpft werden. Dazu muss der StreamDescriptor des Dokuments als Parent der StreamDescriptoren der Annotationen gesetzt werden.
Für die verfügbaren MIME-Types von Annotationen gibt es in der Klasse ReshapeNode als vordefinierte Konstanten, die zwingend gesetzt werden müssen. Weitere Informationen über die Annotationsformate und deren Eigenschaften können Sie dem Annotationshandbuch der jadice document platform entnehmen.

Hinweis zu jadice server 4

Icon

Der hier beschriebene Workflow kann auch mit jadice server 4 verwendet werden. Hierzu ist die Klasse ReshapeNode durch JadiceShaperNode zu ersetzen. Nicht-sichtbare Informationen entfallen jedoch, vgl. folgender Abschnitt.

 

Beibehalten von nicht-sichtbaren Informationen des Ursprungsdokuments (jadice server 4)

Hinweis zu jadice server 5

Icon

Werden PDF-Dokument- und Annotationsdatenströme über den ReshapeNode von jadice server 5 in einem Dokument verankert, so werden nicht-sichtbare Inhalte in Zieldokument beibehalten.
Der hier beschriebene Workflow ist somit nicht notwendig.

Oft ist es beim Verarbeiten von PDF-Dokumenten wünschenswert, dass diese auch Inhalte, die nicht sichtbar sind, beibehalten. Dies können z.B. OCR-Informationen sein. Bei obigen Ansatz über die Verarbeitung des JadiceShaperNodes von jadice server 4 werden diese jedoch verworfen, da das komplette Dokument neu gerendert wird.

Um dies zu vermeiden, werden die Annotationen zunächst mit dem JadiceShaperNode über das PDF gerendert. Für die korrekte Positionierung wird das PDF zwar dem JadiceShaperNode übergeben, aber das Rendering mit der Methode shaperNode.getSettings(BaseShaperSettings.class).setStreamRenderingEnabled(...) deaktiviert. Binden Sie dazu die Datei shaper-base-4.4.x.y.jar aus dem Verzeichnis <jadice-server>/server-lib in den Klassenpfad Ihrer Clientanwendung ein.

Anschließend wird das Original-PDF und die als PDF gerenderten Annotationen dem PDFCompositeNode übergeben.

 

Da der dazu notwendige Workflow umfangreicher ist, hier eine Skizze des Ablaufs:

Einbetten von Annotationen in PDF

Vertrauliche Dokumentinhalte

Icon

Bitte beachten Sie, dass in beiden Lösungsvarianten keine Analyse des Dokumentinhalts stattfindet. Inhalte, die von Annotationen verdeckt werden, können je nach Datenformat weiterhin im Zieldatenstrom vorhanden sein. Außerdem ist es möglich, dass unerwünschte (Meta-)Daten im Dokument verbleiben können, die einer Vertraulichkeit unterliegen.

2 Kommentare

  1. Jörg Henne sagt:

    Wir sollten hier darauf hinweisen, dass bei der Beibehaltung nicht-sichtbarer Informationen die Annotationen nicht zur Unterdrückung vertraulicher Informationen genutzt werden dürfen. Diese Informationen können dabei über diverse Kanäle (Alt-Texte, nicht-sichtbare Texte usw.) in das Zieldokument "lecken".

    1. Jörg Henne sagt:

      Stimmt. Mir ging es allerdings um den expliziten und deutlichen Hinweis auf das Vertraulichkeitsthema.