Workflow: Ähnlicheitsanalyse

Auf dieser Hilfeseite wird der Workflow "Ähnlichkeitsanalyse" erklärt.

workflows

Der Workflow Ähnlicheitsanalyse wird genutzt, um die Metadaten und den Textinhalt von Objekten zu vergleichen.

Inhalt dieses Topics

Grundlagen

Im Workflow Ähnlichkeitsanalyse vergleicht plusmeta die Metadaten und den Textinhalt von Objekten. Er kann für HTML- oder PDF-Dateien genutzt werden.

Workflow-Schritte

Der Workflow besteht aus den folgenden Schritten:

  1. Inhalte hinzufügen
  2. Ähnlichkeiten analysieren
  3. Daten bereinigen

Schritt 1: Inhalte hinzufügen

  1. Neues Projekt auf Basis des Workflows Ähnlichkeitsanalyse erstellen.
  2. Objekte (PDFs oder HTML-Dateien) über Drag & Drop oder über die Hinzufügen-Schaltfläche zum Projekt hinzufügen. Es ist auch möglich, Objekte aus einem vorhandenen Projekt zum Projekt hinzuzufügen.
  3. Auf den blauen Pfeil klicken, um weiter in den nächsten Workflow-Schritt zu gelangen.

Schritt 2: Ähnlichkeiten analysieren

In diesem Schritt werden die Objekte von plusmeta analysiert.

Info: Es ist kein Eingriff des Nutzers notwendig.

Auf den blauen Pfeil klicken, um weiter in den nächsten Workflow-Schritt zu gelangen.

Ansicht
Ähnlichkeiten wurden analysiert.

Schritt 3: Daten bereinigen

In diesem Schritt werden die Ergebnisse der Ähnlichkeitsanalyse angezeigt.

Ansicht
Ergebnisse der Ähnlichkeitsanalyse.
  • Grenzwert für Ähnlichkeit: Über den Schieberegler kann der Wert an Ähnlichkeit bestimmt werden, ab dem die gebildeten Vergleichspaare als Variante gelten. Nur Vergleichspaare über dem Grenzwert werden in der Liste der Vergleichspaare angezeigt.
  • Quote: Im blauen Feld wird die Quote angezeigt. Die Quote gibt an, für wie viele Objekte eine Ähnlichkeit über dem Grenzwert erkannt wurde.
  • Anzahl der Varianten: Im gelben Feld ist sichtbar, wie viele Varianten, also ähnliche Dokumente bzw. Topics identifiziert wurden.
  • Anzahl der Duplikate: Im roten Feld wird angezeigt, wie viele identische Objekte sich in den Inhalten befinden.
  • Ähnlichkeits-Graph: Die Varianten zwischen den Objekten werden graphisch visualisiert.

Im unteren Bereich der Daten bereinigen-Ansicht können die betroffenen Objekte verglichen, mit Metadaten versehen und abgenommen werden.

  1. Auf ein Objekt klicken, um die Vergleichsansicht zu öffnen. Hier kann der Inhalt der Objekte verglichen werden. Unterschiede werden im Text farblich markiert. Unter der Vergleichsansicht sind die jeweiligen Metadaten der beiden Objekte zu sehen. Rechts neben der Vergleichsansicht befinden sich die Ähnlichkeitsanalyse-Metadaten.
  2. Auf den beigen Kreis neben dem Objekt-Titel klicken, um das Vergleichspaar abzunehmen.
Ansicht
Ergebnisse der Ähnlichkeitsanalyse.

Metadaten in der Ähnlichkeitsanalyse nutzen

Damit Metadaten in der Ähnlichkeitsanalyse angezeigt werden müssen sie zur Gruppe Ähnlichkeitsanalyse-Metadaten hinzugefügt werden.

  1. In die Eigenschaften-Ansicht wechseln.
  2. Metadatum auswählen, das in der Vergleichsansicht vergeben werden soll.
  3. Die Schaltfläche anklicken, um den Eigenschaft bearbeiten-Dialog zu öffnen.
    Der Dialog Eigenschaft bearbeiten öffnet sich
  4. Den Bereich Beziehungen öffnen.
  5. Auf die die Hinzufügen-Schaltfläche klicken.
  6. In das Feld Beziehung klicken und aus dem Drop-Down-Menü die Beziehung ist Teil von Metadaten-Gruppe auswählen.
  7. In das Feld Ziel der Beziehung klicken und aus dem Drop-Down-Menü die Metadaten-Gruppe Ähnlichkeitsanalyse-Metadaten auswählen. Das Metadatum ist nun Teil der Gruppe Ähnlichkeitsanalyse-Metadaten und wird in der Vergleichsansicht angezeigt.

Einstellungen der Daten bereinigen-Ansicht

Folgende Einstellungen sind in der Daten bereinigen-Ansicht verfügbar:

Ansicht
Einstellungs-Zahnrad in der Daten bereinigen-Ansicht.
  • Visualisierung: Ist dieser Schalter aktiviert, wird der Ähnlichkeits-Graph angezeigt. Ist dieser Schalter deaktiviert, wird der Ähnlichkeitsgraph nicht mehr angezeigt.
  • Strukturvergleich: Ist dieser Schalter aktiviert, wird die gesamte Struktur des Objekte verglichen. Ist dieser Schalter nicht aktiviert, kann zwischen 3 Diffing-Modi unterschieden werden:
    • Zeichen: Hier werden die Inhalte auf Zeichenebene miteinander verglichen.
    • Wörter: Hier werden die Inhalte auf Wortebene miteinander verglichen.
    • Sätze: Hier werden die Inhalte auf Satzebene miteinander verglichen.
  • Ähnlichkeiten exportieren (CSV): Ähnlichkeiten können als CSV-Datei exportiert werden.
  • Ähnlichkeiten exportieren (JSON): Ähnlichkeiten können als JSON-Datei exportiert werden.
  • Grenzwert zurücksetzten: Hier kann der Grenzwert für die Ähnlichkeit wieder zurückgesetzt werden, wenn er zuvor über den Schieberegler angepasst wurde.

Workflow: Upload zu SAP BNAC
Workflowschritt: Metadaten prüfen und vergeben
Erste Schritte
Grundlagen
Aufbau
Workflows & Projekte
Metadaten prüfen und vergeben
Erweitert