Indexierungs-Jobs

smart.finder SDI ist auf die Indexierung von ISO Metadaten ausgelegt. Der iso Core erwartet ausschließlich Metadaten, die gemäß ISO-19139 kodiert vorliegen.

Die Titel der Indexierungs-Jobs werden in der Ergebnisliste als Facetten-/Filterwerte in dem Facetten-Katalog aufgelistet. Beachten Sie dies bei der Namensgebung.

Damit ISO Metadaten in den Index gelangen, müssen die Quellen dieser Metadatendokumente im Job-Manager konfiguriert werden. Dies kann z.B. über den Menüpunkt Indexierungs-Job in der App full-page-sdi erfolgen. Alternativ können Sie direkt die URL /sfsdi-extension/resources/apps/management/index.html aufrufen.

Sie müssen angemeldeter Administrator sein, um den Job-Manger nutzen zu können.

Über den "Erstellen"-Button oben links können neue Indexierungs-Jobs eingerichtet werden. Für smart.finder SDI werden die folgenden Optionen unterstützt: Datenimport, OGC CSW Katalog und Verzeichnis und URL.

Datenimport

Diese Option richtet einen Data Import Handler ein, der die in der lokalen Datenbank gespeicherten Metadaten indexiert. Die Einrichtung ist zweigeteilt: erst muss eine Konfigurationsdatei eingerichtet und dann ein Indexierungs-Job über die Oberfläche erstellt werden.

Einrichtung der Konfigurationsdatei

  1. Öffnen Sie die Konfigurationsdatei des verwendeten Data Import Handlers. Die Datei finden Sie unter:

    [SOLR_HOME]/iso/conf/dih-[DB_NAME].xml
    SOLR_HOME

    Stammverzeichnis des Index.

    Standardwert: /smartfinder-search/WEB-INF/solr.home

    DB_NAME

    entspricht der von Ihnen eingesetzten Datenbank.

  2. Passen Sie den Eintrag <dataSource> in der XML-Datei an:

    <dataSource
        name="db"
        driver="<Set JDBC driver here>"
        url="<Set JDBC URL here>"
        user="<Set JDBC user name here>"
        password="<Set JDBC password here>"
    />
    Datenbank JDBC Treiber JDBC Verbindungs-URL (Beispiele)

    Postgres

    org.postgresql.Driver

    jdbc:postgresql://localhost:5432/sfsdi

    MS SQL Server

    com.microsoft.sqlserver.jdbc.SQLServerDriver

    jdbc:sqlserver://localhost:1433;DATABASENAME=sfsdi

    Oracle

    oracle.jdbc.driver.OracleDriver

    jdbc:oracle:thin:@localhost:1521/sfsdi

    driver

    JDBC Treibername. Der Wert ist vom verwendeten Datenbanksystem abhängig, vgl. Tabelle

    url

    JDBC Datenbankverbindungs-URL. Dieser Wert ist vom verwendeten Datenbanksystem abhängig, vgl. Tabelle

    user

    Nutzername des Datenbanknutzers.

    password

    Passwort des Datenbanknutzers.

  3. Speichern Sie die Anpassungen.

Anlegen des Indexierungs-Jobs

Zur Einrichtung der Datenbankindexierung, wählen Sie die Option Datenimport. Geben Sie anschließend folgende Werte an:

Titel

Bezeichnung des Data Import Handler Jobs. Dieser ist frei zu vergeben. Beachten Sie aber, dass der Name in Suchergebnissen als Facettenwert verwendet wird.

Name des Index

Wählen Sie iso

Konfigurationsdatei

Wählen Sie hier die Datei aus der Liste, die sie im vorherigen Schritt konfiguriert haben:

  • dih-oracle-mssql.xml für Oracle und MS SQL Server

  • dih-postresql.xml für PostgreSQL

Art des Imports

Wählen Sie komplett

Statusnachricht senden an (optional)

Geben Sie einen oder mehrere E-Mail-Adressen an, an die Benachrichtigungen bei Änderungen des Job-Status gesendet werden sollen.

Scheduling (optional)

Geben Sie mittels Cron-Job an, in welchem Turnus die Datenbank indexiert werden soll.

Wir empfehlen eine Indexierung in kurzen Zeitintervallen, um neu erfasste Metadaten schnell auffindbar zu machen.

OGC CSW Katalog

Um ISO Metadaten zu indexieren, die über eine OGC CSW 2.0.2 Schnittstelle zugreifbar sind, wählen Sie die Option OGC CSW Katalog. Geben Sie anschließend folgende Werte an:

Titel

Bezeichnung des Jobs, welche als Filterwert in dem Facetten-Katalog angezeigt wird.

URL

HTTP POST Endpunkt der GetRecords-Schnittstelle des Katalogs.

Verteilte Kataloge indexieren

Aktiviert die zusätzliche Indexierung der ISO Metadaten, welche durch den o.g. Katalog im Rahmen einer verteilten Suche zugreifbar sind.

Suchtiefe

Definiert die Suchtiefe für die verteilten Kataloge (der sogenannte hopCount).

Statusnachricht senden an (optional)

Geben Sie einen oder mehrere E-Mail-Adressen an, an die Benachrichtigungen bei Änderungen des Job-Status gesendet werden sollen.

Scheduling (optional)

Geben Sie mittels Cron-Job an, in welchem Turnus die Datenbank indexiert werden soll.

Nur relevant, wenn die Option Verteilte Kataloge indexieren aktiv ist.

Beispiel

Mit diesen Einstellungen wird in dem Job der angegebene Katalog des con terra Demo Portals sowie alle angeschlossenen Kataloge bis zu einer Suchtiefe von 2 indexiert.

Titel:      CSW Demo Portal con terra
URL:        http://services.example.com/soapServices/CSWStartup
Verteilte Kataloge indexieren: Ja
Suchtiefe:  2

Verzeichnis

Um ISO Metadaten zu indexieren, die in einem lokalen Verzeichnis gespeichert sind, wählen Sie die Option Verzeichnis. Geben Sie folgende Werte an:

Titel

Bezeichnung des Jobs, welche als Filterwert in dem Facetten-Katalog angezeigt wird.

Verzeichnis

Basis-Verzeichnis, welches durchsucht werden soll.

Verzeichnistiefe

Basis durchsucht nur das Wurzelverzeichnis.
Direkt durchsucht das Wurzelverzeichnis sowie die direkten Unterverzeichnisse.
Alle durchsucht das Wurzelverzeichnis sowie alle Unterverzeichnisse.

Dateitypen

Geben Sie *.{xml} an, damit nur ISO Dokumente mit der Endung .xml indexiert werden.
Dieser wird mithilfe des glob Pattern beschrieben.

Statusnachricht senden an (optional)

Geben Sie einen oder mehrere E-Mail-Adressen an, an die Benachrichtigungen bei Änderungen des Job-Status gesendet werden sollen.+

Scheduling (optional)

Geben Sie mittels Cron-Job an, in welchem Turnus die Datenbank indexiert werden soll.

URL

Wählen Sie diesen Typ, wenn Sie ISO Dokumente indexieren möchten, die in eine Web Accessible Folder (WAF) zur Verfügung gestellt werden.

Titel

Bezeichnung des Jobs.

URL

URL auf den Web Accessible Folder

Filter

Geben Sie hier den regulären Ausdruck .*(\\.(xml))$ damit nur ISO Dokumente mit der Endung .xml indexiert werden.

Suchtiefe

Angabe der maximalen Suchtiefe innerhalb der Seiten-Hierarchie

Statusnachricht senden an (optional)

Geben Sie einen oder mehrere E-Mail-Adressen an, an die Benachrichtigungen bei Änderungen des Job-Status gesendet werden sollen.

Scheduling (optional)

Geben Sie mittels Cron-Job an, in welchem Turnus die Datenbank indexiert werden soll.