Indexierungs-Jobs
smart.finder SDI ist auf die Indexierung von ISO Metadaten ausgelegt.
Der iso
Core erwartet ausschließlich Metadaten, die gemäß ISO-19139 kodiert vorliegen.
Die Titel der Indexierungs-Jobs werden in der Ergebnisliste als Facetten-/Filterwerte in dem Facetten-Katalog aufgelistet. Beachten Sie dies bei der Namensgebung. |
Damit ISO Metadaten in den Index gelangen, müssen die Quellen dieser Metadatendokumente im Job-Manager konfiguriert werden.
Dies kann z.B. über den Menüpunkt Indexierungs-Job in der App full-page-sdi
erfolgen.
Alternativ können Sie direkt die URL /sfsdi-extension/resources/apps/management/index.html
aufrufen.
Sie müssen angemeldeter Administrator sein, um den Job-Manger nutzen zu können.
Über den "Erstellen"-Button oben links können neue Indexierungs-Jobs eingerichtet werden. Für smart.finder SDI werden die folgenden Optionen unterstützt: Datenimport, OGC CSW Katalog und Verzeichnis und URL.
Datenimport
Diese Option richtet einen Data Import Handler ein, der die in der lokalen Datenbank gespeicherten Metadaten indexiert. Die Einrichtung ist zweigeteilt: erst muss eine Konfigurationsdatei eingerichtet und dann ein Indexierungs-Job über die Oberfläche erstellt werden.
Einrichtung der Konfigurationsdatei
-
Öffnen Sie die Konfigurationsdatei des verwendeten Data Import Handlers. Die Datei finden Sie unter:
[SOLR_HOME]/iso/conf/dih-[DB_NAME].xml
SOLR_HOME
-
Stammverzeichnis des Index.
Standardwert:
/smartfinder-search/WEB-INF/solr.home
DB_NAME
-
entspricht der von Ihnen eingesetzten Datenbank.
-
Passen Sie den Eintrag
<dataSource>
in der XML-Datei an:<dataSource name="db" driver="<Set JDBC driver here>" url="<Set JDBC URL here>" user="<Set JDBC user name here>" password="<Set JDBC password here>" />
Datenbank JDBC Treiber JDBC Verbindungs-URL (Beispiele) Postgres
org.postgresql.Driver
jdbc:postgresql://localhost:5432/sfsdi
MS SQL Server
com.microsoft.sqlserver.jdbc.SQLServerDriver
jdbc:sqlserver://localhost:1433;DATABASENAME=sfsdi
Oracle
oracle.jdbc.driver.OracleDriver
jdbc:oracle:thin:@localhost:1521/sfsdi
driver
-
JDBC Treibername. Der Wert ist vom verwendeten Datenbanksystem abhängig, vgl. Tabelle
url
-
JDBC Datenbankverbindungs-URL. Dieser Wert ist vom verwendeten Datenbanksystem abhängig, vgl. Tabelle
user
-
Nutzername des Datenbanknutzers.
password
-
Passwort des Datenbanknutzers.
-
Speichern Sie die Anpassungen.
Anlegen des Indexierungs-Jobs
Zur Einrichtung der Datenbankindexierung, wählen Sie die Option Datenimport. Geben Sie anschließend folgende Werte an:
Titel |
Bezeichnung des Data Import Handler Jobs. Dieser ist frei zu vergeben. Beachten Sie aber, dass der Name in Suchergebnissen als Facettenwert verwendet wird. |
Name des Index |
Wählen Sie |
Konfigurationsdatei |
Wählen Sie hier die Datei aus der Liste, die sie im vorherigen Schritt konfiguriert haben:
|
Art des Imports |
Wählen Sie |
Statusnachricht senden an (optional) |
Geben Sie einen oder mehrere E-Mail-Adressen an, an die Benachrichtigungen bei Änderungen des Job-Status gesendet werden sollen. |
Scheduling (optional) |
Geben Sie mittels Cron-Job an, in welchem Turnus die Datenbank indexiert werden soll. Wir empfehlen eine Indexierung in kurzen Zeitintervallen, um neu erfasste Metadaten schnell auffindbar zu machen. |
OGC CSW Katalog
Um ISO Metadaten zu indexieren, die über eine OGC CSW 2.0.2 Schnittstelle zugreifbar sind, wählen Sie die Option OGC CSW Katalog. Geben Sie anschließend folgende Werte an:
Titel |
Bezeichnung des Jobs, welche als Filterwert in dem Facetten-Katalog angezeigt wird. |
URL |
HTTP POST Endpunkt der GetRecords-Schnittstelle des Katalogs. |
Verteilte Kataloge indexieren |
Aktiviert die zusätzliche Indexierung der ISO Metadaten, welche durch den o.g. Katalog im Rahmen einer verteilten Suche zugreifbar sind. |
Suchtiefe |
Definiert die Suchtiefe für die verteilten Kataloge (der sogenannte hopCount). |
Statusnachricht senden an (optional) |
Geben Sie einen oder mehrere E-Mail-Adressen an, an die Benachrichtigungen bei Änderungen des Job-Status gesendet werden sollen. |
Scheduling (optional) |
Geben Sie mittels Cron-Job an, in welchem Turnus die Datenbank indexiert werden soll. Nur relevant, wenn die Option Verteilte Kataloge indexieren aktiv ist. |
Beispiel
Mit diesen Einstellungen wird in dem Job der angegebene Katalog des con terra Demo Portals sowie alle angeschlossenen Kataloge bis zu einer Suchtiefe von 2 indexiert.
Titel: CSW Demo Portal con terra URL: http://services.conterra.de/soapServices/CSWStartup Verteilte Kataloge indexieren: Ja Suchtiefe: 2
Verzeichnis
Um ISO Metadaten zu indexieren, die in einem lokalen Verzeichnis gespeichert sind, wählen Sie die Option Verzeichnis. Geben Sie folgende Werte an:
Titel |
Bezeichnung des Jobs, welche als Filterwert in dem Facetten-Katalog angezeigt wird. |
Verzeichnis |
Basis-Verzeichnis, welches durchsucht werden soll. |
Verzeichnistiefe |
Basis durchsucht nur das Wurzelverzeichnis. |
Dateitypen |
Geben Sie |
Statusnachricht senden an (optional) |
Geben Sie einen oder mehrere E-Mail-Adressen an, an die Benachrichtigungen bei Änderungen des Job-Status gesendet werden sollen.+ |
Scheduling (optional) |
Geben Sie mittels Cron-Job an, in welchem Turnus die Datenbank indexiert werden soll. |
URL
Wählen Sie diesen Typ, wenn Sie ISO Dokumente indexieren möchten, die in eine Web Accessible Folder (WAF) zur Verfügung gestellt werden.
Titel |
Bezeichnung des Jobs. |
URL |
URL auf den Web Accessible Folder |
Filter |
Geben Sie hier den regulären Ausdruck |
Suchtiefe |
Angabe der maximalen Suchtiefe innerhalb der Seiten-Hierarchie |
Statusnachricht senden an (optional) |
Geben Sie einen oder mehrere E-Mail-Adressen an, an die Benachrichtigungen bei Änderungen des Job-Status gesendet werden sollen. |
Scheduling (optional) |
Geben Sie mittels Cron-Job an, in welchem Turnus die Datenbank indexiert werden soll. |