Indexierungsjobs
smart.finder SDI ist auf die Indexierung von ISO-Metadaten ausgelegt.
Der iso
Core erwartet ausschließlich Metadaten, die gemäß ISO-19139 kodiert vorliegen.
Die Titel der Indexierungsjobs werden in der Ergebnisliste als Facetten-/Filterwerte in der Facette "Katalog" aufgelistet. Beachten Sie dies bei der Namensgebung. |
Damit ISO-Metadaten in den Index gelangen, müssen die Quellen dieser Metadatendokumente im Job-Manager konfiguriert werden.
Dies kann z.B. über den Menüpunkt Indexierungsjobs verwalten in der App full-page-sdi
erfolgen.
Alternativ können Sie direkt die URL /sfsdi-extension/resources/apps/management/index.html
aufrufen.
Sie müssen angemeldeter Administrator sein, um den Job-Manger benutzen zu können.
Über den "Erstellen"-Button oben links können neue Indexierungsjobs eingerichtet werden. Für smart.finder SDI werden die folgenden Optionen unterstützt: Datenimport, OGC CSW Katalog und Verzeichnis und URL.
Datenimport
Diese Option richtet einen Data Import Handler ein, der die in der lokalen Datenbank gespeicherten Metadaten indexiert. Die Einrichtung ist zweigeteilt: Erst muss eine Konfigurationsdatei eingerichtet und dann ein Indexierungsjob über die Oberfläche erstellt werden.
Einrichtung der Konfigurationsdatei
-
Öffnen Sie die Konfigurationsdatei des verwendeten Data Import Handlers. Die Datei finden Sie unter:
[SOLR_HOME]/iso/conf/dih-[DB_NAME].xml
SOLR_HOME
-
Stammverzeichnis des Index.
Standardwert:
/smartfinder-search/WEB-INF/solr.home
DB_NAME
-
Entspricht der von Ihnen eingesetzten Datenbank.
-
Passen Sie den Eintrag
<dataSource>
in der XML-Datei an:<dataSource name="db" driver="<Set JDBC driver here>" url="<Set JDBC URL here>" user="<Set JDBC user name here>" password="<Set JDBC password here>" />
xmlDatenbank JDBC-Treiber JDBC-URL (Beispiele) Postgres
org.postgresql.Driver
jdbc:postgresql://localhost:5432/sfsdi
MS SQL Server
com.microsoft.sqlserver.jdbc.SQLServerDriver
jdbc:sqlserver://localhost:1433;DATABASENAME=sfsdi
Oracle
oracle.jdbc.driver.OracleDriver
jdbc:oracle:thin:@localhost:1521/sfsdi
driver
-
JDBC Treibername. Der Wert ist vom verwendeten Datenbanksystem abhängig, vgl. Tabelle
url
-
JDBC-Datenbank-URL. Dieser Wert ist vom verwendeten Datenbanksystem abhängig, vgl. Tabelle
user
-
Benutzername des Datenbankbenutzers.
password
-
Passwort des Datenbankbenutzers.
-
Speichern Sie die Anpassungen.
Anlegen des Indexierungsjobs
Zur Einrichtung der Datenbankindexierung wählen Sie die Option Datenimport. Geben Sie anschließend folgende Werte an:
Titel |
Bezeichnung des Data Import Handler Jobs. Dieser ist frei zu vergeben. Beachten Sie aber, dass der Name in Suchergebnissen als Facettenwert verwendet wird. |
Name des Index |
Wählen Sie |
Konfigurationsdatei |
Wählen Sie hier die Datei aus der Liste, die Sie im vorherigen Schritt konfiguriert haben:
|
Art des Imports |
Wählen Sie |
Statusnachricht senden an (optional) |
Geben Sie einen oder mehrere E-Mail-Adressen an, an die Benachrichtigungen bei Änderungen des Job-Status gesendet werden sollen. |
Scheduling (optional) |
Geben Sie mittels Cron-Job an, in welchem Turnus die Datenbank indexiert werden soll. Wir empfehlen eine Indexierung in kurzen Zeitintervallen, um neu erfasste Metadaten schnell auffindbar zu machen. |
OGC CSW-Katalog
Um ISO-Metadaten zu indexieren, die über eine OGC CSW 2.0.2 Schnittstelle zugreifbar sind, wählen Sie die Option OGC CSW-Katalog. Geben Sie anschließend folgende Werte an:
Titel |
Bezeichnung des Jobs, die als Filterwert in der Facette "Katalog" angezeigt wird. |
URL |
HTTP POST Endpunkt der GetRecords-Schnittstelle des Katalogs. |
Verteilte Kataloge indexieren |
Aktiviert die zusätzliche Indexierung der ISO-Metadaten, welche durch den o.g. Katalog im Rahmen einer verteilten Suche zugreifbar sind. |
Suchtiefe |
Definiert die Suchtiefe für die verteilten Kataloge (der sogenannte hopCount). |
Statusnachricht senden an (optional) |
Geben Sie einen oder mehrere E-Mail-Adressen an, an die Benachrichtigungen bei Änderungen des Job-Status gesendet werden sollen. |
Scheduling (optional) |
Geben Sie mittels Cron-Job an, in welchem Turnus die Datenbank indexiert werden soll. Nur relevant, wenn die Option Verteilte Kataloge indexieren aktiv ist. |
Beispiel
Mit diesen Einstellungen wird in dem Job der angegebene Katalog des con terra Demo Portals sowie alle angeschlossenen Kataloge bis zu einer Suchtiefe von 2 indexiert.
Titel: CSW Demo Portal con terra URL: http://services.example.com/soapServices/CSWStartup Verteilte Kataloge indexieren: Ja Suchtiefe: 2
Verzeichnis
Um ISO-Metadaten zu indexieren, die in einem lokalen Verzeichnis gespeichert sind, wählen Sie die Option Verzeichnis. Geben Sie folgende Werte an:
Titel |
Bezeichnung des Jobs, die als Filterwert in der Facette "Katalog" angezeigt wird. |
Verzeichnis |
Basis-Verzeichnis, das durchsucht werden soll. |
Verzeichnistiefe |
Basis durchsucht nur das Wurzelverzeichnis. |
Dateitypen |
Geben Sie |
Statusnachricht senden an (optional) |
Geben Sie einen oder mehrere E-Mail-Adressen an, an die Benachrichtigungen bei Änderungen des Job-Status gesendet werden sollen.+ |
Scheduling (optional) |
Geben Sie mittels Cron-Job an, in welchem Turnus die Datenbank indexiert werden soll. |
URL
Wählen Sie diesen Typ, wenn Sie ISO-Dokumente indexieren möchten, die in einem Web Accessible Folder (WAF) zur Verfügung gestellt werden.
Titel |
Bezeichnung des Jobs. |
URL |
URL auf den Web Accessible Folder |
Filter |
Geben Sie hier den regulären Ausdruck |
Suchtiefe |
Angabe der maximalen Suchtiefe innerhalb der Seitenhierarchie |
Statusnachricht senden an (optional) |
Geben Sie einen oder mehrere E-Mail-Adressen an, an die Benachrichtigungen bei Änderungen des Job-Status gesendet werden sollen. |
Scheduling (optional) |
Geben Sie mittels Cron-Job an, in welchem Turnus die Datenbank indexiert werden soll. |