FME Flow

Übersicht

Ablauf

FME Flow Token generieren
Einrichtung der Python-FME-Jobs
Einrichtung von Filebeat für Server-only-Dateien

FME Flow Token generieren

Es ist sinnvoll, in FME Flow ein eigenes Benutzerkonto explizit für die Verbindung mit service.monitor zu erstellen und für diesen Benutzer ein FME-Token zu generieren. Folgende Rechte werden für den Zugriff auf FME bei der Token-Generierung in FME benötigt:

Permission	Level
Jobs	Manage
Licensing & Engines	Manage
Queue Control	Manage

Permission

Level

Jobs

Manage

Licensing & Engines

Manage

Queue Control

Manage

Einrichtung der Python-FME-Jobs

An die Stelle der Logstash-Pipelines aus den Vorversionen ist eine Python-API getreten, die einen performanten, verlässlichen und leicht konfigurierbaren Einsatz ermöglicht. Über diesen Weg können die FME Flow Jobs, die FME Job Logs und die FME Queues abgefragt werden. Voraussetzung für die Nutzung ist eine Python-3-Umgebung und die Installation von pipelines-<version>-py3-none-any.whl. Siehe dazu README.md im Ordner resources/analytics/python/pipelines.

Danach sollten folgende Schritte erfolgen:

Konfigurationsdatei config.json anlegen oder Optionen als System-Umgebungsvariablen setzen
Skript auf der Kommandozeile testen
Skript in ausführbare Datei einbetten
kontinuierliche Ausführung konfigurieren

Folgende JSON-Struktur zeigt die Konfigurationsmöglichkeiten für den FME Python Client.

Alternativ können die Werte auch als System-Umgebungsvariablen gesetzt werden. Die Namen der Variablen folgen einem Schema, das sich aus dem Pfad der JSON-Struktur ableitet, z.B. ELASTICSEARCH_URL.

Konfiguration FME Python Client

{
  "elasticsearch": {
    "url": "http://elastic.host.example.com:9200",
    "username": "elastic",
    "password": "<elastic_pwd>",
    "job_index": "ct-fme-jobs",
    "log_index": "ct-fme-log",
    "job_route_index": "ct-fme-jobroutes",
    "hash_username": true,
    "username_hash_salt": ""
  },
  "fme": {
    "token": "<token>",
    "url": "http://fme.host.example.com",
    "pagesize": 1000,
    "stage": "test"
  },
  "pipeline": {
    "job_logs": {
      "enabled": true,
      "batch_size": 20
    },
    "common": {
      "verify_ssl_certs": false
    },
    "proxy": {
      "url": "http://proxy-host.example.com",
      "use_forwarding_for_https": false
    }
  }
}

`elasticsearch.url`	URL zur Elastic-Instanz	ELASTICSEARCH_URL
`elasticsearch.user`	Name des Nutzers	ELASTICSEARCH_USER
`elasticsearch.password`	Passwort des Nutzers	ELASTICSEARCH_PASSWORD
`elasticsearch.hash_username`	Aktivierung der Hash-Funktion für den Nutzernamen	ELASTICSEARCH_HASH_USERNAME
`elasticsearch.username_hash_salt`	Wert der in den Hash des Nutzernamens einfließt	ELASTICSEARCH_USERNAME_HASH_SALT
`fme.url`	URL zu FME Flow	FME_URL
`fme.token`	FME Flow Token	FME_TOKEN
`fme.stage`	Label, um die Ereignisse gemäß ihrer Stage zu kennzeichnen	FME_STAGE
`common.verify_ssl_cert`	Aktivierung der SSL-Zertifikatsprüfung	COMMON_VERIFY_SSL_CERT
`proxy.url` - optional	Sobald eine Proxy-URL angegeben ist, wird der gesamte Datenverkehr über den Proxy geleitet.	PROXY_URL
`proxy.use_forwarding_for_https` - optional	Entscheidung ob Anfragen an den HTTPS-Proxy weitergeleitet oder ein TLS-Tunnel mithilfe der HTTP-CONNECT-Methode erstellt werden soll. In Standardszenarien muss diese Option nicht verändert werden. Das Forwarding kann beispielsweise genutzt werden, falls der genutzte Proxy die HTTP-CONNECT-Methode nicht unterstützt.	PROXY_USE_FORWARDING_FOR_HTTPS

elasticsearch.url

URL zur Elastic-Instanz

ELASTICSEARCH_URL

elasticsearch.user

Name des Nutzers

ELASTICSEARCH_USER

elasticsearch.password

Passwort des Nutzers

ELASTICSEARCH_PASSWORD

elasticsearch.hash_username

Aktivierung der Hash-Funktion für den Nutzernamen

ELASTICSEARCH_HASH_USERNAME

elasticsearch.username_hash_salt

Wert der in den Hash des Nutzernamens einfließt

ELASTICSEARCH_USERNAME_HASH_SALT

fme.url

URL zu FME Flow

FME_URL

fme.token

FME Flow Token

FME_TOKEN

fme.stage

Label, um die Ereignisse gemäß ihrer Stage zu kennzeichnen

FME_STAGE

common.verify_ssl_cert

Aktivierung der SSL-Zertifikatsprüfung

COMMON_VERIFY_SSL_CERT

proxy.url - optional

Sobald eine Proxy-URL angegeben ist, wird der gesamte Datenverkehr über den Proxy geleitet.

PROXY_URL

proxy.use_forwarding_for_https - optional

Entscheidung ob Anfragen an den HTTPS-Proxy weitergeleitet oder ein TLS-Tunnel mithilfe der HTTP-CONNECT-Methode erstellt werden soll. In Standardszenarien muss diese Option nicht verändert werden. Das Forwarding kann beispielsweise genutzt werden, falls der genutzte Proxy die HTTP-CONNECT-Methode nicht unterstützt.

PROXY_USE_FORWARDING_FOR_HTTPS

Test auf der Kommandozeile (Bash)

python -m pipelines.fmejob -c /opt/conterra/fme/config.json

Einbetten des Aufrufs in eine job-run.sh (Bash)

#!/bin/sh
python -m pipelines.fmejob -c /opt/conterra/fme/config.json

Konfiguration als Cron-Job; Ausführung alle 10 Minuten

*/10 * * * * /home/monitor/fme-python/job-run.sh

Bei einem FME-Flow-Update starten die FME Job IDs erneut bei 0. Um die Ausführung der Python-Skripte nicht zu stören, sollte FME Flow so konfiguriert werden, dass die Job IDs beim letzten Wert der Alt-Version fortgesetzt werden. Dies kann durch ein SQL-Statement in der FME Flow Datenbank erreicht werden. Das Statement lautet: SELECT setval('fme_jobs_job_id_seq', <LETZTE_JOB_ID>, true);

Konfiguration von Filebeat (Server seitige Logdaten)

Für jeden FME Host, der am Sammeln der Log-Daten beteiligt sein soll, muss die Komponente Filebeat installiert werden. Aktuell wird Filebeat 7.x unterstützt; mit Filebeat 8.x konnten noch keine Probleme festgestellt werden.

Die Filebeat-Konfiguration erfolgt danach auf Basis der Vorlage filebeat/fme-logfile/filebeat.yml.

# fme.base.path: '/var/log/fme'
# fme.base.path: 'C:\ProgramData\Safe Software\FME Flow\resources'
fme.base.path: ''

# The value of this option will be added to the "labels.env" field in the index.
env: 'production'

filebeat.inputs:
  - type: "filestream"
    id: "fme_server_core"
    enabled: true
    fields_under_root: true
    fields:
      labels:
      env: ${env}
        source: "fme_server_core"
        pipeline: "ct-monitor-fme-log"
    paths:
      - "${fme.base.path}/logs/core/current/*.log"
    parsers:
      - multiline:
          type: "pattern"
          pattern: '^(\w{3}-\d{2}-\w{3}-\d{4} \d{2}:\d{2}:\d{2}.\d{3})\s((AM|PM)+)'
          negate: true
          match: "after"
          skip_newline: true

[... more inputs ...]

# ======================= Elasticsearch template setting =======================

# we handle ilm and templates in elasticsearch
setup.ilm.enabled: false
setup.template.enabled: false

# ================================== Outputs ===================================

# --------------------------- Elasticsearch Output -----------------------------

output.elasticsearch:
  # the index configuration is ignored when setup.ilm.enabled is true. In this case the setup.ilm.rollover_alias is used as target.
  index: "ct-fme-log"
  # The name of the ingest pipeline processing the filebeat input.
  pipeline: "ct-monitor-fme-log"
  # Elasticsearch host and port
  hosts: ["https://localhost:9200"]
  # Elasticsearch user name
  username: ""
  # Elasticsearch password
  password: ""
  ssl:
    enabled: true
    # Elasticsearch SSL fingerprint
    ca_trusted_fingerprint: ""

Über die Variable fme.base.path kann das Basisverzeichnis der Logdaten auf dem FME Host einmalig für alle Inputs definiert werden.

Über die Variable fme.env kann die Umgebung, die eingebunden wird, hinsichtlich ihrer Stage beschrieben werden: z.B. production oder test.

Konfiguration von Filebeat, in Kombination mit ArcGIS Logdateien

Wenn neben FME Logdateien auch ArcGIS Logdateien mit Filebeat eingelesen werden sollen, kann im Ordner filebeat/arcgis-fme-logfile eine filebeat.yml-Datei für diesen Zweck genutzt werden. Diese kombiniert die beiden Pipelines.

Einrichtung der Logstash Pipelines (deprecated, nicht verpflichtend)

Falls sämtliche Logstash-Pipeline-Ordner des service.monitor bereits in Logstash vorliegen, müssen die drei FME-Pipelines über die Datei pipelines.yml aktiviert werden.

Pipeline konfigurieren

Die FME-Pipelines müssen über das Setzen von Variablen konfiguriert werden, bevor sie erfolgreich in Betrieb genommen werden können.

Variable Standardwert Erklärung

Variable	Standardwert	Erklärung
`FME_SERVER_BASE_URL`	<leer>	URL des Hosts auf dem FME läuft, inkl. Protokoll, z.B.: `https://fme.server.example/`
`FME_SERVER_TOKEN`	<leer>	FME Flow Token zur Authentifizierung des Requests bei FME
`FME_SERVER_LIMIT`	1000	Anzahl der Jobs, die pro Request bei FME Flow abgefragt werden sollen
`FME_SERVER_SCHEDULE`	6h	Polling-Intervall für FME-Server Jobs
`ES_HOST`	localhost	Angabe der Adresse von Elasticsearch, z.B. `"127.0.0.1"` oder `"https://elastic.server.example/extrapath"`
`ES_USER`	<leer>	Benutzername für die Authentifizierung bei Elasticsearch
`ES_PASSWORD`	<leer>	Passwort für die Authentifizierung bei Elasticsearch

FME_SERVER_BASE_URL

<leer>

URL des Hosts auf dem FME läuft, inkl. Protokoll, z.B.: https://fme.server.example/

FME_SERVER_TOKEN

<leer>

FME Flow Token zur Authentifizierung des Requests bei FME

FME_SERVER_LIMIT

1000

Anzahl der Jobs, die pro Request bei FME Flow abgefragt werden sollen

FME_SERVER_SCHEDULE

Polling-Intervall für FME-Server Jobs

ES_HOST

localhost

Angabe der Adresse von Elasticsearch, z.B. "127.0.0.1" oder "https://elastic.server.example/extrapath"

ES_USER

<leer>

Benutzername für die Authentifizierung bei Elasticsearch

ES_PASSWORD

<leer>

Passwort für die Authentifizierung bei Elasticsearch

Die Verwendung der ct-fme-*-Logstash-Pipelines wird nicht mehr empfohlen.