PUBLIC SAP Data Services Dokumentversion: 4.2 Support Package 5 (14.2.5.0) – 2015-05-14 Designer-Handbuch Inhalt 1 Einleitung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 1.1 Willkommen bei SAP Data Services. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 Willkommen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 Dokumentationssatz für SAP Data Services. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 Zugreifen auf Dokumentation aus dem Web. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 SAP-Informationsressourcen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 1.2 Überblick über dieses Handbuch. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 Informationen zu diesem Handbuch. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 Zielgruppe dieses Handbuchs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 2 Anmelden am Designer. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 2.1 Versionsbeschränkungen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 2.2 Zurücksetzen von Benutzern. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 3 Designer-Benutzeroberfläche. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 3.1 Objekte. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .23 Wiederverwendbare Objekte. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 Einmal verwendbare Objekte. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 Objekthierarchie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .24 3.2 Menüleiste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 Projekt (Menü). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 Bearbeiten (Menü). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 Anzeigen (Menü). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 Extras (Menü). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 Menü "Debuggen". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 Validierung (Menü). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .30 Fenster (Menü). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 Menü "Hilfe". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 3.3 Symbolleiste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 3.4 Projektbereich . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 3.5 Symbolleiste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 3.6 Zugriffsmöglichkeit auf die Designer-Tastatur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 3.7 Arbeitsbereich. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 Verschieben von Objekten im Arbeitsbereich. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 Verbinden von Objekten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 Trennen von Objekten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 Beschreiben von Objekten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 2 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Inhalt Skalieren des Arbeitsbereichs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 Anordnen der Fenster im Arbeitsbereich. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .38 Schließen von Arbeitsbereichsfenstern. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 3.8 Lokale Objektbibliothek. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 Öffnen der Objektbibliothek. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .39 Anzeigen des Namens und des Symbols jedes Tabs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 Sortieren von Spalten in der Objektbibliothek. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 3.9 Objekteditoren. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .41 3.10 Arbeiten mit Objekten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 Arbeiten mit neuen wiederverwendbaren Objekten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 Hinzufügen eines vorhandenen Objekts. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 Öffnen einer Objektdefinition. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 Ändern von Objektnamen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 Hinzufügen, Ändern und Anzeigen von Objekteigenschaften. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .44 Anlegen von Beschreibungen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .45 Anlegen von Annotationen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 Kopieren von Objekten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 Speichern und Löschen von Objekten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .49 Suchen nach Objekten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .51 3.11 Allgemeine Optionen und Umgebungsoptionen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 Designer – Umgebung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 Designer – Allgemein. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 Designer – Grafiken. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 Designer – Attributwerte. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .56 Designer – Verbindungen des zentralen Repositorys. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 Designer – Sprache. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 Designer – SSL. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 Daten – Allgemein. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 Jobserver – Umgebung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 Jobserver – Allgemein. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 4 Projekte und Jobs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 4.1 Projekte. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 Objekte, aus denen ein Projekt besteht. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 Anlegen eines neuen Projekts. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 Öffnen eines vorhandenen Projekts. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 Speichern aller Änderungen an einem Projekt. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 4.2 Jobs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 Anlegen eines Jobs im Projektbereich. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 Anlegen eines Jobs in der Objektbibliothek. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 Namenskonventionen für Objekte in Jobs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 Designer-Handbuch Inhalt PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 3 5 Datastores. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 5.1 Was sind Datastores?. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 5.2 Datenbank-Datastores. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 Mainframe-Schnittstelle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 Definieren eines Datenbank-Datastores. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 Konfigurieren von ODBC-Datenquellen unter UNIX. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 Durchsuchen von Metadaten über einen Datenbank-Datastore. . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 Importieren von Metadaten über einen Datenbank-Datastore. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 Speicher-Datastores. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 Persistenter Cache (Datastores). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 Verknüpfte Datastores. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 5.3 Adapter-Datastores. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .90 5.4 Web-Service-Datastores. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .91 Definieren eines Web-Service-Datastore. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 Ändern der Konfiguration eines Web-Service-Datastores. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92 Löschen von Web-Service-Datastores und verknüpften Metadatenobjekten. . . . . . . . . . . . . . . . . . 92 Durchsuchen von WSDL- und WADL-Metadaten über einen Web-Service-Datastore. . . . . . . . . . . . .92 Importieren von Metadaten über einen Web-Service-Datastore. . . . . . . . . . . . . . . . . . . . . . . . . . . 94 5.5 Ändern einer Datastore-Definition. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .94 Ändern von Datastore-Optionen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 Ändern von Datastore-Eigenschaften. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 5.6 Anlegen und Verwalten mehrerer Datastore-Konfigurationen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 Definitionen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 Zweck von mehreren Datastore-Konfigurationen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .96 Anlegen einer neuen Konfiguration. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .97 Hinzufügen eines Datastore-Alias. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 Funktionen zum Identifizieren der Konfiguration. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 Portabilitätslösungen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 Tipps zur Jobportabilität. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104 Umbenennen von Tabellen- und Funktionseigentümern. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 Definieren einer Systemkonfiguration. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 6 Dateiformate. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112 6.1 Verstehen der Dateiformate. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112 6.2 Dateiformateditor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 6.3 Anlegen von Dateiformaten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 Anlegen eines neuen Dateiformats. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 Modellieren eines Dateiformats anhand einer Beispieldatei. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 Replizieren und Umbenennen von Dateiformaten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118 Anlegen eines Dateiformats aus einem Schema für flache Tabellen. . . . . . . . . . . . . . . . . . . . . . . . 119 Anlegen einer bestimmten Quell- oder Zieldatei. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 6.4 4 Bearbeiten von Dateiformaten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Inhalt Bearbeiten einer Quell- oder Zieldatei. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 Ändern von Eigenschaften für mehrere Spalten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 6.5 Dateiformatfunktionen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 Lesen mehrerer Dateien gleichzeitig. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 Identifizieren von Quelldateinamen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 Zahlenformate. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123 Ignorieren von Zeilen mit angegebenen Markierungen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124 Datumsformate auf der Feldebene. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124 Parallele Verarbeitungsthreads. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 Fehlerbehandlung bei Quellen aus Flatfiles. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 6.6 Dateiübertragungsprotokolle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129 Benutzerdefinierte Dateiübertragungen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130 6.7 Arbeiten mit COBOL-Copybook-Dateiformaten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .134 Anlegen eines neuen COBOL-Copybook-Dateiformats. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135 Anlegen eines neuen COBOL-Copybook-Dateiformats und einer Datendatei. . . . . . . . . . . . . . . . . .136 Anlegen von Regeln, um zu identifizieren, welche Datensätze welche Schemas darstellen. . . . . . . . 137 Identifizieren des Felds, das die Länge des Schemadatensatzes enthält. . . . . . . . . . . . . . . . . . . . . 137 6.8 Anlegen von Microsoft-Excel-Arbeitsmappen-Dateiformaten auf UNIX-Plattformen. . . . . . . . . . . . . . . 138 Anlegen eines Microsoft-Excel-Arbeitsmappen-Dateiformats unter UNIX. . . . . . . . . . . . . . . . . . . . 138 6.9 Anlegen von Dateiformaten für Webprotokolle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139 Word_ext-Funktion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140 Concat_date_time (Funktion). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141 WL_GetKeyValue (Funktion). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .141 6.10 Unstrukturierte Dateiformate. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142 7 Dateispeicherorte. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144 7.1 Anlegen von neuen Dateispeicherortobjekten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144 7.2 Mehrere Konfigurationen eines Dateispeicherortobjekts anlegen. . . . . . . . . . . . . . . . . . . . . . . . . . . . 145 Anlegen mehrerer Dateispeicherort-Objektkonfigurationen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145 7.3 Zuordnen von Dateispeicherortobjekten zu Dateiformaten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146 Zuordnen von Flatfiles zum Dateispeicherortobjekt. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147 Zuordnen von DTD-, JSON- und XML-Schemadateien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147 Zuordnen von COBOL Copybooks zu einem Dateispeicherortobjekt. . . . . . . . . . . . . . . . . . . . . . . 148 Zuordnen von Excel-Arbeitsmappen zu einem Dateispeicherortobjekt . . . . . . . . . . . . . . . . . . . . . 149 7.4 Hinzufügen eines Dateiformat-/Dateispeicherortobjekts zu einem Datenfluss. . . . . . . . . . . . . . . . . . . 149 7.5 Verwenden von Skripten zum Verschieben von Dateien von oder zu einem Remote-Server. . . . . . . . . .150 8 Datenflüsse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152 8.1 Was ist ein Datenfluss?. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152 Benennen von Datenflüssen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152 Datenflussbeispiel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152 Schritte in einem Datenfluss. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .153 Designer-Handbuch Inhalt PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 5 Datenflüsse als Schritte in Workflows. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153 Zwischen-Datasets in einem Datenfluss. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154 Operationscodes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .154 Übergeben von Parametern an Datenflüsse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155 8.2 Anlegen und Definieren von Datenflüssen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .156 Definieren eines neuen Datenflusses mit der Objektbibliothek. . . . . . . . . . . . . . . . . . . . . . . . . . . . 156 Definieren eines neuen Datenflusses mit der Symbolleiste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156 Ändern der Eigenschaften eines Datenflusses. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156 8.3 Quell- und Zielobjekte. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158 Quellobjekte. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158 Zielobjekte. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159 Hinzufügen von Quell- oder Zielobjekten zu Datenflüssen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159 Vorlagentabellen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161 Konvertieren von Vorlagentabellen in reguläre Tabellen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162 8.4 Informationen über die Spaltenweitergabe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163 Hinzufügen von Spalten in einem Datenfluss. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164 Weitergeben von Spalten in einem Datenfluss, der eine Merge-Transformation enthält. . . . . . . . . . 165 8.5 Lookup-Tabellen und die Funktion lookup_ext. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166 Aufrufen des lookup_ext-Editors. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .167 Beispiel: Definieren einer einfachen lookup_ext-Funktion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168 Beispiel: Definieren einer komplexen lookup_ext-Funktion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170 8.6 Datenflussausführung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172 Weitergeben von Operationen an den Datenbankserver. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173 Verteilte Datenflussausführung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173 Lastausgleich. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174 Caches. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175 8.7 Auditieren von Datenflüssen – Übersicht. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175 9 Transformationen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .177 9.1 Hinzufügen von Transformationen zu Datenflüssen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179 9.2 Transformationseditoren. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180 9.3 Transformationskonfigurationen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181 Anlegen einer Transformationskonfiguration. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182 Hinzufügen von benutzerdefinierten Feldern. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183 9.4 Query-Transformationen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184 Hinzufügen von Query-Transformationen zu Datenflüssen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184 Abfrageeditor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185 9.5 Data-Quality-Transformationen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .186 Hinzufügen von Data-Quality-Transformationen zu Datenflüssen. . . . . . . . . . . . . . . . . . . . . . . . . 187 Data-Quality-Transformationseditoren. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189 9.6 Text-Data-Processing-Transformationen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193 Textdatenverarbeitung – Übersicht. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193 6 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Inhalt Entity-Extraction-Transformation – Übersicht. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194 Verwenden der Entity-Extraction-Transformation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197 Unterschiede zwischen Textdatenverarbeitungs- und Data-Cleanse-Transformationen. . . . . . . . . . 197 Verwenden mehrerer Transformationen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198 Beispiele für die Verwendung der Entity-Extraction-Transformation. . . . . . . . . . . . . . . . . . . . . . . 199 Hinzufügen einer Textverarbeitungs-Transformation zu einem Datenfluss. . . . . . . . . . . . . . . . . . 200 Editor für die Entity-Extraction-Transformation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201 Verwenden von Filteroptionen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202 10 Workflows. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205 10.1 Schritte in einem Workflow. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .205 10.2 Ausführungsreihenfolge in Workflows. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206 10.3 Beispiel für einen Workflow. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .207 10.4 Anlegen von Workflows. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208 Anlegen neuer Workflows mit der Objektbibliothek. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208 Anlegen neuer Workflows über die Symbolleiste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208 Angabe, dass ein Job den Workflow einmalig ausführt. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208 Was ist ein Einzel-Workflow?. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209 Was ist ein fortlaufender Workflow?. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209 10.5 Bedingte Verzweigungen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 210 Definieren einer bedingten Verzweigung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212 10.6 While-Schleifen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212 Definieren einer While-Schleife. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214 Verwenden von While-Schleifen mit "Daten anzeigen". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215 10.7 Try-/Catch-Blöcke. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215 Definieren eines Try-/Catch-Blocks. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216 Kategorien von verfügbaren Ausnahmen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218 Beispiel: Erfassen von Fehlerdetails mit Catch. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218 10.8 Skripte. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219 Anlegen von Skripten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 220 Debuggen von Skripts mit der Druckfunktion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 220 11 Verschachtelte Daten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222 11.1 Darstellung von hierarchischen Daten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222 11.2 Formatieren von XML-Dokumenten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .225 XML-Schema-Spezifikation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226 Informationen über den Import von XML-Schemas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227 Importieren von abstrakten Typen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229 Importieren von Ersatzgruppen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230 Beschränken der Anzahl an zu importierenden Ersatzgruppen. . . . . . . . . . . . . . . . . . . . . . . . . . . 231 Angeben von Quelloptionen für XML-Dateien. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231 Zuordnung optionaler Schemas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233 Designer-Handbuch Inhalt PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 7 Verwenden von Document Type Definitions (DTDs). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234 Generieren von DTDs und XML-Schemas aus einem NRDM-Schema. . . . . . . . . . . . . . . . . . . . . . .236 11.3 Operationen für verschachtelte Daten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237 Übersicht über verschachtelte Daten und die Query-Transformation. . . . . . . . . . . . . . . . . . . . . . . 237 FROM-Klausel-Konstruktion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238 Verschachteln von Spalten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .241 Verwenden korrelierender Spalten in verschachtelten Daten. . . . . . . . . . . . . . . . . . . . . . . . . . . . 243 Eindeutige Zeilen und verschachtelte Daten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 244 Gruppieren von Werten über verschachtelte Schemas hinweg. . . . . . . . . . . . . . . . . . . . . . . . . . . 244 Aufheben der Verschachtelung von Daten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 244 Umwandeln niedrigerer Ebenen verschachtelter Daten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247 11.4 XML-Extraktion und Parsen nach Spalten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248 Beispielszenarien. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 249 11.5 JSON-Extraktion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 255 Extrahieren von Daten von der JSON-Zeichenfolge mit der Funktion extract_from_json. . . . . . . . . 255 12 Echtzeitjobs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .257 12.1 Anforderungsantwort-Meldungsverarbeitung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .257 12.2 Was ist ein Echtzeitjob?. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 258 Echtzeitjobs im Vergleich zu Batch-Jobs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .258 Meldungen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .259 Echtzeitjobs – Beispiele. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 260 12.3 Anlegen von Echtzeitjobs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262 Echtzeitjob-Modelle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262 Verwenden von Echtzeitjob-Modellen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 264 Anlegen eines Echtzeitjobs mit einem einzelnen Datenfluss. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 266 12.4 Echtzeitquell- und -zielobjekte. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267 Anzeigen von XML-Meldungsquellen oder -Zielschemas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .268 Sekundäre Quellen und Ziele. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268 Transaktionales Laden von Tabellen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .269 Entwurfstipps für Datenflüsse in Echtzeitjobs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 269 12.5 Testen von Echtzeitjobs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 270 Ausführen von Echtzeitjobs im Testmodus. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 270 Verwenden von "Daten anzeigen". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271 Verwenden eines XML-Dateiziels. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271 12.6 Bausteine für Echtzeitjobs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272 Ergänzen von Meldungsdaten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272 Verzweigen von Datenflüssen basierend auf einem Datencachewert. . . . . . . . . . . . . . . . . . . . . . . 275 Aufrufen von Anwendungsfunktionen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 276 12.7 Entwerfen von Echtzeitanwendungen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 276 Reduzieren der Abfragen mit Bedarf an Zugriff auf Backoffice-Anwendungen. . . . . . . . . . . . . . . . .277 Meldungen von Echtzeitjobs zu Adapterinstanzen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 277 8 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Inhalt Durch Adapterinstanz aufgerufener Echtzeitdienst. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 278 13 Eingebettete Datenflüsse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 279 13.1 Übersicht über eingebettete Datenflüsse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 279 13.2 Eingebetteter Datenfluss – Beispiele. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 279 13.3 Anlegen eingebetteter Datenflüsse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 280 Verwenden der Option "Als eingebetteten Datenfluss verwenden". . . . . . . . . . . . . . . . . . . . . . . . . 281 Anlegen von eingebetteten Datenflüssen aus vorhandenen Datenflüssen. . . . . . . . . . . . . . . . . . . .282 Verwenden eingebetteter Datenflüsse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 283 Separates Testen eines eingebetteten Datenflusses. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 285 Fehlerbehebung bei eingebetteten Datenflüssen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 286 14 Variablen und Parameter. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287 14.1 Variablen und Parameter (Fenster). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 288 Anzeigen der Variablen und Parameter in jedem Job, Workflow oder Datenfluss. . . . . . . . . . . . . . .288 14.2 Verwenden lokaler Variablen und Parameter. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 290 Parameter. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 291 Weiterleiten von Werten in Datenflüsse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 291 Definieren einer lokalen Variablen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 292 Replizieren einer lokalen Variable. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 293 Definieren von Parametern. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 293 14.3 Verwenden globaler Variablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 295 Anlegen globaler Variablen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 295 Anzeigen von globalen Variablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 296 Festlegen globaler Variablenwerte. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 296 14.4 Lokale und globale Variablenregeln. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 301 Benennung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .301 Replizieren von Jobs und Workflows. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 301 Importieren und Exportieren. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 301 14.5 Umgebungsvariablen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 301 14.6 Festlegen von Dateinamen zur Laufzeit mithilfe von Variablen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 302 Verwenden einer Variablen in einem Flatfile-Namen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .302 14.7 Ersatzparameter. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303 Übersicht über Ersatzparameter. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303 Verwenden des Editors für Ersatzparameter. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 305 Zuordnen von Ersatzparameterkonfigurationen zu Systemkonfigurationen. . . . . . . . . . . . . . . . . . 307 Überschreiben eines Ersatzparameters im Administrator. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 309 Ausführen eines Jobs mit Ersatzparametern . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 309 Exportieren und Importieren von Ersatzparametern. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 310 15 Ausführen von Jobs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 312 15.1 Übersicht über die Jobausführung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 312 Designer-Handbuch Inhalt PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 9 15.2 Vorbereiten der Jobausführung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 312 Validieren von Jobs und Jobkomponenten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .312 Sicherstellen der Jobserverausführung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 313 Festlegen von Optionen für die Jobausführung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .314 15.3 Ausführen von Jobs als sofortige Aufgaben. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 315 Ausführen eines Jobs als sofortige Aufgabe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 315 Überwachen (Tab) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 316 Protokoll (Tab) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .316 15.4 Debuggen von Ausführungsfehlern. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 316 Verwenden von Protokollen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 317 Untersuchen von Zieldaten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 319 Anlegen von Debug-Paketen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 319 15.5 Ändern von Jobserveroptionen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 320 Ändern von Optionswerten für einen einzelnen Jobserver. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .322 Verwenden zugeordneter Laufwerksnamen in einem Pfad. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 324 16 Datenbewertung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 325 16.1 Verwenden des Daten-Profilers. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .326 Analysierbare Datenquellen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 327 Herstellen einer Verbindung mit dem Profiler-Server. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 327 Profiler-Statistiken. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 328 Ausführen von Profiler-Aufgaben. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 331 Überwachen der Profiler-Aufgaben mit dem Designer. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 336 Anzeigen der Profiler-Ergebnisse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 338 16.2 Verwenden von "Daten anzeigen" zur Ermittlung der Datenqualität. . . . . . . . . . . . . . . . . . . . . . . . . . 343 Daten (Tab). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 343 Profil (Tab). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 344 Beziehungs-Profiling oder Spalten-Profiling (Tabs). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 344 16.3 Verwenden der Validation-Transformation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .345 Analysieren des Spalten-Profilings. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 345 Definieren einer Validierungsregel auf der Grundlage eines Spalten-Profilings. . . . . . . . . . . . . . . . 347 16.4 Verwenden von Audits . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .348 Auditieren von Objekten in einem Datenfluss. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .348 Zugreifen auf das Fenster "Audit". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 352 Definieren von Auditpunkten, -regeln und Maßnahmen bei Fehlern. . . . . . . . . . . . . . . . . . . . . . . . 353 Richtlinien zur Auswahl von Auditpunkten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 355 Auditieren eingebetteter Datenflüsse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 356 Auflösen ungültiger Auditbezeichnungen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 358 Anzeigen von Auditergebnissen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .359 17 Datenqualität. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .361 17.1 Überblick über die Datenqualität. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 361 10 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Inhalt 17.2 Data Cleanse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 361 Informationen über das Bereinigen von Daten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 361 Bereinigungspaket-Lebenszyklus: Entwickeln, Implementieren und Warten. . . . . . . . . . . . . . . . . . 363 Konfigurieren der Data-Cleanse-Transformation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 367 Festlegen der Rangfolge und Priorisieren von Parsing-Engines. . . . . . . . . . . . . . . . . . . . . . . . . . . 368 Informationen zum Parsen von Daten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .368 Informationen zum Standardisieren von Daten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 382 Informationen zum Zuordnen von Genusbeschreibungen und Namenspräfixen. . . . . . . . . . . . . . . 382 Vorbereiten von Datensätzen für den Vergleich. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 383 Regionsspezifische Daten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 384 17.3 Geokodierung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 393 Adressgeokodierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 394 Rückwärtsgeokodierung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 399 Textbasierte POI-Suche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 409 Verstehen Ihrer Ausgabe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 413 Arbeiten mit sonstigen Transformationen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 415 17.4 Übereinstimmung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 416 Abgleich und Konsolidierung in Data Services und Information Steward. . . . . . . . . . . . . . . . . . . . .416 Abgleichsstrategien. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .417 Übereinstimmungskomponenten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 418 Übereinstimmungsassistent. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 420 Transformationen für Abgleichsdatenflüsse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 427 Arbeiten im Match- und Associate-Editor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 429 Physische und logische Quellen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 430 Übereinstimmungsvorbereitung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 434 Übereinstimmungskriterien. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 457 Übereinstimmungsnachverarbeitung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 475 Assoziationsabgleich. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 494 Unicode-Abgleich. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 495 Phonetische Abgleichskriterien. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 498 Einrichtung für Übereinstimmungsberichte. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 501 17.5 Adressenbereinigung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 503 Funktionsweise der Adressenbereinigung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 504 Address-Cleanse-Berichte. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 506 Vorbereiten der Eingabedaten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 507 Festlegen der zu verwendende(n) Transformation(en). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .508 Angeben des Ziellands. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 512 Referenzdateien einrichten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 512 Definieren von Standardisierungsoptionen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 515 Verarbeiten japanischer Adressen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 516 Verarbeiten chinesischer Adressen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 525 Designer-Handbuch Inhalt PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 11 Unterstützte Länder (Global Address Cleanse). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 530 Zertifizierung für Neuseeland. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .532 Option "Vorschlagsliste" der Global-Address-Cleanse-Transformation. . . . . . . . . . . . . . . . . . . . . 535 Global-Suggestion-List-Transformationen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 536 17.6 Erweiterung der einfachen Adressenbereinigung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 537 USPS DPV®. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 537 LACSLink® . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 549 SuiteLink™ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 558 USPS DSF2® . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 561 Überblick über NCOALink®. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .572 USPS eLOT®. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .589 Early Warning System (EWS). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .589 USPS RDI® . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 591 GeoCensus (USA Regulatory Address Cleanse). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .593 Z4Change (USA Regulatory Address Cleanse). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .597 Überblick über Vorschlagslisten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .599 Statistikberichterstellung aus mehreren Datenquellen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 602 17.7 Data-Quality-Unterstützung für systemeigene Datentypen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 607 Datentypdefinitionen "Data Quality". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 607 17.8 Data-Quality-Unterstützung für NULL-Werte. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 608 18 Entwurf und Debugging. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 609 18.1 Verwenden von "Verwendungsort anzeigen". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 609 Zugreifen auf "Verwendungsort anzeigen" von der Objektbibliothek. . . . . . . . . . . . . . . . . . . . . . . 610 Zugreifen auf "Verwendungsort anzeigen" über den Arbeitsbereich. . . . . . . . . . . . . . . . . . . . . . . . 612 Beschränkungen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 612 18.2 Verwenden von "Daten anzeigen". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 612 Aufrufen von "Daten anzeigen". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 613 Anzeigen von Daten im Arbeitsbereich. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 614 Eigenschaften von "Daten anzeigen". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 616 Optionen für die Datenanzeige in der Symbolleiste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 620 Daten anzeigen (Tabs). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .621 18.3 Verwenden des Entwurfszeit-Daten-Viewers. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 624 Anzeigen von Entwurfszeitdaten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 625 Konfigurieren des Entwurfszeit-Daten-Viewers. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 626 Festlegen von Variablen für Ausdrücke. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 626 18.4 Verwenden des interaktiven Debuggers. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 627 Vor dem Starten des interaktiven Debuggers. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 627 Starten und Beenden des interaktiven Debuggers. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 630 Bereiche. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 632 Menüoptionen und Symbolleiste von "Debuggen". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 637 Anzeigen der von Transformationen übergebenen Daten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 638 12 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Inhalt Push-down-Optimierer. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 639 Beschränkungen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 639 18.5 Vergleichen von Objekten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .640 Vergleichen von zwei verschiedenen Objekten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 640 Vergleichen von zwei Versionen desselben Objekts. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 641 Überblick über das Fenster "Differenz-Viewer". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 642 Navigieren durch Differenzen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 646 18.6 Berechnen von Spaltenzuordnungen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .646 Automatisches Berechnen von Spaltenzuordnungen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 647 Manuelles Berechnen von Spaltenzuordnungen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 647 18.7 Überspringen bestimmter Workflows und Datenflüsse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 647 Überspringen eines Datenflusses oder Workflows. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 648 Überspringen mehrerer Datenflüsse und Workflows. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 648 Deaktivieren von Überspringen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 649 19 Wiederherstellungsmechanismen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 650 19.1 Wiederherstellen aus fehlgeschlagener Jobausführung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 650 19.2 Automatisches Wiederherstellen von Jobs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 651 Aktivieren der automatischen Wiederherstellung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 651 Kennzeichnen von Wiederherstellungseinheiten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 651 Ausführen im Wiederherstellungsmodus. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 652 Gewährleisten korrekter Ausführungspfade. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 653 Verwenden von Try/Catch-Blöcken mit automatischer Wiederherstellung. . . . . . . . . . . . . . . . . . .654 Vermeiden von Datendubletten in Zielen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .656 Verwenden von Pre-Load-SQL-Befehlen zur Ermöglichung erneut ausführbarer Datenflüsse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 657 19.3 Manuelles Wiederherstellen von Jobs mithilfe von Statustabellen. . . . . . . . . . . . . . . . . . . . . . . . . . . 659 19.4 Verarbeiten von Daten mit Problemen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 659 Verwenden von Überlaufdateien. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 660 Filtern fehlender oder fehlerhafter Werte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 660 Umgang mit Fakten bei fehlenden Dimensionen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .661 19.5 Austauschen von Metadaten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 662 Metadatenaustausch. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 662 19.6 Option „Laden der großen Datendatei mit Wiederherstellung“. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 664 Aktivieren der Wiederherstellungsoption für das Laden großer Datenmengen. . . . . . . . . . . . . . . . 664 Beschränkungen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 665 20 Datenänderungserfassung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 667 20.1 Vollständige Regeneration. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 667 20.2 Nur Änderungen erfassen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .667 20.3 Quell- und zielbasierte CDC. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 668 Quellenbasierte CDC. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .668 Designer-Handbuch Inhalt PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 13 Zielbasierte CDC. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 669 20.4 CDC mit Oracle-Quellen verwenden. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 669 Überblick über CDC für Oracle-Datenbanken. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 669 Oracle-CDC einrichten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 673 Anlegen eines CDC-Datastore für Oracle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .674 CDC-Daten in Tabellen importieren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 675 Anzeigen importierter CDC-Tabellen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 678 Konfigurieren einer Oracle-CDC-Quelltabelle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .679 Anlegen eines Datenflusses mit einer Oracle-CDC-Quelle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 681 Verwalten von CDC-Tabellen und Abonnements. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 682 Beschränkungen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 683 20.5 CDC mit Attunity-Großrechnerquellen verwenden. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 683 Einrichten der Attunity-CDC. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 684 Einrichten der Software für CDC auf Mainframe-Quellen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 685 Importieren von Mainframe-CDC-Daten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 686 Konfigurieren einer Großrechner-CDC-Quelle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 688 Verwenden von Mainframe-Kontrollpunkten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 688 Einschränkungen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 690 20.6 CDC mit SAP Replication Server verwenden. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 690 Überblick über die Verwendung eines fortlaufenden Workflows und von Funktionen . . . . . . . . . . . . 691 Verwenden der SAP-PowerDesigner-Modellierungsmethode – Überblick. . . . . . . . . . . . . . . . . . . 696 20.7 CDC mit Microsoft-SQL-Server-Datenbanken verwenden. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 706 Beschränkungen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 707 Data-Services-Spalten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 708 Datenänderungserfassungs-Methode (CDC-Methode). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 709 Änderungsverfolgungsmethode. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 711 Replikationsservermethode. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 714 20.8 CDC mit zeitstempelbasierten Quellen verwenden. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 721 Verarbeiten von Zeitstempeln. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 722 Überlappungen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .724 Zeitstempelarten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 728 Zeitstempelbasierte CDC-Beispiele. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 730 Zusätzliche Tipps für den Entwurf von Jobs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 735 20.9 CDC für Ziele verwenden. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 736 21 Überwachen von Jobs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 737 21.1 Administrator. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 737 22 Mehrbenutzerumgebung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 738 22.1 Vergleich von zentralem und lokalem Repository. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 738 22.2 Mehrere Benutzer. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 739 22.3 Sicherheit und zentrales Repository. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 742 14 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Inhalt 22.4 Einrichten von Mehrbenutzerumgebungen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .742 Anlegen eines nicht sicheren zentralen Repositorys. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 743 Definieren einer Verbindung mit einem nicht sicheren zentralen Repository. . . . . . . . . . . . . . . . . . 743 Aktivieren eines zentralen Repositorys. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 744 22.5 Implementieren von Sicherheitsfunktionen für zentrale Repositorys. . . . . . . . . . . . . . . . . . . . . . . . . .746 Überblick. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 746 Anlegen eines sicheren zentralen Repositorys. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 747 Hinzufügen eines Mehrbenutzeradministrators (optional). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 749 Einrichten von Gruppen und Benutzern. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .749 Definieren einer Verbindung zu einem sicheren zentralen Repository. . . . . . . . . . . . . . . . . . . . . . 749 Arbeiten mit Objekten in einem sicheren zentralen Repository. . . . . . . . . . . . . . . . . . . . . . . . . . . 750 22.6 Arbeiten in einer Mehrbenutzerumgebung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 751 Filterung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .751 Hinzufügen von Objekten zum zentralen Repository. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .752 Auschecken von Objekten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 753 Rückgängigmachen des Auscheckvorgangs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 756 Einchecken von Objekten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .757 Bezeichnen von Objekten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 759 Abrufen von Objekten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 762 Vergleichen von Objekten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 763 Anzeigen des Objektverlaufs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 763 Löschen von Objekten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 765 22.7 Migrieren von Mehrbenutzerjobs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .765 Anwendungsphasenverwaltung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 766 Kopieren von Inhalt zwischen zentralen Repositorys. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 767 Migration des zentralen Repositorys. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .768 Designer-Handbuch Inhalt PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 15 1 Einleitung 1.1 Willkommen bei SAP Data Services 1.1.1 Willkommen SAP Data Services stellt eine einzelne Unternehmenslösung für Datenintegration, Datenqualität, Daten-Profiling und Textdatenverarbeitung bereit, mit der Sie vertrauenswürdige Daten integrieren, transformieren, optimieren und für kritische Geschäftsabläufe bereitstellen können. Es umfasst Entwicklungsoberfläche, MetadatenRepository, Datenkonnektivitätsschicht, Laufzeitumgebung und Management Console und ermöglicht ITUnternehmen die Senkung der Gesamtbetriebskosten und Verkürzung der Amortisationszeit. Mit SAP Data Services können IT-Unternehmen die betriebliche Effizienz mit einer einzelnen Lösung maximieren, um die Datenqualität zu optimieren und Zugriff auf heterogene Quellen und Anwendungen zu erhalten. 1.1.2 Dokumentationssatz für SAP Data Services Machen Sie sich mit sämtlicher Dokumentation vertraut, die zu Ihrem SAP-Data-Services-Produkt gehören. Die aktuelle Dokumentation zu Data Services finden Sie im SAP Help Portal. Tabelle 1: Dokument Inhalt des Dokuments Handbuch für das AdapterSDK Enthält Informationen zur Installation, Konfiguration und Ausführung des Data-ServicesAdapter-SDK. Administratorhandbuch Informationen zu Verwaltungsaufgaben wie Überwachung, LifeCycle-Management, Sicherheit etc. Behobene Kundenprobleme Informationen zu Kundenproblemen, die in dieser Version behoben wurden. Hinweis Diese Informationen stehen bei einigen Versionen in den jeweiligen Versionshinweisen. Designer-Handbuch Informationen zur Verwendung des Data Services Designers. Dokumentationsübersicht Informationen zu verfügbaren Büchern, Sprachen und Speicherorten in Data Services. Installationshandbuch für UNIX Informationen und Prozeduren für die Installation von Data Services in einer UNIX-Umgebung. Installationshandbuch für Windows Informationen und Prozeduren für die Installation von Data Services in einer Windows-Umge bung. Integrator's Guide Für den Zugriff auf die SAP-Data-Services-Funktionen über Web-Services und APIs erforderli che Informationen für Dritthersteller-Entwickler. 16 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Einleitung Dokument Inhalt des Dokuments Management-Console-Hand Informationen zur Verwendung des Data-Services-Administrators und der Data-Servicesbuch Metadatenberichte. Masterhandbuch Informationen zu der Anwendung und ihren Komponenten sowie Szenarien für die Planung und den Entwurf der Systemlandschaft. In diesem Handbuch sind auch Informationen zu SAP Infor mation Steward enthalten. Performance Optimization Guide Informationen zur Verbesserung der Leistung von Data Services. Referenzhandbuch Ausführliches Referenzmaterial zum Data Services Designer. Versionshinweise Wichtige Informationen, die Sie benötigen, wenn Sie diese Version von Data Services installie ren und implementieren. Technische Handbücher Eine kompilierte, durchsuchbare „Master“-PDF mit wichtigen Data-Services-Handbüchern: ● Administratorhandbuch ● Designer-Handbuch ● Referenzhandbuch ● Management-Console-Handbuch ● Performance Optimization Guide ● Integrator Guide ● Supplement for Adapters ● Supplement for Google BigQuery ● Supplement for J.D. Edwards ● Supplement for Oracle Applications ● Supplement for PeopleSoft ● Supplement for SAP ● Supplement for Siebel ● Workbench Guide Text Data Processing Extra ction Customization Guide Informationen zur Anlage von Wörterbüchern und Extraktionsregeln für die Erzeugung eigener Extraktionsmuster, die mit Text-Data-Processing-Transformationen verwendet werden können. Text Data Processing Lang uage Reference Guide Informationen zu den Funktionen für linguistische Analyse und Extraktionsverarbeitung der Textdatenverarbeitungskomponente sowie ein Referenzabschnitt für jede unterstützte Spra che. Tutorial Eine schrittweise Einführung in die Verwendung von Data Services. Aktualisierungshandbuch Informationen zur Unterstützung bei der Aktualisierung aus vorherigen Versionen von Data Ser vices und versionsspezifischen Produktverhaltensänderungen aus früheren Versionen von Data Services im Vergleich zur aktuellen Version. Neue Funktionen Beschreibung der wichtigen neuen Funktionen in dieser SAP-Data-Services-Version. Dieses Do kument wird bei neuen Support Packages oder Patch-Freigaben nicht aktualisiert. Workbench Guide Beschreibt die Verwendung der Workbench zum Migrieren von Daten und Datenbank-Sche mainformationen zwischen verschiedenen Datenbanksystemen. Darüber hinaus sind möglicherweise verschiedene Ergänzungshandbücher hilfreich. Designer-Handbuch Einleitung PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 17 Tabelle 2: Dokument Inhalt des Dokuments Supplement for Adapters Informationen zur Installation, Konfiguration und Verwendung von Data-Services-Adap tern. Supplement for Google BigQuery Informationen zu den Schnittstellen zwischen Data Services und Google BigQuery. Supplement for J.D. Edwards Enthält Informationen über Schnittstellen zwischen Data Services und J.D. Edwards World sowie J.D. Edwards OneWorld. Supplement for Oracle Applications Enthält Informationen zur Schnittstelle zwischen Data Services und Oracle-Anwendun gen. Supplement for PeopleSoft Informationen zu den Schnittstellen zwischen Data Services und PeopleSoft. Supplement for SAP Informationen zu Schnittstellen zwischen Data Services, SAP-Anwendungen und SAP NetWeaver BW. Supplement for Siebel Informationen zu der Schnittstelle zwischen Data Services und Siebel. Im Lieferumfang sind auch die folgenden Handbücher mit Informationen zu den SAP-BusinessObjectsInformationsplattformdiensten enthalten. Tabelle 3: Dokument Inhalt des Dokuments Administratorhandbuch für die Informationsplattformdienste Informationen für Administratoren, die für die Konfiguration, Verwaltung und Pflege einer Installation der Informations plattformdienste verantwortlich sind. Information platform services Installation Guide for UNIX (In formationsplattformdienste: Installationshandbuch für UNIX) Installationsprozeduren für die SAP-BusinessObjectsInformationsplattformdienste in einer UNIX-Umgebung. Information platform services Installation Guide for Windows (Informationsplattformdienste: Installationshandbuch für Windows) Installationsprozeduren für die SAP-BusinessObjectsInformationsplattformdienste in einer Windows-Umgebung. 1.1.3 Zugreifen auf Dokumentation aus dem Web Auf den gesamten Dokumentationssatz von SAP Data Services können Sie über die Website des Geschäftsbenutzer-Supports von SAP zugreifen. Rufen Sie dazu die Seite http://help.sap.com/bods auf. Sie können die PDFs online anzeigen oder auf Ihrem Rechner speichern. 1.1.4 SAP-Informationsressourcen Hierbei handelt es sich um eine Liste mit Verknüpfungen zu Informationsressourcen. Ein weltweites Netzwerk von SAP-Technologieexperten bietet Kundendienst, Schulung und Beratung, um den größtmöglichen Nutzen des Information-Managements für Ihr Unternehmen sicherzustellen. Übersicht nützlicher Adressen: 18 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Einleitung Tabelle 4: Adresse Inhalt Kundendienst, Beratung und Schulungsleistungen http://service.sap.com/ Informationen über SAP-Business-User-Support-Programme sowie Links zu technischen Artikeln, Downloads und Online diskussionen. Produktdokumentation SAP-Produktdokumentation. http://help.sap.com/bods/ SAP-Data-Services-Lernprogramm http://help.sap.com/businessobject/product_guides/ sbods42/en/ds_42_tutorial_en.pdf Community Network für SAP-Data-Services http://scn.sap.com/community/data-services EIM-Wiki-Seite im SCN http://wiki.sdn.sap.com/wiki/display/EIM/EIM+Home Unterstützte Plattformen (Product Availability Matrix) https://service.sap.com/PAM Blueprints http://scn.sap.com/docs/DOC-8820 1.2 Führt zentrale Funktionen, Konzepte und Verfahren ein, um Batch-Daten zu extrahieren, zu transformieren und aus Flat file-Quellen und relationalen Datenbanken zu laden und in ei nem Data Warehouse zu verwenden. Sie erhalten aktuelle Online-Informationen über SAP Data Services, einschließlich Foren, Tipps und Tricks, zusätzlicher Downloads, Beispielen und vieles mehr. Der gesamte Inhalt wird für und von der Community erstellt. Wir laden Sie ein, sich mit uns in Verbindung zu setzen, wenn Sie einen Beitrag posten möchten. Mittel zum Beitragen von Inhalten, Einstellen von Kommenta ren und hierarchischen Organisieren von Informationen, da mit diese auf einfache Weise aufgefunden werden können. Informationen zu unterstützten Plattformen für SAP Data Services mit einer Suchfunktion, damit Sie die für Ihre Platt form relevanten Informationen schnell finden können. Sie können die Blueprints herunterladen und an Ihre Anforde rungen anpassen. Jeder Blueprint enthält das Projekt sowie die Jobs, Datenflüsse, Dateiformate, Beispieldaten, TemplateTabellen und benutzerdefinierten Funktionen von SAP Data Services, die zur Ausführung der Datenflüsse in Ihrer Umge bung erforderlich sind und nur geringfügig geändert werden müssen. Überblick über dieses Handbuch Willkommen beim Designer-Handbuch. Der Data Services Designer stellt eine grafische Benutzeroberfläche (GUI) als Entwicklungsumgebung zur Verfügung, in der Sie Datenanwendungslogik definieren, um Daten von Datenbanken und Anwendungen zu extrahieren, umzuwandeln und in ein Data Warehouse zu laden, das für analytische und bedarfsgerechte Abfragen verwendet wird. Sie können mit dem Designer auch logische Pfade für die Verarbeitung von auf Meldungen basierenden Abfragen und Transaktionen von webbasierten, Front-Officeund Back-Office-Anwendungen definieren. 1.2.1 Informationen zu diesem Handbuch Dieses Handbuch enthält zwei Arten von Informationen: Designer-Handbuch Einleitung PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 19 ● Allgemeine Informationen zum Verständnis des Data Services Designers und seiner Funktionen ● Verfahrensorientierte Informationen, in denen Schritt für Schritt erklärt wird, wie eine bestimmte Aufgabe ausgeführt wird Dieses Handbuch ist besonders hilfreich: ● Während Sie sich mit dem Produkt vertraut machen ● Beim Ausführen von Aufgaben in der Entwurfs- und frühen Testphase Ihrer Datenverschiebungsprojekte ● Als allgemeine Informationsquelle während einer beliebigen Phase Ihres Projekts 1.2.2 Zielgruppe dieses Handbuchs In dieser und anderen Data-Services-Produktdokumentationen wird von Folgendem ausgegangen: ● Sie sind ein Anwendungsentwickler, Berater oder Datenbankadministrator und für Datenextraktion, DataWarehousing, Datenintegration oder Datenqualität zuständig. ● Sie sind mit Ihren Quelldatensystemen, dem RDBMS, Business Intelligence und Nachrichtenkonzepten vertraut. ● Sie kennen die Datenanforderungen Ihrer Organisation. ● Sie sind mit SQL (Structured Query Language) vertraut. ● Wenn Sie dieses Produkt für den Entwurf von Echtzeit-Verarbeitungsprozessen verwenden möchten, sollten Sie mit Folgendem vertraut sein: ○ DTD- und XML-Schemaformaten für XML-Dateien ○ Veröffentlichen von Web-Services (WSDL, REST, HTTP und SOAP-Protokolle usw.) ● Data-Services-Installationsumgebungen (Microsoft Windows oder UNIX) 20 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Einleitung 2 Anmelden am Designer Um sich an der Software anmelden zu können, müssen Sie Zugriff auf ein lokales Repository haben. Normalerweise legen Sie ein Repository während der Installation an. Mit dem Repository-Manager können Sie ein Repository aber auch jederzeit anlegen und die Zugriffsrechte im Central Management Server konfigurieren. Darüber hinaus muss jedes Repository mit mindestens einem Jobserver verknüpft werden, bevor Sie RepositoryJobs im Designer ausführen können. Normalerweise definieren Sie einen Jobserver und verknüpfen diesen mit einem Repository während der Installation. Mit dem Servermanager können Sie einen Jobserver oder die Verknüpfungen zwischen Repositorys und Jobservern jedoch jederzeit definieren und bearbeiten. Bei der Anmeldung am -Designer müssen Sie sich als ein im Central Management Server (CMS) definierter Benutzer anmelden. 1. Geben Sie die Benutzeranmeldedaten für den CMS ein. Tabelle 5: Option Beschreibung System Geben Sie den Servernamen und optional den Port für den CMS ein. Benutzername Geben Sie den für die Anmeldung am CMS zu verwenden den Benutzernamen ein. Kennwort Geben Sie das für die Anmeldung am CMS zu verwendende Kennwort ein. Authentifizierung Geben Sie den vom CMS verwendeten Authentifizierungs typ an. 2. Klicken Sie auf Anmelden. Es wird versucht, mit den angegebenen Informationen eine Verbindung zum CMS herzustellen. Nach einer erfolgreichen Anmeldung wird die Liste der verfügbaren lokalen Repositorys angezeigt. 3. Wählen Sie das zu verwendende Repository aus. 4. Klicken Sie auf OK, um sich mit dem ausgewählten Repository anzumelden. Wenn Sie auf OK klicken, werden Sie aufgefordert, das Kennwort für das Data-Services-Repository einzugeben. Dieser Standardprozess kann geändert werden, indem zum Repository in der CMC die notwendigen Rechte hinzugefügt werden. Weitere Informationen finden Sie im Administratorhandbuch. 2.1 Versionsbeschränkungen Versionsbeschränkungen müssen bei der Verwendung von Designer berücksichtigt werden. Ihre Repository-Version muss mit der gleichen Hauptversion verbunden sein wie der Designer und darf nicht höher sein als die Version des Designers. Designer-Handbuch Anmelden am Designer PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 21 Bei der Anmeldung werden Sie von der Software gewarnt, wenn Ihre Designer-Version nicht mir Ihrer RepositoryVersion übereinstimmt. Nachdem Sie sich angemeldet haben, können Sie die Softwareversion und die Repository-Version anzeigen, indem Sie Hilfe Info zu Data Services auswählen. Einige Funktionen in der aktuellen Version des Designers werden möglicherweise nicht unterstützt, wenn Sie nicht bei der neuesten Version des Repositorys angemeldet sind. 2.2 Zurücksetzen von Benutzern Wenn mehrere Personen versuchen, sich an einem Repository anzumelden, müssen Sie möglicherweise einen Benutzer zurücksetzen oder abmelden, bevor Sie fortfahren können. Im Fenster „Benutzer zurücksetzen“ werden Benutzer und die Zeit ihrer Anmeldung am Repository aufgelistet. In diesem Fenster haben Sie verschiedene Möglichkeiten. Sie können folgende Optionen auswählen: ● Benutzer zurücksetzen, um die Benutzer im Repository zu löschen und sich selbst als gerade angemeldeten Benutzer festzulegen. ● Weiter, um die Anmeldung am System fortzusetzen, ungeachtet der anderen Personen, die eventuell angemeldet sind. ● Beenden, um den Anmeldeversuch zu beenden und die Sitzung zu schließen. Hinweis Verwenden Sie Benutzer zurücksetzen oder Weiter nur dann, wenn Sie wissen, dass Sie der einzige mit dem Repository verbundene Benutzer sind. Nachfolgende Änderungen könnten sonst das Repository beschädigen. 22 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Anmelden am Designer 3 Designer-Benutzeroberfläche Dieser Abschnitt enthält grundlegende Informationen zur grafischen Benutzeroberfläche des Designers. 3.1 Objekte Alle "Einheiten", die Sie in Designer definieren, bearbeiten oder mit denen Sie arbeiten, werden als Objekte bezeichnet. Die lokale Objektbibliothek zeigt Objekte wie Quell- und Zielmetadaten, Systemfunktionen, Projekte und Jobs an. Objekte sind hierarchisch und bestehen aus Folgendem: ● Optionen, die die Handhabung von Objekten steuern. So ist in einem Datastore der Name der Datenbank, mit der Sie eine Verbindung herstellen eine Option für das Datastore-Objekt. ● Eigenschaften, die das Objekt dokumentieren. So sind der Name des Objekts und dessen Anlagedatum Eigenschaften. Eigenschaften beschreiben ein Objekt, wirken sich jedoch nicht auf dessen Handhabung aus. Die Software verfügt über zwei Typen von Objekten: ● Reusable ● Single-use Der Objekttyp wirkt sich darauf aus, wie Sie das Objekt definieren und abrufen. 3.1.1 Wiederverwendbare Objekte Sie können die meisten in der Software definierten Objekte wiederverwenden und replizieren. Nachdem Sie ein wiederverwendbares Objekt definiert und gespeichert haben, wird die Definition von der Software im lokalen Repository gespeichert. Sie können dann die Definition so oft wie nötig wiederverwenden, indem Sie Aufrufe für die Definition anlegen. Greifen Sie über die lokale Objektbibliothek auf wiederverwendbare Objekte zu. Ein wiederverwendbares Objekt hat eine einzige Definition; alle Aufrufe für das Objekt verweisen auf diese Definition. Wenn Sie die Definition des Objekts an einer Stelle ändern, ändern Sie das Objekt an allen anderen Stellen, an denen es vorkommt. Ein Datenfluss ist beispielsweise ein wiederverwendbares Objekt. Mehrere Jobs (wie ein wöchentlicher Datenübernahmejob und ein täglicher Datenübernahmejob) können denselben Datenfluss aufrufen. Wenn sich der Datenfluss ändert, verwenden beide Jobs die neue Version des Datenflusses. Die Objektbibliothek enthält Objektdefinitionen. Wenn Sie ein Objekt per Drag-und-Drop aus der Objektbibliothek ziehen, legen Sie de facto einen neuen Verweis auf die vorhandene Objektdefinition an (bzw. einen neuen Aufruf der Objektdefinition). Designer-Handbuch Designer-Benutzeroberfläche PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 23 Weitere Informationen Arbeiten mit neuen wiederverwendbaren Objekten [Seite 42] 3.1.2 Einmal verwendbare Objekte Einmal verwendbare Objekte werden nur als Komponenten anderer Objekte angezeigt und arbeiten nur in dem Kontext, in dem sie angelegt wurden. Sie definieren ein einmal verwendbares Objekt im Kontext eines einzelnen Jobs oder Datenflusses (z.B. Skripte und spezifische Transformationsdefinitionen). 3.1.3 Objekthierarchie Objektbeziehungen sind hierarchisch. Die folgende Abbildung zeigt die Beziehungen zwischen den wichtigsten Objekttypen: 24 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Designer-Benutzeroberfläche 3.2 Menüleiste Dieser Abschnitt enthält eine kurze Beschreibung der Menüs des Designers. Designer-Handbuch Designer-Benutzeroberfläche PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 25 3.2.1 Projekt (Menü) Durchführen von Windows-Standardaufgaben sowie von softwarespezifischen Aufgaben. Tabelle 6: Option Beschreibung Neu Hiermit definieren Sie neue Projekte, Batch-Jobs, Echtzeit jobs, Workflows, Datenflüsse, Transformationen, Datastores, Dateiformate, DTD, XML-Schemas oder benutzerdefinierte Funktionen. Öffnen Hiermit öffnen Sie vorhandene Projekte. Schließen Hiermit schließen Sie das gerade geöffnete Projekt. Löschen Hiermit löschen Sie das ausgewählte Objekt. Speichern Hiermit speichern Sie das Objekt, das im Arbeitsbereich geöff net ist. Alle speichern Hiermit speichern Sie alle Änderungen an Objekten in der ak tuellen Designer-Sitzung. Drucken Hiermit drucken Sie den aktiven Arbeitsbereich. Drucker einrichten Hiermit richten Sie die Standardinformationen für den Dru cker ein. Beenden Hiermit beenden Sie den Designer. 3.2.2 Bearbeiten (Menü) Durchführen von Windows-Standardbefehlen wie Rückgängig machen, Ausschneiden, Einfügen usw. Tabelle 7: Option Beschreibung Rückgängig Die letzte Operation rückgängig machen. Ausschneiden Die ausgewählten Objekte oder den Text ausschneiden und in die Zwischenablage legen. Kopieren Die ausgewählten Objekte oder den Text in die Zwischenab lage legen. Einfügen Den Inhalt der Zwischenablage in den aktiven Arbeitsbereich oder in das aktive Textfeld einfügen. Löschen Die ausgewählten Objekte löschen. Zuletzt gelöscht rückgängig Gelöschte Objekte an der Stelle, an der sie gelöscht wurden, im Arbeitsbereich wiederherstellen. Es werden nur die zuletzt gelöschten Objekte wiederhergestellt. Alle auswählen Alle Objekte im aktiven Arbeitsbereich auswählen. 26 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Designer-Benutzeroberfläche Option Beschreibung Alle löschen Alle Objekte im aktiven Arbeitsbereich löschen (kein Rückgän gig möglich). 3.2.3 Anzeigen (Menü) Verwenden Sie das Menü „Anzeigen“ im Designer, um Symbolleisten anzuzeigen und zu entfernen und um Inhalte, wie z.B. Objektbeschreibungen, zu aktualisieren oder zu aktivieren. Hinweis Über ein Häkchen wird angezeigt, dass die Option aktiviert ist. Tabelle 8: Option Beschreibung Symbolleiste Anzeigen oder Entfernen der Symbolleiste im Designer-Fens ter. Statusleiste Anzeigen oder Entfernen der Statusleiste im Designer-Fens ter. Palette Anzeigen oder Entfernen der unverankerten Tool-Palette. Aktivierte Beschreibungen Anzeigen von Beschreibungen für Objekte mit aktivierten Be schreibungen. Aktualisieren Aktualisieren der Anzeigedarstellung. Verwenden Sie diesen Befehl, um sicherzustellen, dass der Inhalt des Arbeitsbe reichs die aktuellen Informationen aus dem Repository dar stellt. 3.2.4 Extras (Menü) Im Menü „Extras“ können Sie verschiedene Fenster oder Verbindungen öffnen und schließen, Statusmeldungen anzeigen und Objekte oder Metadaten importieren und exportieren. Hinweis Ein Symbol mit andersfarbigem Hintergrund zeigt an, dass die Option aktiviert ist. Tabelle 9: Option Beschreibung Objektbibliothek Öffnet bzw. schließt das Fenster der Objektbibliothek. Projektbereich Zeigt den Projektbereich im Designer-Fenster an oder entfernt ihn aus diesem. Designer-Handbuch Designer-Benutzeroberfläche PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 27 Option Beschreibung Variablen Öffnet bzw. schließt das Fenster "Variablen und Parameter". Ausgabe Öffnet bzw. schließt das Fenster "Ausgabe". Im Fenster "Aus gabe" werden aufgetretene Fehler angezeigt, beispielsweise Fehler während der Jobvalidierung oder des Jobexports. Profiler-Monitor Zeigt den Status von Profiler-Aufgaben an. Übereinstimmungsassistenten ausführen Öffnet den Übereinstimmungsassistenten zum Anlegen eines Übereinstimmungsdatenflusses. Wählen Sie eine Transforma tion in einem Datenfluss aus, um diesen Menüeintrag zu akti vieren. Die vom Übereinstimmungsassistenten generierten Transformationen werden nach der von Ihnen ausgewählten Transformation angeordnet. Match-Editor Öffnet den Match-Editor, mit dem Optionen für Match-Trans formationen bearbeitet werden können. Associate-Editor Öffnet den Associate-Editor, mit dem Optionen für AssociateTransformationen bearbeitet werden können. User-Defined-Editor Öffnet den User-Defined-Editor, mit dem Optionen für UserDefined-Transformationen bearbeitet werden können. Benutzerdefinierte Funktionen Öffnet das Fenster „Benutzerdefinierte Funktionen“. Systemkonfigurationen Öffnet den Editor für Systemkonfigurationen. Ersatzparameterkonfigurationen Öffnet den Editor für Ersatzparameter, mit dem Ersatzpara meter und -konfigurationen angelegt und bearbeitet werden können. Anmeldung am Profiler-Server Stellt eine Verbindung zum Profiler-Server her. Exportieren Exportiert einzelne Repository-Objekte in ein anderes Reposi tory oder in eine andere Datei. Mit diesem Befehl wird der Ex port-Editor im Arbeitsbereich geöffnet. Sie können Objekte aus der Objektbibliothek für den Export in den Editor ziehen. Um das gesamte Repository zu exportieren, wählen Sie in der Objektbibliothek mit der rechten Maustaste In Datei exportieren Repository . Aus Datei importieren Importiert Objekte aus einer Datei in das aktuelle Repository. Die Standarddateitypen sind ATL, XML, DMT und FMT. Wei tere Informationen zu DMT- und FMT-Dateien finden Sie im Upgrade Guide. Metadatenaustausch Importiert Metadaten über eine Datei in Systeme anderer Her steller bzw. exportiert sie aus diesen. Zentrale Repositorys Legt Verbindungen mit einem zentralen Repository an oder bearbeitet diese, um Objektversionen zwischen mehreren Be nutzern zu verwalten. Optionen Öffnen Sie das Fenster „Optionen“. Data Services Management Console Öffnet die Management Console. 28 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Designer-Benutzeroberfläche Weitere Informationen Einrichten von Mehrbenutzerumgebungen [Seite 742] Arbeiten in einer Mehrbenutzerumgebung [Seite 751] Lokale Objektbibliothek [Seite 39] Projektbereich [Seite 33] Variablen und Parameter [Seite 287] Verwenden des Daten-Profilers [Seite 326] Anlegen und Verwalten mehrerer Datastore-Konfigurationen [Seite 95] Herstellen einer Verbindung mit dem Profiler-Server [Seite 327] Metadatenaustausch [Seite 662] Allgemeine Optionen und Umgebungsoptionen [Seite 53] 3.2.5 Menü "Debuggen" Verwenden Sie die Optionen im Menü „Debuggen“, um Daten anzuzeigen und zu analysieren und um Haltepunkte und Filter festzulegen usw. Die einzigen Optionen, die in diesem Menü jederzeit zur Verfügung stehen, sind Filter/Haltepunkte anzeigen und Filter/Haltepunkte. Die Optionen Ausführen und Debugging starten sind nur aktiv, wenn ein Job ausgewählt ist. Alle anderen Optionen stehen je nach Bedarf zur Verfügung, wenn ein Job im Debug-Modus ausgeführt wird. Tabelle 10: Option Beschreibung Ausführen Öffnet das Fenster „Ausführungseigenschaften“, mit dem Sie den ausgewählten Job ausführen können. Debugging starten Öffnet das Fenster „Debugging-Eigenschaften“, mit dem Sie einen Job im Debug-Modus ausführen können. Entwurfszeiten anzeigen Öffnet Datenbereiche im Transformationseditor, in denen Sie die Eingabe und Ausgabe für ein Dataset in Echtzeit während des Entwerfens einer Transformation anzeigen und analysie ren können. Automatisch anzeigen Ermöglicht das automatische Anzeigen von Eingabe- und Aus gabedaten nach der Änderung einer Transformation. Eingabe-Dataset filtern Ermöglicht das Filtern der in den Fensterbereichen des Ent wurfszeit-Daten-Viewers angezeigten Datenzeilen. Optionen Öffnet ein Fenster, in dem Sie die Anzahl der angezeigten Da tenzeilen und die zulässige Zeit für Aktualisierungen vor einer Zeitüberschreitung konfigurieren können. Filter/Haltepunkte anzeigen Dient zum Ein- und Ausblenden von Filtern und Haltepunkten in Arbeitsbereichsdiagrammen. Filter/Haltepunkte Öffnet ein Fenster, in dem Sie Filter und Haltepunkte verwal ten können. Designer-Handbuch Designer-Benutzeroberfläche PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 29 Weitere Informationen Verwenden des interaktiven Debuggers [Seite 627] Verwenden des Entwurfszeit-Daten-Viewers [Seite 624] Filter- und Haltepunkte-Fenster [Seite 637] 3.2.6 Validierung (Menü) Mit dem Menü „Validierung“ können Sie Objekte validieren und Informationen anzeigen. Im Designer werden in diesem Menü Optionen als geeignet angezeigt, wenn ein Objekt im Arbeitsbereich geöffnet ist. Tabelle 11: Option Beschreibung Validieren Validieren der Objekte in der aktuellen Arbeitsbereichssicht oder aller Objekte im Job vor der Anwendungsausführung. ATL anzeigen Anzeigen einer schreibgeschützten Version der mit dem Job verknüpften Sprache. Optimiertes SQL anzeigen Anzeigen der SQL, die von Data Services für einen ausgewähl ten Datenfluss generiert wurde. Informationen zur Maximierung von Push-down-Operationen und zum Anzeigen von SQL finden Sie im Performance Optimization Guide. 3.2.7 Fenster (Menü) Enthält Anzeige- und Navigationsoptionen. Tabelle 12: Option Beschreibung Zurück Navigiert zurück in der Liste der aktiven Arbeitsbereichsfens ter. Vorwärts Navigiert vorwärts in der Liste der aktiven Arbeitsbereichs fenster. Überlappend Zeigt die Fenster überlappend an, wobei die Titel zu sehen sind. Untereinander Zeigt die Fenster untereinander an. Nebeneinander Zeigt die Fenster nebeneinander an. Alle Fenster schließen Schließt alle geöffneten Fenster. 30 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Designer-Benutzeroberfläche Im Menü "Fenster" wird außerdem eine Liste der im Arbeitsbereich geöffneten Objekte angezeigt. Der Name des gerade ausgewählten Objekts wird durch ein Häkchen gekennzeichnet. Sie können zu einem anderen geöffneten Objekt navigieren, indem Sie dessen Namen in der Liste auswählen. 3.2.8 Menü "Hilfe" Enthält Verknüpfungen zu hilfreichen Dokumenten, Websites und Softwareinformationen. Tabelle 13: Option Beschreibung Versionshinweise Zeigt die Versionshinweise für die aktuelle Version an. Neue Funktionen Zeigt eine Übersicht über neue Funktionen der aktuellen Ver sion an. Lernprogramm Zeigt das Data-Services-Lernprogramm an, eine schrittweise Anleitung zur Arbeit mit SAP Data Services. Data-Services-Community Hier erhalten Sie online aktuelle Informationen über SAP Data Services. Dazu gehören Tipps und Tricks, weitere Downloads, Beispiele und vieles mehr. Der gesamte Inhalt wird für und von der Community erstellt. Wir laden Sie ein, sich mit uns in Ver bindung zu setzen, wenn Sie einen Beitrag posten möchten. Foren im SCN (SAP Community Network) Durchsuchen Sie die SAP-Foren im SAP Community Network, um von anderen SAP-Data-Services-Benutzern zu lernen und Fragen zu stellen oder Ihr Wissen mit der Community zu tei len. Blueprints Sie können die Blueprints herunterladen und an Ihre Anforde rungen anpassen. Jeder Blueprint enthält das Projekt sowie die Jobs, Datenflüsse, Dateiformate, Beispieldaten, TemplateTabellen und benutzerdefinierten Funktionen von SAP Data Services, die zur Ausführung der Datenflüsse in Ihrer Umge bung erforderlich sind und nur geringfügig geändert werden müssen. Startseite anzeigen Zeigt die Homepage von Data ServicesDesigner an. Info zu Data Services Zeigt Informationen über die Software an, darunter die Versio nen des Designers, Jobservers und der Engine, sowie Copy right-Informationen. 3.3 Symbolleiste Die Software enthält zusätzlich zu zahlreichen Standard-Windows-Tools anwendungsspezifische Tools, darunter: Designer-Handbuch Designer-Benutzeroberfläche PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 31 Tabelle 14: Symbol Tool Beschreibung Alle Fenster schließen Schließt alle im Arbeitsbereich geöffneten Fenster. Lokale Objektbibliothek Öffnet und schließt das Fenster "Lokale Objektbibliothek". Zentrale Objektbibliothek Öffnet und schließt das Fenster "Zentrale Objektbibliothek". Variablen Öffnet und schließt das Fenster zum Anlegen von Variablen und Para metern. Projektbereich Öffnet und schließt den Projektbereich. Ausgabe Öffnet und schließt das Fenster "Ausgabe". Aktivierte Beschreibungen anzei Aktiviert die Einstellung auf Systemebene zum Anzeigen von Objektbe gen schreibungen im Arbeitsbereich. Aktuelle Sicht validieren Validiert die im Arbeitsbereich geöffnete Objektdefinition. Andere in der Definition enthaltene Objekte werden auch validiert. Alle Objekte in der Sicht validieren Validiert die im Arbeitsbereich geöffnete Objektdefinition. In der Defini tion enthaltene Objekte werden ebenfalls validiert. Auditieren Öffnet das Fenster "Audit", um Auditbezeichnungen und -regeln für den Datenfluss zu definieren. Verwendungsort anzeigen Öffnet das Fenster "Ausgabe", in dem die übergeordneten Objekte (wie z.B. Jobs) des aktuell im Arbeitsbereich geöffneten Objekts (wie z.B. ei nem Datenfluss) angezeigt werden. Verwenden Sie diesen Befehl, um andere Jobs zu suchen, die denselben Datenfluss verwenden, bevor Sie Änderungen am Entwurf vornehmen. Um zu sehen, ob ein Objekt in ei nem Datenfluss an einem anderen Ort wiederverwendet wird, klicken Sie mit der rechten Maustaste auf das Objekt und wählen Verwendungsort anzeigen. Zurück Navigiert zurück in der Liste der aktiven Arbeitsbereichsfenster. Vorwärts Navigiert vorwärts in der Liste der aktiven Arbeitsbereichsfenster. Management Console Öffnet und schließt das Management-Console-Fenster Verwenden Sie die Tools rechts neben dem Info-Tool mit dem interaktiven Debugger. 32 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Designer-Benutzeroberfläche Weitere Informationen Menüoptionen und Symbolleiste von "Debuggen" [Seite 637] 3.4 Projektbereich Im Projektbereich sind die Objekte, die in jedem Projekt verwendet werden, hierarchisch dargestellt. Über die Tabs am unteren Rand des Projektbereichs können verschiedene Aufgaben ausgeführt werden. Zu den Tabs gehören folgende: Tabelle 15: Zum Anlegen, Anzeigen und Verwalten von Projekten. Enthält eine hierarchische Darstellung aller Objekte, die in den einzelnen Projekten verwendet werden. Zum Anzeigen des Status des Jobs, der gerade ausgeführt wird. Wenn Sie eine bestimmte Jo bausführung auswählen, wird der Status samt der Schritte angezeigt, die abgeschlossen sind und sich noch in Ausführung befinden. Diese Aufgaben können auch mit dem Administrator ausgeführt werden. Zum Anzeigen des Verlaufs von abgeschlossenen Jobs. Protokolle lassen sich auch mit dem Administrator anzeigen. Wenn Sie die Position des Projektbereichs ändern möchten, klicken Sie mit der rechten Maustaste auf dessen grauen Rand und aktivieren/deaktivieren Andockbar oder wählen Ausblenden aus dem Menü aus. ● Falls Sie Andockbar auswählen, können Sie den Projektbereich durch Klicken und Ziehen an jedem Rand im Designer-Fenster verankern bzw. die Verankerung aufheben. Wenn Sie den Projektbereich von einem Designer-Fensterrand wegziehen, bleibt er unverankert. Um schnell zwischen der letzten verankerten und unverankerten Position umzuschalten, doppelklicken Sie einfach auf den grauen Rand. Wenn Sie "Andockbar" deaktivieren, können Sie den Projektbereich an jede beliebige Position im Fenster ziehen, ohne dass er im Designer-Fenster verankert wird. ● Bei Auswahl von Ausblenden verschwindet der Projektbereich aus dem Designer-Fenster. Um den Projektbereich wieder einzublenden, klicken Sie auf dessen Symbol in der Symbolleiste. Im Folgenden ist ein Beispiel für den Tab Designer des Projektfensters zu sehen, auf der die Projekthierarchie dargestellt wird: Designer-Handbuch Designer-Benutzeroberfläche PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 33 Wenn Sie einen Drill-Down zu Objekten im Designer-Arbeitsbereich durchführen, wird im Fenster Ihre Position innerhalb der Projekthierarchie hervorgehoben. 3.5 Symbolleiste Die Symbolleiste ist ein eigenes Fenster, das standardmäßig am rechten Rand des Designer-Arbeitsbereichs angezeigt wird. Sie können die Symbolleiste überall im Fenster verschieben oder an einem beliebigen Rand des Designer-Fensters verankern. Mit den Symbolen in der Symbolleiste können Sie neue Objekte im Arbeitsbereich anlegen. Die Symbole sind deaktiviert, wenn sie zu dem im Arbeitsbereich geöffneten Diagramm nicht hinzugefügt werden dürfen. Um die Namen der einzelnen Symbole einzublenden, führen Sie den Cursor wie gezeigt über das Symbol, bis die QuickInfo für das Symbol angezeigt wird. Wenn Sie ein Objekt von der Symbolleiste anlegen, wird damit auch eine neue Definition eines Objekts angelegt. Wenn ein neues Objekt wiederverwendbar ist, steht es nach der Anlage automatisch in der Objektbibliothek zur Verfügung. Wenn Sie beispielsweise das Datenflusssymbol von der Symbolleiste auswählen und einen neuen Datenfluss definieren, können Sie diesen vorhandenen Datenfluss später von der Objektbibliothek ziehen, wodurch ein Aufruf zur bestehenden Definition hinzugefügt wird. Die Symbolleiste enthält die folgenden Symbole: Tabelle 16: Symbol 34 Tool Beschreibung (Klasse) Verfügbar Zeiger Verwandelt den Werkzeugzeiger wieder in einen Auswahlzeiger zum Auswählen und Verschieben von Objekten in einem Dia gramm. Überall PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Designer-Benutzeroberfläche Symbol 3.6 Tool Beschreibung (Klasse) Verfügbar Workflow Legt einen neuen Workflow an. (wiederver wendbar) Jobs und Workflows Datenfluss Legt einen neuen Datenfluss an. (wiederver wendbar) Jobs und Workflows ABAP-Datenfluss Wird nur mit der SAP-Anwendung verwen det. Query-Transforma tion Legt eine Vorlage für eine Abfrage an. Dient zum Definieren von Spaltenzuordnungen und zum Auswählen von Zeilen. (einmal ver wendbar) Datenflüsse Vorlagentabelle Legt eine Tabelle für ein Ziel an. (einmal ver wendbar) Datenflüsse Vorlage für ver schachtelte Sche mas Legt eine JSON- oder XML-Vorlage an. (ein mal verwendbar) Datenflüsse Datentransport Wird nur mit der SAP-Anwendung verwen det. Skript Legt ein neues Skriptobjekt an. (einmal ver wendbar) Jobs und Workflows Bedingung Legt ein neues Bedingungsobjekt an. (ein mal verwendbar) Jobs und Workflows Try Legt ein neues Try-Objekt an. (einmal ver wendbar) Jobs und Workflows Catch Legt ein neues Catch-Objekt an. (einmal ver Jobs und Workflows wendbar) Annotation Legt eine Annotation an. (einmal verwend bar) Jobs, Workflows und Daten flüsse Zugriffsmöglichkeit auf die Designer-Tastatur Folgende Tasten stehen für die Navigation im Designer zur Verfügung. Diese Tasten werden von allen Dialogfenstern und Sichten unterstützt. Tabelle 17: Aktion Taste Bearbeitungsmodus aufrufen. F2 Menü oder Dialogfenster schließen oder eine ausgeführte Operation abbrechen. ESC Aktuelles Fenster schließen. STRG+F4 Nacheinander durch die einzelnen Fenster blättern. STRG+TAB Designer-Handbuch Designer-Benutzeroberfläche PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 35 Aktion Taste Systemmenü für das Anwendungsfenster anzeigen. ALT+LEERTASTE Zur nächsten Seite eines Eigenschaftenblatts gehen. STRG+BILD-AB Zur vorherigen Seite eines Eigenschaftenblatts gehen. STRG+BILD-AUF Zum nächsten Steuerelement in einer Sicht oder einem Dia logfenster gehen. TAB Zum vorherigen Steuerelement in einer Sicht oder einem Dia logfenster gehen. UMSCHALT+TAB Bei Fokussierung eine Taste drücken. EINGABETASTE oder LEERTASTE Kontextmenü öffnen (entspricht rechtem Mausklick) UMSCHALT+F10 oder Menü-Taste Struktur aufklappen oder zuklappen (+). NACH-LINKS-TASTE oder NACH-RECHTS-TASTE In einer Struktur nach oben und unten gehen. NACH-OBEN-TASTE oder NACH-UNTEN-TASTE Fokus anzeigen. ALT Hotkey-Operation ALT+<BUCHSTABE> 3.7 Arbeitsbereich Der Arbeitsbereich bietet einen Platz zur Bearbeitung von Systemobjekten und zur grafischen Anordnung von Datenbewegungsprozessen. Wenn Sie einen Job oder einen Fluss innerhalb einer Jobhierarchie öffnen oder auswählen, wird der Workflow in Ihrer Auswahl "aktiv". Diese Prozesse werden durch Symbole dargestellt, die Sie in einen Arbeitsbereich ziehen und dort ablegen, um ein Arbeitsbereichsdiagramm anzulegen. Dieses Diagramm ist eine grafische Darstellung einer gesamten Datenbewegungsanwendung oder eines Bestandteils einer Datenbewegungsanwendung. 3.7.1 Verschieben von Objekten im Arbeitsbereich Sie können zum Verschieben von Objekten im Arbeitsbereich die üblichen Mausbefehle verwenden. So verschieben Sie ein Objekt im Arbeitsbereich: 1. Klicken Sie, um das Objekt auszuwählen. 36 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Designer-Benutzeroberfläche 2. Ziehen Sie das Objekt an die gewünschte Stelle im Arbeitsbereich. 3.7.2 Verbinden von Objekten Sie geben den Fluss von Daten durch Jobs und Workflows an, indem Sie Objekte im Arbeitsbereich von links nach rechts in der Reihenfolge verbinden, in der die Daten bewegt werden sollen. So verbinden Sie Objekte: 1. Ordnen Sie die Objekte, die Sie verbinden möchten, im Arbeitsbereich an. 2. Klicken Sie auf das Dreieck am rechten Rand eines Objekts und ziehen Sie es auf das Dreieck am linken Rand des nächsten Objekts im Fluss. 3.7.3 Trennen von Objekten Sie können Objekte im Arbeitsbereich trennen. Trennen von Objekten: 1. Klicken Sie auf die Verbindungslinie. 2. Drücken Sie die Taste Entf. 3.7.4 Beschreiben von Objekten Sie können Beschreibungen verwenden, um Kommentare zu Objekten hinzuzufügen. Sie können Annotationen verwenden, um einen Job, Workflow oder Datenfluss zu erläutern. Sie können Objektbeschreibungen und -annotationen im Arbeitsbereich anzeigen. Mit Beschreibungen und Annotationen können Sie eine Anwendung von SAP Data Services dokumentieren. Sie können beispielsweise das inkrementelle Verhalten einzelner Jobs durch mehrere Annotationen beschreiben und jedes Objekt mit einer grundlegenden Beschreibung versehen. Beispiel Mit diesem Job werden aktuelle Kategorien und Kosten geladen und Tabellen für die Analyse angelegt. Weitere Informationen Anlegen von Beschreibungen [Seite 45] Anlegen von Annotationen [Seite 48] Designer-Handbuch Designer-Benutzeroberfläche PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 37 3.7.5 Skalieren des Arbeitsbereichs Durch Skalieren des Arbeitsbereichs lässt sich der Fokus auf einen Job, den Workflow oder den Datenfluss verlagern. Sie könnten den Arbeitsbereich beispielsweise vergrößern, um einen bestimmten Teil eines Workflows zu untersuchen, oder aber verkleinern, sodass Sie den gesamten Workflow im Blick haben, ohne die Bildlaufleisten verwenden zu müssen. Zur Skalierung des Arbeitsbereichs stehen verschiedene Möglichkeiten zur Verfügung: ● Wählen Sie aus der Drop-Down-Liste in der Symbolleiste eine vordefinierte Größe aus, oder geben Sie selbst einen Wert ein (zum Beispiel 100 %). ● Klicken Sie mit der rechten Maustaste auf den Arbeitsbereich, und wählen Sie die gewünschte Größe. ● Wählen Sie Gesamtes Projekt skalieren. Designer berechnet die nötige Größe, um das gesamte Projekt im aktuellen Anzeigebereich unterzubringen. ● Bei Auswahl von Gesamten Arbeitsbereich skalieren wird der gesamte Arbeitsbereich im aktuellen Anzeigebereich wiedergegeben. 3.7.6 Anordnen der Fenster im Arbeitsbereich Im Menü „Fenster“ können Sie mehrere offene Arbeitsbereichsfenster anordnen. Fenster können wie folgt angeordnet werden: ● Überlappend ● Untereinander ● Nebeneinander 3.7.7 Schließen von Arbeitsbereichsfenstern Wenn Sie einen Drill-Down in ein Objekt im Projektbereich oder Arbeitsbereich durchführen, wird im Arbeitsbereich eine Sicht der Objektdefinition geöffnet. Diese Sichten verwenden Systemressourcen und sollten geschlossen werden, wenn sie nicht verwendet werden. Die Sicht ist durch einen Tab unten im Arbeitsbereich gekennzeichnet, und wenn Sie weitere Objekte im Arbeitsbereich öffnen, werden weitere Tabs angezeigt. (Sie können diese Tabs aus dem Menü Optionen einblenden bzw. ausblenden. Navigieren Sie zu Designer Arbeitsbereich anzeigen aus, oder heben Sie die Auswahl auf). Extras Allgemein , und wählen Sie Tabs im Hinweis Für diese Sichten wird auf Systemressourcen zurückgegriffen. Wenn Sie eine große Anzahl von Sichten geöffnet haben, kann sich dies möglicherweise auf die Leistung auswirken. 38 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Designer-Benutzeroberfläche Schließen Sie die Sichten einzeln, indem Sie oben rechts im Arbeitsbereich auf das Feld zum Schließen klicken. Schließen Sie alle offenen Sichten, indem Sie Fenster Alle Fenster schließen in der Symbolleiste klicken. Alle Fenster schließen wählen oder auf das Symbol Weitere Informationen Allgemeine Optionen und Umgebungsoptionen [Seite 53] 3.8 Lokale Objektbibliothek Die lokale Objektbibliothek bietet Zugriff auf wiederverwendbare Objekte. Diese Objekte umfassen integrierte Systemobjekte wie Transformationen sowie die von Ihnen angelegten und gespeicherten Objekte wie Datastores, Jobs, Datenflüsse und Workflows. Die lokale Objektbibliothek ist ein Fenster zu Ihrem lokalen Repository und macht den direkten Zugriff auf das Repository überflüssig. Die Aktualisierungen des Repositorys erfolgen über normale Softwareoperationen. Wenn Sie die von Ihnen angelegten Objekte speichern, werden sie zum Repository hinzugefügt. Greifen Sie über die lokale Objektbibliothek auf gespeicherte Objekte zu. Um die Position der Objektbibliothek zu steuern, klicken Sie mit der rechten Maustaste auf den grauen Rahmen, und wählen Sie Andockbar oder heben die Auswahl auf, oder wählen Sie im Menü Ausblenden. ● Wenn Sie Andockbar wählen, können Sie auf die Objektbibliothek klicken, sie an einen Rand innerhalb des Designer-Fensters ziehen und dort verankern bzw. die Verankerung lösen. Wenn Sie die Objektbibliothek vom Rand des Designer-Fensters wegziehen, bleibt sie unverankert. Um rasch zwischen den letzten verankerten bzw. unverankerten Positionen zu wechseln, doppelklicken Sie auf den grauen Rahmen. Wenn Sie die Auswahl von Andockbar aufheben, können Sie auf die Objektbibliothek klicken und sie an eine beliebige Position auf Ihrem Bildschirm ziehen, sie wird dann nicht im Designer-Fenster verankert. ● Wenn Sie Ausblenden wählen, verschwindet die Objektbibliothek aus dem Designer-Fenster. Um die Objektbibliothek wieder einzublenden, klicken Sie auf das entsprechende Symbol in der Symbolleiste. Weitere Informationen zum zentralen gegenüber dem lokalen Repository in einer Mehrbenutzerumgebung finden Sie im Designer-Handbuch. 3.8.1 Öffnen der Objektbibliothek Über die Objektbibliothek können Sie auf Objekttypen zugreifen. Wählen Sie Extras Symbolleiste. Objektbibliothek , oder klicken Sie auf das Symbol der Objektbibliothek in der Die Tabelle enthält die Tabs, auf denen der Objekttyp in der Objektbibliothek angezeigt wird, sowie die Beschreibungen des Kontexts, in dem Sie den jeweiligen Objekttyp verwenden können. Designer-Handbuch Designer-Benutzeroberfläche PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 39 Tabelle 18: Tab Beschreibung Projekte sind Jobsätze, die zu einem bestimmten Zeitpunkt verfügbar sind. Jobs sind ausführbare Workflows. Es gibt zwei Jobtypen: Batch-Jobs und Echtzeitjobs. Mit Workflows werden Datenflüsse und die Operationen sortiert, die Datenflüsse unterstützen, indem deren gegenseitige Abhängigkeiten definiert werden. In Datenflüssen wird die Verarbeitung einer Aufgabe beschrieben. Mit Transformationen werden Daten bearbeitet und Ausgabe-Datasets von den Quellen er zeugt, die Sie angeben. In der Objektbibliothek werden sowohl integrierte als auch benutzer definierte Transformationen aufgeführt. Datastores stellen Verbindungen zu Datenbanken und Anwendungen dar, die in Ihrem Projekt verwendet werden. Unter jedem Datastore befindet sich eine Liste der in die Software import ierten Tabellen, Dokumente und Funktionen. Formate beschreiben die Struktur eines Flatfiles, einer XML-Datei oder XML-Meldung. Benutzerdefinierte Funktionen sind in der Skriptsprache der Software geschriebene Funktio nen. Sie können diese in Ihren Jobs verwenden. 3.8.2 Anzeigen des Namens und des Symbols jedes Tabs 1. Vergrößern Sie das Fenster der Objektbibliothek, bis die Namen angezeigt werden. oder 2. Halten Sie den Cursor über den Tab, bis die QuickInfo für den Tab angezeigt wird. 3.8.3 Sortieren von Spalten in der Objektbibliothek Klicken Sie auf die Spaltenüberschrift. Sie können Datenflüsse beispielsweise sortieren, indem Sie einmal auf die Überschrift der Spalte Datenfluss klicken. Die Namen werden in aufsteigender Reihenfolge sortiert. Um die Namen in absteigender Reihenfolge zu sortieren, klicken Sie erneut auf die Überschrift der Spalte Datenfluss. 40 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Designer-Benutzeroberfläche 3.9 Objekteditoren Der Editor zeigt das Eingabe- und Ausgabeschema für das Objekt sowie die Optionen für das Objekt an. Klicken Sie im Arbeitsbereich auf den Namen des Objekts, um seinen Editor zu öffnen. Wenn sehr viele Optionen vorhanden sind, werden sie im Editor nach Gruppen auf Tabs angeordnet. Ein Schema ist eine Datenstruktur, die Spalten, andere verschaltete Schemas und Funktionen enthalten kann. (Die Inhalte werden als Schemaelemente bezeichnet.) Eine Tabelle ist ein Schema, das nur Spalten enthält. Mit dem Editor können Sie folgende Funktionen ausführen: ● Vorherige im Fenster durchgeführte Aktionen rückgängig machen oder wiederholen (klicken Sie mit der rechten Maustaste, und wählen Sie Rückgängig oder Wiederholen aus). ● Nach einer Zeichenfolge im Editor suchen (klicken Sie mit der rechten Maustaste, und wählen Sie Suchen aus). ● Spaltennamen per Drag-und-Drop aus dem Eingabeschema in die betreffenden Optionsfelder ziehen. ● Farben verwenden, um Zeichenfolgen und Kommentare in Textfeldern zu markieren, in denen Sie Ausdrücke bearbeiten können (Schlüsselwörter werden blau angezeigt, Zeichenfolgen werden in Anführungszeichen gesetzt und rosa angezeigt, Kommentar beginnen mit einer Raute und werden grün angezeigt). Hinweis Sie können keine Kommentare zu einer Zuordnungsklausel in einer Query hinzufügen. Wenn Sie Kommentare hinzufügen, wird der Job nicht ausgeführt, und Sie können ihn nicht erfolgreich exportieren. Verwenden Sie alternativ die Objektbeschreibung oder die Arbeitsbereichsannotation. Die folgende Syntax würde beispielsweise auf dem Tab „Zuordnung“ nicht unterstützt werden: table.column # comment Weitere Informationen Abfrageeditor [Seite 185] Data-Quality-Transformationseditoren [Seite 189] 3.10 Arbeiten mit Objekten Informationen über allgemeine Aufgaben, die Sie beim Arbeiten mit Objekten im Designer ausführen. Bei diesen Aufgaben verwenden Sie verschiedene Teile des Designers – die Symbolleiste, die Toolpalette, den Arbeitsbereich und die lokale Objektbibliothek. Designer-Handbuch Designer-Benutzeroberfläche PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 41 3.10.1 Arbeiten mit neuen wiederverwendbaren Objekten Sie können wiederverwendbare Objekte in der Objektbibliothek oder mithilfe der Toolpalette anlegen. Nachdem Sie ein Objekt angelegt haben, können Sie mit dem Objekt arbeiten, seine Definitionen bearbeiten und anderen Objekten Aufrufe hinzufügen. Weitere Informationen Wiederverwendbare Objekte [Seite 23] 3.10.1.1 Anlegen eines wiederverwendbaren Objekts in der Objektbibliothek Sie können ein wiederverwendbares Objekt in der Objektbibliothek anstatt unter Verwendung der Toolpalette anlegen. 1. Wählen Sie zum Öffnen der Objektbibliothek Tools Objektbibliothek . 2. Klicken Sie auf den dem Objekttyp entsprechenden Tab. 3. Klicken Sie an einer beliebigen Stelle, jedoch nicht auf den vorhandenen Objekten, mit der rechten Maustaste, und wählen Sie Neu. 4. Klicken Sie mit der rechten Maustaste auf das neue Objekt, und wählen Sie Eigenschaften aus. Geben Sie Optionen wie einen Namen und eine Beschreibung ein, um das Objekt zu definieren. 3.10.1.2 Anlegen eines wiederverwendbaren Objekts über die Toolpalette Sie können die meisten in der Software definierten Objekte über die Toolpalette wiederverwenden und replizieren. 1. Klicken Sie in der Toolpalette mit der linken Maustaste auf das Symbol für das Objekt, das Sie anlegen möchten. 2. Setzen Sie den Cursor auf den Arbeitsbereich, und klicken Sie erneut mit der linken Maustaste. Das Objektsymbol wird an der Stelle im Arbeitsbereich angezeigt, auf die Sie geklickt haben. 3.10.2 Hinzufügen eines vorhandenen Objekts Fügen Sie ein vorhandenes Objekt hinzu, oder legen Sie einen neuen Aufruf für ein vorhandenes Objekt an. 1. Wählen Sie zum Öffnen der Objektbibliothek 42 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Tools Objektbibliothek . Designer-Handbuch Designer-Benutzeroberfläche 2. Klicken Sie auf den dem Objekttyp entsprechenden Tab. 3. Wählen Sie ein Objekt aus. 4. Ziehen Sie das Objekt auf den Arbeitsbereich. Hinweis Objekte, die auf den Arbeitsbereich gezogen werden, müssen der hierarchischen Logik entsprechen. So können Sie z.B. einen Datenfluss auf einen Job ziehen, aber einen Workflow nicht auf einen Datenfluss. Weitere Informationen Objekthierarchie [Seite 24] 3.10.3 Öffnen einer Objektdefinition Die Optionen, von denen die Operation eines Objekts beschrieben wird und die beim Öffnen eines Objekts im Arbeitsbereich angezeigt werden können. Sie haben zwei Möglichkeiten, um die Definition eines Objekts zu öffnen: 1. Klicken Sie im Arbeitsbereich auf den Objektnamen. Es wird ein leerer Arbeitsbereich geöffnet, in dem Sie das Objekt definieren. 2. Klicken Sie im Projektbereich auf das Objekt. Sie können mithilfe anderer Objekte ein Objekt definieren. Wenn Sie beispielsweise auf den Namen eines BatchDatenflusses klicken, wird ein neuer Arbeitsbereich geöffnet, in dem Sie Quellen, Ziele und Transformationen zusammenstellen können, aus denen der eigentliche Datenfluss besteht. 3.10.4 Ändern von Objektnamen Sie können den Namen eines Objekts im Arbeitsbereich oder in der Objektbibliothek ändern. Sie können auch eine Kopie des vorhandenen Objekts anlegen. Hinweis Die Namen von integrierten Objekten können nicht geändert werden. 1. So ändern Sie den Namen eines Objekts im Arbeitsbereich a. Klicken Sie auf das Objekt im Arbeitsbereich, um es auszuwählen. b. Klicken Sie mit der rechten Maustaste, und wählen Sie Umbenennen. c. Bearbeiten Sie den Text im Textfeld "Name". d. Klicken Sie außerhalb des Textfelds, oder drücken Sie die Eingabetaste, um den neuen Namen zu speichern. Designer-Handbuch Designer-Benutzeroberfläche PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 43 2. So ändern Sie den Namen eines Objekts in der Objektbibliothek a. Wählen Sie das Objekt in der Objektbibliothek aus. b. Klicken Sie mit der rechten Maustaste, und wählen Sie Eigenschaften. c. Bearbeiten Sie den Text im ersten Textfeld. d. Klicken Sie auf OK. 3. So kopieren Sie ein Objekt a. Wählen Sie das Objekt in der Objektbibliothek aus. b. Klicken Sie mit der rechten Maustaste und wählen Replizieren. c. Es wird eine Kopie des Objekts auf oberster Ebene (jedoch nicht von den von diesem aufgerufenen Objekten) angelegt und ein neuer Name für das Objekt vergeben, den Sie bearbeiten können. 3.10.5 Hinzufügen, Ändern und Anzeigen von Objekteigenschaften Sie können die Eigenschaften eines Objekts auf dessen Eigenschaftenseite hinzufügen, anzeigen und in manchen Fällen ändern. 1. Wählen Sie das Objekt in der Objektbibliothek aus. 2. Klicken Sie mit der rechten Maustaste, und wählen Sie Eigenschaften. Der Tab Allgemein des Fensters Eigenschaften wird geöffnet. 3. Füllen Sie die Eigenschaftenblätter aus. Die Eigenschaftenblätter variieren nach Objekttyp, jedoch sind „Allgemein“, „Attribute“ und „Klassenabttribute“ die am häufigsten auftretenden und werden in den folgenden Abschnitten beschrieben. 4. Wenn Sie fertig sind, klicken Sie auf OK, um die an den Objekteigenschaften vorgenommenen Änderungen zu speichern und das Fenster zu schließen. Sie können stattdessen auch auf Anwenden klicken, um die Änderungen zu speichern, ohne das Fenster zu schließen. 3.10.5.1 Allgemein (Tab) Ermöglicht Ihnen, den Objektnamen zu ändern und die Objektbeschreibung einzugeben oder zu bearbeiten. Der Tab Allgemein enthält zwei Hauptobjekteigenschaften: Name und Beschreibung. Außerdem können Sie Objekten, die nur einmal oder wiederholt verwendet werden, Objektbeschreibungen hinzufügen. Beachten Sie, dass sich Objektbeschreibungen ein- und ausblenden lassen, indem Sie mit der rechten Maustaste auf das jeweilige Objekt im Arbeitsbereich klicken und Aktivierte Beschreibungen anzeigen aktivieren/ deaktivieren. Je nach Objekt können unterschiedliche Eigenschaften auf dem Tab Allgemein angezeigt werden. Beispiele: ● Nur einmal ausführen ● Als Einheit wiederherstellen ● Parallelitätsgrad 44 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Designer-Benutzeroberfläche ● Datenbankverknüpfungen verwenden ● Cachetyp ● Überspringen Weitere Informationen Performance Optimization Guide: Using Caches Verknüpfte Datastores [Seite 88] Performance Optimization Guide: Using Parallel Execution Wiederherstellungsmechanismen [Seite 650] Anlegen und Definieren von Datenflüssen [Seite 156] 3.10.5.2 Attribute (Tab) Ermöglicht Ihnen, den Attributen des aktuellen Objekts Werte zuzuweisen. Um einem Attribut einen Wert zuzuweisen, wählen Sie das Attribut aus, und geben Sie den Wert unten im Fenster in das Feld Wert ein. Einige Attributwerte sind vorbelegt und können nicht bearbeitet werden. Wenn Sie ein Attribut mit einem vom System definierten Wert auswählen, steht das Feld Wert nicht zur Verfügung. 3.10.5.3 Klassenattribute (Tab) Zeigt die für den Typ des ausgewählten Objekts verfügbaren Attribute an. Alle Datenflussobjekte haben beispielsweise dieselben Klassenattribute. Um ein neues Attribut für eine Klasse von Objekten anzulegen, klicken Sie mit der rechten Maustaste auf die Attributliste und wählen Hinzufügen aus. Das neue Attribut ist nun für alle Objekte dieser Klasse verfügbar. Um ein Attribut zu löschen, wählen Sie das Attribut aus, klicken dann mit der rechten Maustaste und wählen Löschen aus. Die von Data Services vordefinierten Klassenattribute können nicht gelöscht werden. 3.10.6 Anlegen von Beschreibungen Verwenden Sie Beschreibungen, um Objekte zu dokumentieren. Sie können Beschreibungen in Arbeitsbereichsdiagrammen anzeigen. Daher sind Beschreibungen geeignet, um Kommentare zu Arbeitsbereichsobjekten hinzuzufügen. Designer-Handbuch Designer-Benutzeroberfläche PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 45 Eine Beschreibung ist mit einem bestimmten Objekt verknüpft. Beim Import oder Export dieses RepositoryObjekts (z.B. bei der Migration zwischen Entwicklung, Test und Produktivumgebungen) können Sie auch dessen Beschreibung importieren und exportieren. Der Designer bestimmt, wann Objektbeschreibungen auf einer Systemebeneneinstellung bzw. einer Objektebeneneinstellung angezeigt werden. Beide Einstellungen müssen aktiviert sein, um die Beschreibung für ein bestimmtes Objekt anzuzeigen. Die Systemebeneneinstellung ist eindeutig für Ihre Konfiguration. Die Systemebeneneinstellung ist standardmäßig deaktiviert. Um die Systemebeneneinstellung zu aktivieren, wählen Sie AnzeigenAktivierte Beschreibungen, oder klicken Sie in der Symbolleiste auf die Schaltfläche Aktivierte Beschreibungen anzeigen. Die Objektebeneneinstellung wird zusammen mit dem Objekt im Repository gespeichert. Die Objektebeneneinstellung ist auch standardmäßig deaktiviert, sofern Sie keine Beschreibung vom Arbeitsbereich hinzufügen oder bearbeiten. Um die Objektebeneneinstellung zu aktivieren, klicken Sie mit der rechten Maustaste auf das Objekt und wählen Objektbeschreibung aktivieren. Eine Ellipse nach dem Text in einer Beschreibung zeigt an, dass mehr Text vorhanden ist. Um den gesamten Text anzuzeigen, ändern Sie die Größe der Beschreibung, indem Sie darauf klicken und daran ziehen. Beim Verschieben eines Objekts wird seine Beschreibung ebenfalls verschoben. Um zu sehen, welches Objekt mit welcher ausgewählten Beschreibung verbunden ist, schauen Sie sich den Namen des Objekts in der Statusleiste an. 3.10.6.1 Hinzufügen einer Beschreibung zu einem Objekt 1. Klicken Sie im Projektbereich oder in der Objektbibliothek mit der rechten Maustaste auf ein Objekt und wählen Eigenschaften. 2. Geben Sie Ihre Kommentare in das Textfeld Beschreibung ein. 3. Klicken Sie auf OK. Die Beschreibung des Objekts wird in der Objektbibliothek angezeigt. 3.10.6.2 Anzeigen einer Beschreibung im Arbeitsbereich 1. Wählen Sie im Projektbereich ein vorhandenes Objekt (wie z.B. einen Job) aus, das ein Objekt enthält, zu dem Sie eine Beschreibung hinzugefügt haben (wie z.B. einen Workflow). 2. Wählen Sie im Menü Anzeigen die Option Aktivierte Beschreibungen. Alternativ können Sie die Schaltfläche "Aktivierte Beschreibungen anzeigen" in der Symbolleiste auswählen. 3. Klicken Sie mit der rechten Maustaste auf den Workflow und wählen Objektbeschreibung aktivieren. Die Beschreibung wird im Arbeitsbereich unter dem Objekt angezeigt. 46 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Designer-Benutzeroberfläche 3.10.6.3 Hinzufügen einer Beschreibung zu einem Objekt im Arbeitsbereich 1. Wählen Sie im Menü Anzeigen die Option Aktivierte Beschreibungen. 2. Klicken Sie im Arbeitsbereich mit der rechten Maustaste auf ein Objekt und wählen Eigenschaften. 3. Geben Sie im Fenster "Eigenschaften" Text in das Feld Beschreibung ein. 4. Klicken Sie auf OK. Die Beschreibung wird automatisch im Arbeitsbereich angezeigt (und die Option Objektbeschreibung aktivieren des Objekts ist ausgewählt). 3.10.6.4 Ausblenden einer Objektbeschreibung 1. Klicken Sie im Arbeitsbereichsdiagramm mit der rechten Maustaste auf ein Objekt. Alternativ können Sie mehrere Objekte wie folgt auswählen: ○ Halten Sie die STRG-Taste gedrückt und wählen Sie die Objekte im Arbeitsbereichsdiagramm aus, und klicken Sie dann mit der rechten Maustaste auf eines der ausgewählten Objekte. ○ Ziehen Sie ein Auswahlfeld um alle auszuwählenden Objekte, und klicken Sie dann mit der rechten Maustaste auf die ausgewählten Objekte. 2. Deaktivieren Sie im Popup-Menü Objektbeschreibung aktivieren. Die Beschreibung des ausgewählten Objekts wird ausgeblendet, und zwar auch dann, wenn die Option Aktivierte Beschreibungen anzeigen markiert ist, da der Objektebenenschalter den Systemebenenschalter außer Kraft setzt. 3.10.6.5 Bearbeiten von Objektbeschreibungen 1. Doppelklicken Sie im Arbeitsbereich auf eine Objektbeschreibung. 2. Geben Sie Text in die Beschreibung ein, schneiden Sie Text aus, kopieren oder fügen Sie Text in die Beschreibung ein. 3. Wählen Sie im Menü Projekt die Option Speichern. Alternativ können Sie mit der rechten Maustaste auf ein Objekt klicken und "Eigenschaften" auswählen, um das Fenster Eigenschaften des Objekts zu öffnen und eine Beschreibung zum Objekt hinzuzufügen oder zu bearbeiten. Hinweis Beim Versuch, die Beschreibung eines wiederverwendbaren Objekts zu bearbeiten, wird ein Alert ausgegeben, der besagt, dass die Beschreibung für jede Instanz des Objekts über alle Jobs hinweg aktualisiert wird. Wenn dieser Alert nicht mehr angezeigt werden soll, aktivieren Sie das Kontrollkästchen Diese Meldung beim nächsten Mal nicht anzeigen. Nachdem Sie den Alert deaktiviert haben, können Sie ihn nur erneut aktivieren, indem Sie sich an den technischen Support wenden. Designer-Handbuch Designer-Benutzeroberfläche PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 47 3.10.7 Anlegen von Annotationen Annotationen beschreiben einen Fluss, einen Teil eines Flusses oder ein Diagramm in einem Arbeitsbereich. Die Annotation ist mit dem jeweiligen Job, dem Workflow oder dem Datenfluss verknüpft. Beim Import oder Export dieses Jobs, Workflows oder Datenflusses werden die damit verknüpften Annotationen ebenfalls importiert oder exportiert. 3.10.7.1 Annotieren von Arbeitsbereichsdiagrammen 1. Öffnen Sie das zu annotierende Arbeitsbereichsdiagramm Sie können Annotationen zum Beschreiben eines beliebigen Arbeitsbereichs wie z.B. eines Jobs, eines Workflows, eines Datenflusses, einer Catch-, bedingten oder While-Schleife, verwenden. 2. Klicken Sie in der Toolpalette auf das Annotationssymbol. 3. Klicken Sie auf eine Stelle im Arbeitsbereich, um die Annotation einzufügen. Es wird eine Annotation im Diagramm angezeigt. Sie können Text direkt in die Annotation einfügen, dort bearbeiten oder daraus löschen. Sie können auch die Größe der Annotation ändern und sie verschieben, indem Sie darauf klicken und daran ziehen. Einem Diagramm kann eine beliebige Anzahl an Annotationen hinzugefügt werden. 3.10.7.2 Löschen von Annotationen 1. Klicken Sie mit der rechten Maustaste auf die Annotation. 2. Wählen Sie Löschen. Sie können auch eine Annotation auswählen und die Löschtaste drücken. 3.10.8 Kopieren von Objekten Objekte können ausgeschnitten oder kopiert und dann an einer gültigen Stelle im Arbeitsbereich eingefügt werden. Es besteht die Möglichkeit, mehrere Objekte innerhalb desselben oder zwischen anderen Datenflüssen, Workflows oder Jobs zu kopieren und einzufügen. Außerdem können Aufrufe von Datenflüssen und Workflows ausgeschnitten oder kopiert und dann in gültige Objekte im Arbeitsbereich eingefügt werden. Referenzen auf globale und lokale Variablen, Parameter und Ersatzparamter werden kopiert. Allerdings müssen diese innerhalb ihrer neuen Kontexte definiert werden. 48 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Designer-Benutzeroberfläche Hinweis Beim Einfügen werden die ausgewählten Objekte in einem Fluss dupliziert, allerdings noch immer die ursprünglichen Objekte aufgerufen. Dies bedeutet also, dass beim Einfügen das ursprüngliche Objekt an einer anderen Stelle verwendet wird. Beim Replizieren wird ein neues Objekt in der Objektbibliothek angelegt. So werden Objekte ausgeschnitten oder kopiert und dann eingefügt: 1. Wählen Sie im Arbeitsbereich die Objekte aus, die Sie ausschneiden oder kopieren möchten. Sie können mehrere Objekte mit Strg+Klicken, Umschalt+Klicken oder Strg+A auswählen. 2. Klicken Sie mit der rechten Maustaste, und wählen Sie entweder Ausschneiden oder Kopieren aus. 3. Klicken Sie innerhalb desselben Flusses, oder wählen Sie einen anderen Fluss aus. Klicken Sie mit der rechten Maustaste, und wählen Sie Einfügen aus. Bei Bedarf werden automatisch neue Namen generiert, um Namenskonflikte zu vermeiden. Hinweis Die Objekte werden an der ausgewählten Stelle eingefügt, wenn Sie mit der rechten Maustaste klicken und Einfügen auswählen. Die Objekte werden in der oberen linken Ecke des Arbeitsbereichs eingefügt, wenn Sie sie mit einer der folgenden Methoden einfügen: ○ Sie klicken auf das Symbol Einfügen. ○ Klicken Sie auf Bearbeiten Einfügen . ○ Sie verwenden das Tastaturkürzel Strg+V. Wenn Sie eine Methode verwenden, bei der die Objekte in der oberen linken Ecke eingefügt werden, werden alle nachfolgend eingefügten Objekte übereinander abgelegt. 3.10.9 Speichern und Löschen von Objekten Das Speichern eines Objekts in der Software bedeutet, dass die Sprache, mit der das Objekt beschrieben wird, im Repository hinterlegt wird. Sie können wiederverwendbare Objekte speichern; einmal verwendbare Objekte werden nur im Rahmen der Definition des wiederverwendbaren Objekts, das sie aufruft, gespeichert. Sie können Änderungen an dem aktuell im Arbeitsbereich geöffneten wiederverwendbaren Objekt speichern. Beim Speichern des Objekts werden die Objekteigenschaften, die Definitionen aller einmal verwendbaren Objekte, die es aufruft, und alle Aufrufe anderer wiederverwendbarer Objekte im Repository aufgezeichnet. Der Inhalt der enthaltenen wiederverwendbaren Objekte wird nicht gespeichert; nur der Aufruf wird gespeichert. Die Software speichert die Beschreibung auch dann, wenn das Objekt nicht vollständig ist oder einen Fehler enthält (es erfolgt keine Validierung). Designer-Handbuch Designer-Benutzeroberfläche PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 49 3.10.9.1 Speichern von Änderungen an einem einzelnen wiederverwendbaren Objekt 1. Öffnen Sie das Projekt, in dem das gewünschte Objekt enthalten ist. 2. Wählen Sie Projekt Speichern . Mit diesem Befehl werden alle im Arbeitsbereich geöffneten Objekte gespeichert. Wiederholen Sie diese Schritte bei allen anderen Einzelobjekten, die Sie speichern möchten. 3.10.9.2 Speichern aller geänderten Objekte im Repository 1. Wählen Sie Projekt Alles speichern . Daraufhin werden die wiederverwendbaren Objekte aufgeführt, die seit der letzten Speicherung geändert wurden. 2. (Optional) Heben Sie die Auswahl aller aufgeführter Objekte auf, die nicht gespeichert werden sollen. 3. Klicken Sie auf OK. Hinweis Sie werden aufgefordert, alle Objekte mit Änderungen zu speichern, wenn Sie einen Job ausführen und wenn Sie den Designer beenden. Beim Speichern eines wiederverwendbaren Objekts werden alle darin enthaltenen Objekte für die einmalige Verwendung gespeichert. 3.10.9.3 Löschen einer Objektdefinition aus dem Repository 1. Wählen Sie in der Objektbibliothek das Objekt aus. 2. Klicken Sie mit der rechten Maustaste, und wählen Sie Löschen. ○ Wenn Sie versuchen, ein gerade verwendetes Objekt zu löschen, wird eine Warnmeldung ausgegeben, und Sie haben die Möglichkeit, die Funktion Verwendungsort anzeigen zu verwenden. ○ Wenn Sie Ja wählen, markiert die Software alle Aufrufe zu dem Objekt mit einem roten „Gelöscht“Symbol als Hinweis darauf, dass die Aufrufe ungültig sind. Sie müssen diese Aufrufe entfernen oder ersetzen, um einen ausführbaren Job zu erzeugen. Hinweis Integrierte Objekte, wie Transformationen, können aus der Objektbibliothek nicht gelöscht werden. 50 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Designer-Benutzeroberfläche Weitere Informationen Verwenden von "Verwendungsort anzeigen" [Seite 609] 3.10.9.4 Löschen eines Objektaufrufs 1. Öffnen Sie das Objekt, das den zu löschenden Aufruf enthält. 2. Klicken Sie mit der rechten Maustaste auf das Objekt, und wählen Sie Löschen. Wenn Sie ein wiederverwendbares Objekt aus dem Arbeitsbereich oder dem Projektbereich löschen, wird nur der Objektaufruf gelöscht. Die Objektdefinition bleibt in der Objektbibliothek erhalten. 3.10.10 Suchen nach Objekten Sie können innerhalb der Objektbibliothek nach Objekten suchen, die in einem Repository definiert wurden oder nach Objekten, die über einen Datastore verfügbar sind. 1. Klicken Sie mit der rechten Maustaste in der Objektbibliothek und wählen Suchen. Das Fenster Suchen wird angezeigt. 2. Geben Sie die entsprechenden Werte für die Suche ein. Die im Fenster Suchen verfügbaren Optionen werden im Folgenden im Detail beschrieben. 3. Klicken Sie auf Suchen. Die mit Ihren Einträgen übereinstimmenden Objekte werden im Fenster aufgeführt. Eine Statuszeile am unteren Rand des Fensters Suchen zeigt an, wo die Suche durchgeführt wurde (lokal oder zentral), wie viele Elemente insgesamt gefunden wurden und wie viel Zeit die Suche in Anspruch genommen hat. Im Suchergebnisfenster sind die folgenden Optionen über das Kontextmenü verfügbar: ○ Ein Element öffnen ○ Externe Tabellen als Repository-Metadaten importieren ○ Die Suchergebnisse mit der Option Speichern unter in eine CSV-Datei exportieren ○ Verwendungsort anzeigen, um die übergeordneten Objekte im Fenster Ausgabe anzuzeigen. ○ Das Objekt mit der Option In Bibliothek suchen in der lokalen oder Zentralbibliothek auswählen ○ Eigenschaften, um die Attribute anzuzeigen Sie können Objekte auch aus dem Suchergebnisfenster ziehen und an einem gewünschten Ort ablegen. Das Fenster Suchen enthält folgende Optionen: Designer-Handbuch Designer-Benutzeroberfläche PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 51 Tabelle 19: Option Beschreibung Suchen in Gibt den Suchbereich an. Wählen Sie ein Repository oder einen bestimmten Datastore. Wenn Sie einen Datastore angeben, können Sie außerdem die importierten Daten durchsu chen (Interne Daten) oder den gesamten Datastore (Externe Daten). Sie können auch das Lokale Repository oder das Zentrale Repository durchsuchen. Objekttyp Der zu suchende Objekttyp. Wählen Sie beim Durchsuchen des Repositorys aus Tabellen, Dateien, Datenflüssen, Workf lows, Jobs, Hierarchien, IDOCs und Domänen aus. Wählen Sie beim Durchsuchen eines Datastore oder einer Anwendung aus den über den Data store zur Verfügung gestellten Objekttypen aus. Name Sucht eine Textzeichenfolge im Namen des Objekts. Bei der Suche im Repository wird beim Namen nicht zwischen Groß- und Kleinschreibung un terschieden. Wenn bei der Suche in einem Datastore für den Namen zwischen Groß- und Kleinschreibung unterschieden wird, geben Sie den Namen so ein, wie er in der Datenbank oder in der Anwendung angezeigt wird, und schließen Sie den Namen in Anführungszeichen (") ein, um die Schreibweise (Groß-/Kleinschreibung) beizubehalten. Sie können festlegen, ob die zu suchende Information den angegebenen Namen Enthält oder ob sie diesem Entspricht, indem Sie auf das Drop-Down-Feld neben dem Feld Name klicken. Beschreibung Sucht eine Textzeichenfolge in der Beschreibung des Objekts. In das Repository importierte Objekte enthalten eine Beschreibung von ihrer Quelle. Im Designer angelegte Objekte enthalten standardmäßig keine Beschreibung, sofern Sie keine hinzufügen. Die Suche gibt Objekte zurück, deren Beschreibungsattribut den eingegebenen Wert enthält. Alle durchsuchen Sucht eine Textzeichenfolge in allen Teilen des Objekts. Für Jobs wird im Job selbst und in jedem Jobelement gesucht. (Enthält ist die einzige Suchop tion für die Option.) Das Suchfenster enthält auch eine Schaltfläche Erweitert, über die Sie nach Objekten basierend auf ihren Attributwerten suchen können. Die Suche nach Attributwerten ist nur bei der Suche im Repository möglich. Die Schaltfläche Erweitert bietet folgende Optionen: Tabelle 20: Option Beschreibung Attribut Das Objektattribut, in dem gesucht werden soll. Wert Der zu suchende Attributwert. 52 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Designer-Benutzeroberfläche Option Beschreibung Übereinstimmung Der Typ der durchgeführten Suche. Wählen Sie Enthält, um nach einem Attribut zu suchen, das den angegebenen Wert enthält. Wählen Sie Entspricht, um nach einem Attribut zu suchen, das ausschließlich den angegebe nen Wert enthält. Weitere Informationen Verwenden von "Verwendungsort anzeigen" [Seite 609] 3.11 Allgemeine Optionen und Umgebungsoptionen Zeigt Optionsgruppen für Designer-, Daten- und Jobserver-Optionen an. Um das Fenster Optionen zu öffnen, wählen Sie Tools Optionen . Klappen Sie die Optionen auf, indem Sie auf das Plusymbol klicken. Wenn Sie eine Optionsgruppe oder Option wählen, wird auf der rechten Seite eine Beschreibung angezeigt. 3.11.1 Designer – Umgebung Sie können die Standardeinstellungen für Metadaten-Reporting und Jobserver sowie die Einstellungen des Kommunikationsports für den Designer ändern. Tabelle 21: Standardadministrator für Metadatenberichte Option Beschreibung Administrator Wählen Sie den Administrator aus, den das Metadaten-Berichtstool verwendet. Ein Administrator ist durch Hostname und Port definiert. Tabelle 22: Standardjobserver Option Beschreibung Aktuell Zeigt den aktuellen Wert des Standardjobservers an. Neu Ermöglicht Ihnen die Auswahl eines neuen Werts für den Standardjobserver in einer Drop-DownListe mit den Jobservern, die diesem Repository zugeordnet sind. Änderungen werden sofort wirk sam. Ist ein Repository mehreren Jobservern zugeordnet, muss ein Jobserver als Standardjobserver definiert werden, der bei der Anmeldung zu verwenden ist. Designer-Handbuch Designer-Benutzeroberfläche PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 53 Hinweis Jobspezifische Optionen und Pfadnamen, die im Designer angegeben werden, beziehen sich auf den aktuellen Standardjobserver. Ändern Sie diese Optionen und Pfadnamen, wenn Sie den Standardjobserver ändern. Tabelle 23: Designer-Kommunikationsports Option Beschreibung Port für Jobserverkommunikation wird vom Designer festgelegt Ist diese Option aktiviert, legt der Designer automatisch einen verfügbaren Port für den Empfang von Meldungen vom aktuellen Jobserver fest. Standardmäßig ist diese Option aktiviert. Deaktivieren Sie die Option, um einen Überwachungsport oder -portbereich an zugeben. Von Geben Sie die Portnummern in die Textfelder für die Ports ein. Wenn Sie einen bestimm Bis ten Überwachungsport angeben möchten, geben Sie dieselbe Portnummer in die Textfel der Von und Bis für die Ports an. Änderungen werden erst wirksam, wenn Sie die Software erneut starten. Die Option ist nur aktiviert, wenn Sie das vorherige Steuerelement deaktivieren. Ermög licht Ihnen die Angabe eines Portbereichs, aus dem der Designer einen Überwachungsport auswählen kann. Möglicherweise empfiehlt es sich, den für die Kommunikation zwischen dem Designer und dem Jobserver verwendeten Port einzuschränken, wenn die beiden Komponenten durch eine Firewall getrennt sind. Interaktiver Debugger Ermöglicht Ihnen die Festlegung eines Kommunikationsports, den der Designer im DebugModus für die Kommunikation mit einem Jobserver verwenden kann. Servergruppe für lokales Repository Ist das lokale Repository, an dem Sie sich beim Öffnen des Designers angemeldet haben, einer Servergruppe zugeordnet, wird der Name der Servergruppe angezeigt. Weitere Informationen Ändern des Ports des interaktiven Debuggers [Seite 630] 3.11.2 Designer – Allgemein Sie können die Standardeinstellungen für häufig verwendete Optionen im Designer ändern. Tabelle 24: Option Beschreibung Datenstichprobengröße (Zeilen) anzeigen Steuert die Größe der Stichproben, die zur Anzeige der Daten in Quellen und Zielen in geö ffneten Datenflüssen im Arbeitsbereich verwendet werden. Zeigen Sie die Daten an, in dem Sie auf das Lupensymbol auf den Quell- oder Zielobjekten klicken. 54 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Designer-Benutzeroberfläche Option Beschreibung Anzahl der Zeichen im Namen des Arbeitsplatzsymbols Steuert die Länge der Objektnamen, die im Arbeitsbereich angezeigt werden. Die Objekt namen dürfen den Wert zwar überschreiten, allerdings zeigt der Designer nur die hier ein gegebene Anzahl von Zeichen an. Der Standardwert liegt bei 17 Zeichen. Maximale Anzahl der automatisch aufzuklappenden Schemastrukturelemente Die Anzahl der in der Schemastruktur angezeigten Anzahl von Elementen. Es dürfen nicht mehr Elementnamen als hier festgelegt angezeigt werden. Geben Sie eine Zahl für das Eingabeschema und für das Ausgabeschema ein. Der Standardwert ist 100. Standardparameter für Variablen mit demselben Namen Wenn Sie eine Variable auf Workflowebene deklarieren, übergibt die Software den Wert automatisch als Parameter mit demselben Namen an einen Datenfluss, der von einem Workflow aufgerufen wird. Domänen automatisch importieren Aktivieren Sie dieses Kontrollkästchen, um Domänen automatisch zu importieren, wenn eine Tabelle importiert wird, die diese referenziert. Job vor Jobausführung vollständig validieren Wenn aktiviert, führt die Software eine vollständige Jobvalidierung vor Ausführung des Jobs aus. Die Option ist standardmäßig deaktiviert. Wenn Sie diese Standardeinstellung beibehalten, sollten Sie den Entwurf vor Ausführung des Jobs manuell validieren. Überwachungssicht bei Jobausführung öffnen Wirkt sich auf das Verhalten des Designers aus, wenn Sie einen Job ausführen. Wenn diese Option aktiviert ist, schaltet der Designer den Arbeitsbereich während der Jobaus führung in die Überwachungssicht um. Ansonsten bleibt der Arbeitsbereich unverändert. Die Option ist standardmäßig aktiviert. Spaltenzuordnungen automatisch berechnen Ermittelt Informationen zu Zieltabellen und -spalten sowie zu den Quellen, anhand derer diese gefüllt werden. Diese Informationen werden für Metadatenberichte verwendet, bei spielsweise Auswirkungs- und Herkunfts-, automatische Dokumentations- und benutzer definierte Berichte. Spaltenzuordnungsinformationen werden nach der Speicherung eines Datenflusses oder nach dem Import von Objekten in ein Repository bzw. dem Export aus diesem in der Tabelle AL_COLMAP (Sicht ALVW_MAPPING) gespeichert. Wenn die Op tion aktiviert ist, sollten Sie unbedingt den gesamten Job vor seiner Speicherung validie ren, da die Spaltenzuordnungsberechnung empfindlich auf Fehler reagiert und Daten flüsse mit Validierungsproblemen überspringt. Nach Jobabschluss Dialogfenster anzeigen Mit dieser Option können Sie festlegen, ob Sie durch einen Alert informiert werden oder nur die Trace-Meldungen lesen möchten. Tabs im Arbeitsbereich anzeigen Mit dieser Option können Sie festlegen, ob die Tabs unten im Arbeitsbereich zur Naviga tion verwendet werden sollen. Einzelnes Fenster im Arbeitsbereich Ermöglicht die Anzeige nur eines Fensters im Arbeitsbereich (z.B. einen Job oder eine Transformation). Wenn Sie ein weiteres Fenster öffnen, wird das aktuelle Fenster ge schlossen und ein neues geöffnet. Startseite beim Start anzeigen Zeigt die Designer-Startseite an, wenn der Designer geöffnet wird. Beim Instanziieren Objektbeschreibung aktivieren Ermöglicht Elementbeschreibungen für Elemente, die Sie in Ihren Workflow/Datenfluss einfügen können (z.B. einen Reader oder eine Transformation, den bzw. die Sie in einen Job, Workflow oder Datenfluss einfügen können). Nicht ausführbare Elemente vom Export nach XML-Dokument ausschließen Schließt Elemente, die während der Jobausführung nicht verarbeitet wurden, aus XMLDokumenten aus. Anzeigekoordinaten des Designer-Arbeitsbereichs würden beispiels weise nicht exportiert werden. Weitere Informationen zum Tab „Verwendungsdaten aktualisieren“ finden Sie im Management-ConsoleHandbuch. Designer-Handbuch Designer-Benutzeroberfläche PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 55 Weitere Informationen Verwenden von "Daten anzeigen" [Seite 612] 3.11.3 Designer – Grafiken Sie können Ihren Arbeitsbereich individuell gestalten, indem Sie stilistische Elemente auswählen und in einer Vorschau anzeigen. Mit den nachfolgend beschriebenen Optionen können Sie Ihren Designarbeitsplatz für Jobs und Workflows mühelos von Ihrem Designarbeitsplatz für Datenflüsse unterscheiden. Tabelle 25: Option Beschreibung Arbeitsbereich-Flusstyp Wechseln Sie zwischen den beiden Arbeitsbereich-Flusstypen (Job/Workflow und Datenfluss) zur Anzeige von Standardeinstellungen. Mit den restlichen Optionen können Sie die Einstellungen für jeden Typ ändern. Linientyp Wählen Sie einen Stil für die Objektverbindungslinien. Linienstärke Legen Sie die Stärke der Verbindungslinien fest. Hintergrundstil Wählen Sie ein einfaches oder ein unterteiltes Hintergrundmuster für den ausge wählten Flusstyp. Farbschema Stellen Sie die Hintergrundfarbe auf "Blau", "Grau" oder "Weiß" ein. Navigationswasserzeichen verwenden Fügen Sie zum Hintergrund des ausgewählten Flusstyps eine Wasserzeichengrafik hinzu. Diese Option steht nur bei einem einfachen Hintergrundstil zur Verfügung. 3.11.4 Designer – Attributwerte Beim erneuten Import behält Data Services den bisherigen Wert für einige Tabellen- und Spaltenattribute bei. Sie können die Aktionen von Data Services beim erneuten Import für manche Attribute steuern: Tabelle 26: Attribut Objekttyp Beschreibung Unternehmensbeschreibung Spalte und Tabelle Eine Beschreibung auf Unternehmensebene einer Tabelle oder Spalte. Unternehmensname Spalte und Tabelle Ein logisches Feld. Dieses Attribut definiert Jobs und führt Jobs aus, die physische Daten extrahieren, transformieren und laden, während die Daten zum Unternehmensnamen un verändert bleiben. Inhaltstyp Spalte Definiert den Typ von Daten in einer Spalte. Beschreibung Spalte und Tabelle Beschreibung der Spalte oder Tabelle. Geschätzte_Zeilenanzahl Tabelle Eine Schätzung der Tabellengröße, die bei der Berechnung der Reihenfolge, in der Tabellen zur Ausführung von JoinOperationen gelesen werden, zum Einsatz kommt. 56 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Designer-Benutzeroberfläche Attribut Objekttyp Beschreibung Objektbezeichnung Spalte und Tabelle Eine Bezeichnung zur Beschreibung eines Objekts. Tabellenverwendung Tabelle Mit dieser Bezeichnung kann u.a. eine Tabelle als Fakt oder Dimension gekennzeichnet werden. 3.11.5 Designer – Verbindungen des zentralen Repositorys Das zentrale Repository enthält eine gemeinsame Objektbibliothek, in der die Entwickler Objekte in die lokalen Repositorys ein- und wieder auschecken können. Mit diesen Optionen können Sie die Standardverbindungseinstellungen definieren. Tabelle 27: Optionen Beschreibung Verbindungen des zentralen Repositorys Zeigt die Verbindungen des zentralen Repositorys und das ak tive zentrale Repository an. Um ein zentrales Repository zu aktivieren, klicken Sie mit der rechten Maustaste auf eine der aufgelisteten Verbindungen des zentralen Repositorys, und wählen Sie Aktivieren aus. Automatisch reaktivieren Wählen Sie aus, ob das aktive zentrale Repository jedes Mal reaktiviert werden soll, wenn Sie sich mit dem aktuellen loka len Repository in der Software anmelden. 3.11.6 Designer – Sprache Diese Optionen bieten Ihnen neben dem Standardgebietsschema Englisch weitere Gebietsschemas, um die Benutzeroberfläche von Data Services und alle Texte, die auf der Benutzeroberfläche generiert werden, in anderen Sprachen anzuzeigen. Sie können sowohl für die Benutzeroberfläche als auch für die angezeigten Daten das Gebietsschema auswählen. Tabelle 28: Option Beschreibung Produktgebietsschema Legt die Sprache für die Benutzeroberfläche und alle Produktmeldungen fest. Bevorzugtes Anzeigegebietsschema Legt das Anzeigegebietsschema fest, in dem die Benutzerdaten angezeigt werden sollen. Beispielsweise sollte das Datumsformat im bevorzugten An zeigegebietsschema angezeigt werden. 3.11.7 Designer – SSL Standardmäßig werden die Pfade für das SSL-Zertifikat und die Schlüsseldateien während der Installation automatisch konfiguriert. Sie müssen sie nur ändern, wenn Sie Ihre eigenen Zertifikate verwenden möchten. Designer-Handbuch Designer-Benutzeroberfläche PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 57 Hinweis Wenn Sie andere SSL-Optionen als SSL-Protokoll für Profiler verwenden ändern, müssen Sie den Designer und alle Data-Services-Server neu starten. Tabelle 29: Option Beschreibung Serverzertifikatsdatei Der Pfad zur Serverzertifikatsdatei. Das Serverzertifikat muss das PEM-Format aufweisen. Serverdatei mit privatem Schlüssel Der Pfad zur Serverdatei mit privatem Schlüssel. Server-Kennwortdatei mit privatem Schlüssel verwenden Wenn Sie eine Kennwortdatei mit privatem Schlüssel verwen den möchten, wählen Sie diese Option, und geben Sie den Speicherort der Kennwortdatei an. Ordner für vertrauenswürdige Zertifikate Geben Sie den Speicherort des Ordners für vertrauenswür dige Zertifikate an. Gültige Erweiterungen für Zertifikate im Ordner für vertrauenswürdige Zertifikate umfassen .pem, .crt und .cer. Unabhängig von der Dateinamenerweiterung muss der gesamte Inhalt der Zertifikatdateien das PEM-Format auf weisen. SSL-Protokoll für Profiler verwenden Wählen Sie diese Option, wenn Sie das SSL-Protokoll für die Kommunikation zwischen dem Designer und dem ProfilerServer verwenden möchten. 3.11.8 Daten – Allgemein Verwenden Sie die Optionen im Fenster „Daten“ – „Allgemein“, um die Standarddatenoptionen in der Software festzulegen. Folgende Optionen sind verfügbar: 58 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Designer-Benutzeroberfläche Tabelle 30: Option Beschreibung Jahr des Jahrhundertwechsels Gibt an, wie bei zweistelligen Jahresangaben das Jahrhundert interpretiert wird. Zweistellige Jahre größer oder gleich die sem Wert werden als 19## interpretiert. Zweistellige Jahre kleiner als dieser Wert werden als 20## interpretiert. Der Standardwert ist 15. Wenn Jahr des Jahrhundertwechsels beispielsweise auf den Wert "15" gesetzt ist: Tabelle 31: Leerschritte für Oracle-Bulkloader in NULL-Werte konvertieren 3.11.9 Zweistelliges Jahr Interpretiert als 99 1999 16 1916 15 1915 14 2014 Konvertiert Leerschritte in NULL-Werte, wenn Daten mit dem Oracle-Bulkloader-Hilfsprogramm geladen werden und: ● die Spalte nicht Bestandteil des Primärschlüssels ist, ● die Spalte auf Null gesetzt werden kann. Jobserver – Umgebung Data Services nutzt Prozesse und Threads zum Ausführen von Jobs, die Daten aus Quellen extrahieren, Daten umwandeln und in ein Data Warehouse laden. Die Anzahl gleichzeitig verarbeiteter Prozesse und Threads wirkt sich auf die Leistung von Data-Services-Jobs aus. Tabelle 32: Option Beschreibung Maximale Anzahl der Engine-Prozesse Legt einen Grenzwert für die Anzahl der Engine-Prozesse fest, die dieser Jobserver gleichzeitig ausführen kann. 3.11.10 Jobserver – Allgemein In diesem Fenster können Sie die Standardoptionswerte für einen einzelnen Job Server ändern. Nachdem Sie den Job Server ausgewählt haben, können Sie den Standardwert für verschiedene Einträge ändern. Beispielweise können Sie die Anzahl der Versuche, die ein Job Server zum Herstellen einer FTP-Verbindung unternimmt, falls der erste Versuch fehlschlägt, ändern. Designer-Handbuch Designer-Benutzeroberfläche PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 59 Weitere Informationen Ändern von Optionswerten für einen einzelnen Jobserver [Seite 322] 60 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Designer-Benutzeroberfläche 4 Projekte und Jobs Projekt- und Jobobjekte stellen die beiden obersten Organisationsebenen für die Anwendungsflüsse dar, die Sie mit dem Designer anlegen. 4.1 Projekte Ein Projekt ist ein wiederverwendbares Objekt, mit dem Sie Jobs gruppieren können. Ein Projekt stellt die höchste Organisationsebene der Software dar. Durch das Öffnen eines Projekts wird der Zugriff auf eine Gruppe von Objekten in der Benutzeroberfläche erleichtert. Sie können mit einem Projekt Jobs mit Zeitplänen gruppieren, die voneinander abhängen oder die gemeinsam überwacht werden sollen. Projekte haben gemeinsame Eigenschaften: ● Projekte werden in der Objektbibliothek aufgeführt. ● Es kann nur jeweils ein Projekt gleichzeitig geöffnet sein. ● Projekte können nicht von mehreren Benutzer gleichzeitig bearbeitet werden. 4.1.1 Objekte, aus denen ein Projekt besteht Die Objekte in einem Projekt werden im Projektbereich hierarchisch angezeigt. Wenn neben einem Objekt ein Pluszeichen (+) steht, klappen Sie es auf, um die in dem Objekt enthaltenen Objekte einer niedrigeren Ebene anzuzeigen. Die Software zeigt Ihnen den Inhalt sowohl in Form von Namen in der Projektbereichshierarchie als auch als Symbole im Arbeitsbereich an. Im folgenden Beispiel enthält der Job Job_KeyGen zwei Datenflüsse, und der Datenfluss DF_EmpMap enthält mehrere Objekte. Designer-Handbuch Projekte und Jobs PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 61 Jedes im Projektbereich ausgewählte Element wird außerdem im Arbeitsbereich angezeigt: 4.1.2 Anlegen eines neuen Projekts 1. Wählen Sie Projekt Neu Projekt . 2. Geben Sie den Namen des neuen Projekts ein. Der Name darf alphanumerische Zeichen und Unterstriche (_) enthalten. Er darf keine Leerzeichen enthalten. 3. Klicken Sie auf Anlegen. Daraufhin wird das neue Projekt im Projektbereich angezeigt. Wenn Sie Jobs und andere Objekte niedrigerer Ebene zum Projekt hinzufügen, werden diese ebenfalls im Projektbereich angezeigt. 4.1.3 Öffnen eines vorhandenen Projekts 1. Wählen Sie Projekt Öffnen . 2. Wählen Sie den Namen eines vorhandenen Projekts aus der Liste aus. 3. Klicken Sie auf Öffnen. Hinweis Falls ein anderes Projekt bereits geöffnet war, schließt die Software dieses und öffnet das neue. 62 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Projekte und Jobs 4.1.4 Speichern aller Änderungen an einem Projekt 1. Wählen Sie Projekt Alles speichern . Nun werden die Jobs, Workflows und Datenflüsse aufgelistet, die Sie seit dem letzten Speichervorgang bearbeitet haben. 2. (Optional) Heben Sie die Auswahl aller aufgeführten Objekte auf, die nicht gespeichert werden sollen. 3. Klicken Sie auf OK. Hinweis Sie werden aufgefordert, alle Objekte mit Änderungen zu speichern, wenn Sie einen Job ausführen und wenn Sie den Designer beenden. Beim Speichern eines wiederverwendbaren Objekts werden alle darin enthaltenen Objekte für die einmalige Verwendung gespeichert. 4.2 Jobs Ein Job ist das einzige Objekt, das Sie ausführen können. In der Entwicklungsphase lassen sich Jobs manuell ausführen und testen. Nach der Produktivsetzung können Sie Batch-Jobs planen und Echtzeit-Jobs als Dienste einrichten, die einen Prozess ausführen, wenn die Software eine Meldung mit einer entsprechenden Aufforderung empfängt. Ein Job besteht aus Schritten, die zusammen ausgeführt werden sollen. Jeder Schritt wird durch ein Objektsymbol dargestellt, das Sie im Arbeitsbereich platzieren können, um ein Jobdiagramm anzulegen. Ein Jobdiagramm setzt sich aus zwei oder mehr Objekten zusammen, die miteinander verbunden sind. Sie können jedes der folgenden Objekte in eine Jobdefinition einbeziehen: ● Datenflüsse ○ Quellen ○ Ziele ○ Transformationen ● Workflows ○ Skripte ○ Bedingte Verzweigungen ○ While-Schleifen ○ Try-/Catch-Blöcke Wenn ein Job komplex wird, sollten Sie dessen Inhalt in einzelne Workflows gliedern und dann einen einzigen Job anlegen, der diese Workflows aufruft. Bei Echtzeitjobs kommen dieselben Komponenten wie bei Batch-Jobs zum Einsatz. Sie können sowohl Batch- als auch Echtzeitjobs Workflows und Datenflüsse hinzufügen. Wenn Sie ein Workflow- oder Datenflusssymbol in einen Job ziehen, weisen Sie die Software damit an, diese Objekte gemäß den Anforderungen des Jobtyps (entweder Batch oder Echtzeit) zu validieren. In Bezug auf die Verwendung bestimmter Softwarefunktionen mit Echtzeitjobs gelten einige Beschränkungen. Designer-Handbuch Projekte und Jobs PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 63 Weitere Informationen Workflows [Seite 205] Echtzeitjobs [Seite 257] 4.2.1 Anlegen eines Jobs im Projektbereich 1. Wählen Sie den Projektnamen im Projektbereich aus. 2. Klicken Sie mit der rechten Maustaste und wählen Neuer Batch-Job oder Echtzeitjob. 3. Bearbeiten Sie den Namen. Der Name darf alphanumerische Zeichen und Unterstriche (_) enthalten. Er darf keine Leerzeichen enthalten. Es wird ein neuer Arbeitsbereich zum Definieren des Jobs für Sie geöffnet. 4.2.2 Anlegen eines Jobs in der Objektbibliothek 1. Öffnen Sie den Tab Jobs. 2. Klicken Sie mit der rechten Maustaste auf Batch-Jobs oder Echtzeitjobs und wählen Neu. 3. Es wird ein neuer Job mit einem Standardnamen angezeigt. 4. Klicken Sie mit der rechten Maustaste und wählen Eigenschaften, um den Namen des Objekts zu ändern und eine Beschreibung hinzuzufügen. Der Name darf alphanumerische Zeichen und Unterstriche (_) enthalten. Er darf keine Leerzeichen enthalten. 5. Um den Job zu dem offenen Projekt hinzuzufügen, ziehen Sie ihn in den Projektbereich. 4.2.3 Namenskonventionen für Objekte in Jobs Es empfiehlt sich, einheitliche Namenskonventionen zu verwenden, damit Objekte in allen Systemen Ihres Unternehmens erkannt werden können. Dies erleichtert die Arbeit mit Metadaten in allen Anwendungen wie: ● Datenmodellierungsanwendungen ● ETL-Anwendungen ● Berichtserstellungsanwendungen ● Software Development Kit für Adapter Beispiele für empfohlene Konventionen zur Verwendung mit Jobs und anderen Objekten finden Sie in der folgenden Tabelle. 64 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Projekte und Jobs Tabelle 33: Präfix Suffix Objekt Beispiel DF_ - Datenfluss DF_Währung EDF_ _Input Eingebetteter Datenfluss EDF_Beispiel_Input EDF_ _Output Eingebetteter Datenfluss EDF_Beispiel_Output RTJob_ n/a Echtzeitjob RTJob_Bestellstatus WF_ n/a Workflow WF_Vertrieb JOB_ n/a Job JOB_Vertrieb n/a _DS Datastore ORA_DS DC_ n/a Datastore-Konfiguration DC_DB2_Produktion SC_ n/a Systemkonfiguration SC_ORA_test n/a _Memory_DS In-Memory-Datastore Katalog_Memory_DS PROC_ n/a Gespeicherte Prozedur PROC_Vertriebsstatus Obwohl es sich beim Designer um eine grafische Benutzeroberfläche mit Fenstern handelt, in denen Objekte durch Symbole dargestellt werden, kann es in anderen Schnittstellen vorkommen, dass sich Objekttypen nur durch Text identifizieren lassen. Durch Verwendung eines Präfixes oder Suffixes können Sie den Typ von Objekten leichter erkennen. Neben Präfixen und Suffixen empfiehlt es sich weiterhin, standardisierte Namen für Objekte bereitzustellen, die eine bestimmte Aktion über alle Objekttypen hinweg kenntlich machen. Beispiele: DF_Bestellstatus, RTJob_Bestellstatus. Namenskonventionen können nicht nur Präfixe und Suffixe umfassen, sondern auch Pfadnamen. Die Pfadnamen für gespeicherte Prozeduren können beispielsweise einer der beiden folgenden Konventionen folgen: <Datastore>.<Eigentümer>.<PROC_Name> <Datastore>.<Eigentümer>.<Paket>.<PROC_Name> Designer-Handbuch Projekte und Jobs PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 65 5 Datastores Beschreibt verschiedene Arten von Datastores und enthält Einzelheiten über den Attunity-Connector-Datastore und Anweisungen zum Konfigurieren von Datastores. 5.1 Was sind Datastores? Datastores sind Verbindungskonfigurationen zwischen der Software und Datenbanken oder Anwendungen. Diese Konfigurationen können direkt oder über Adapter erfolgen. Datastore-Konfigurationen ermöglichen es der Software, auf Metadaten von einer Datenbank oder Anwendung zuzugreifen und aus dieser Datenbank/ Anwendung zu lesen bzw. in die Datenbank/Anwendung zu schreiben, während ein Job ausgeführt wird. Datastores von SAP Data Services können eine Verbindung herstellen zu: ● Datenbanken und Großrechner-Dateisystemen. ● Anwendungen, die über vorverpackte oder benutzerdefinierte Adapter verfügen. ● J.D. Edwards One World und J.D. Edwards World, Oracle-Anwendungen, PeopleSoft, SAP-Anwendungen, SAP NetWeaver BW, Siebel-Anwendungen und Google BigQuery. Weitere Informationen erhalten Sie im entsprechenden Erweiterungshandbuch. ● Remote-Servern, die FTP, SFTP und SCP verwenden. Hinweis In Flatfiles gespeicherte Daten werden über Flatfile-Formate gelesen und geschrieben. In XML-Dokumenten gespeicherte Daten werden über DTDs und XML-Schemas gelesen und geschrieben. Die spezifischen Informationen, auf die ein Datastore-Objekt zugreifen kann, sind von der Verbindungskonfiguration abhängig. Wenn Ihre Datenbank oder Anwendung geändert wird, nehmen Sie die entsprechenden Änderungen auch in den Datastore-Informationen in der Software vor. Die neuen Informationen werden von der Software nicht automatisch erkannt. Hinweis Aus einer Datastore-Verbindung gelöschte Objekte werden im Projektbereich und Arbeitsbereich durch ein rotes "Gelöscht"-Symbol gekennzeichnet. Dieses visuelle Kennzeichen ermöglicht es Ihnen, von Datastore-Änderungen betroffene Datenflüsse zu finden und zu aktualisieren. Sie können mehrere Konfigurationen für einen Datastore anlegen. So können Sie für die verschiedenen Umgebungen vorausplanen, in denen Ihr Datastore evtl. verwendet wird, und den Aufwand zur Jobmigration einschränken. Beispielsweise können Sie einen Satz an Konfigurationen (DEV, TEST und PROD) zu demselben Datastore-Namen hinzufügen. Diese Verbindungseinstellungen werden während des Exports oder Imports im Datastore beibehalten. Sie können jeden beliebigen Satz an Datastore-Konfigurationen in einer Systemkonfiguration gruppieren. Wenn Sie einen Job ausführen oder einplanen, wählen Sie eine Systemkonfiguration und somit einen Satz an Datastore-Konfigurationen für Ihre aktuelle Umgebung aus. 66 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datastores Weitere Informationen Datenbank-Datastores [Seite 67] Adapter-Datastores [Seite 90] Dateiformate [Seite 112] Formatieren von XML-Dokumenten [Seite 225] Anlegen und Verwalten mehrerer Datastore-Konfigurationen [Seite 95] 5.2 Datenbank-Datastores Allows Data Services to read from and write to supported database types. Datenbank-Datastores können eine oder mehrere Verbindungen repräsentieren mit: ● Legacy-Systemen, die Attunity Connect verwenden ● IBM DB2, Informix, Microsoft SQL Server, Oracle, SQL Anywhere, SAP ASE, Sybase IQ, MySQL, Netezza, SAP HANA, SAP Data Federator, SQL Anywhere und Teradata (mit systemeigenen Verbindungen) ● Sonstigen Datenbanken (über ODBC) ● Einem Repository unter Verwendung eines Speicher-Datastores oder eines persistenten Cache-Datastores Sie können mit den meisten Datenquellen unter Verwendung des Servernamens anstelle des DSN-Namens (DataSource-Name-Namens) oder TNS-Namens (Transparent-Network-Substrate-Namens) eine Verbindung herstellen. Dank Servernamenverbindungen (auch DSN-lose und TNS-lose Verbindungen genannt) brauchen Sie nicht dieselben DSN- oder TNS-Einträge auf jedem Rechner in einer verteilten Umgebung zu konfigurieren. Weitere Informationen zu DSN- und TNS-losen Verbindungen finden Sie im Administratorhandbuch. 5.2.1 Mainframe-Schnittstelle Die Software liefert den Attunity-Connector-Datastore, der über Attunity Connect auf Mainframe-Datenquellen zugreift. Die Datenquellen, auf die Attunity Connect zugreift, können der folgenden Liste entnommen werden. Eine umfassende Liste der Quellen ist in der Attunity-Dokumentation zu finden. ● Adabas ● DB2 UDB für OS/390 und DB2 UDB für OS/400 ● IMS/DB ● VSAM ● Flatfiles unter OS/390 und Flatfiles unter OS/400 Designer-Handbuch Datastores PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 67 5.2.1.1 Voraussetzungen für einen Attunity-Datastore Attunity Connector greift per Software auf Mainframe-Daten zu. Diese Software müssen Sie manuell auf dem Mainframe-Server und dem lokalen Client-Rechner (Jobserver) installieren. Die Software stellt über die ODBCSchnittstelle eine Verbindung mit Attunity Connector her. Für UNIX- und Windows-Plattformen brauchen Sie keinen eigenen ODBC-Treibermanager zu erwerben. Server Installieren und konfigurieren Sie das Attunity-Connect-Produkt auf dem Server (beispielsweise ein zSeriesRechner). Clients Um mit Attunity Connector auf Mainframe-Daten zuzugreifen, installieren Sie das Attunity-Connect-Produkt. Der ODBC-Treiber ist erforderlich. Attunity bietet auch ein optionales Tool namens Attunity Studio, das Sie für die Konfiguration und Administration verwenden können. Konfigurieren Sie die ODBC-Datenquellen auf dem Client (Jobserver von SAPData Services). Wenn Sie einen Jobserver unter UNIX installieren, werden Sie vom Installationsprogramm aufgefordert, einen Installationsverzeichnispfad für die Attunity-Connector-Software anzugeben. Außerdem müssen Sie einen Treibermanager installieren, da ODBC-Treiber direkt auf UNIX-Plattformen installiert werden. Weitere Informationen zum Installieren und Konfigurieren dieser Produkte können Sie der entsprechenden Dokumentation entnehmen. 5.2.1.2 Anlegen und Konfigurieren eines Attunity-Datastores Aktualisieren Sie zur Verwendung der Attunity-Connector-Datastore-Option das Repository auf SAP Data Services Version 6.5.1 oder höher. So legen Sie einen Attunity-Connector-Datastore an und konfigurieren ihn: 1. Klicken Sie mit der rechten Maustaste auf dem Tab Datastores der Objektbibliothek, und wählen Sie Neu aus. 2. Geben Sie einen Namen für den Datastore ein. 3. Wählen Sie im Feld Datastore-Typ den Eintrag Datenbank aus. 4. Wählen Sie im Feld Datenbanktyp die Option Attunity-Connector aus. 5. Geben Sie den Namen der Attunity-Datenquelle, den Speicherort des Attunity-Daemons (Hostspeicherort), die Nummer des Attunity-Daemon-Ports und einen eindeutigen Namen für den Attunity-Serverarbeitsbereich ein. 6. Um Standardoptionen zu ändern (wie Zeilen pro Commit oder Sprache), klicken Sie auf die Schaltfläche Erweitert. 68 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datastores 7. Klicken Sie auf OK. Sie können nun über die neue Datastore-Verbindung Metadatentabellen in das aktuelle Repository importieren. 5.2.1.3 Angeben mehrerer Datenquellen in einem AttunityDatastore Sie können mit dem Attunity-Connector-Datastore auf mehrere Attunity-Datenquellen in demselben AttunityDaemon-Verzeichnis zugreifen. Wenn auf demselben Rechner mehrere Arten von Daten vorhanden sind (z.B. eine DB2-Datenbank und VSAM), können Sie mit einer einzelnen Verbindung auf beide Datenarten zugreifen. Sie können beispielsweise Tabellen mit einer einzelnen Verbindung verknüpfen (und die Verknüpfungsoperation an einen entfernten Server übergeben). Dadurch verringert sich die über das Netzwerk übertragene Datenmenge. So geben Sie mehrerer Datenquellen im Datastore-Editor an: 1. Trennen Sie die Namen von Datenquellen im Feld "Attunity-Datenquelle" mit Semikolons, und verwenden Sie folgendes Format: AttunityDataSourceName;AttunityDataSourceName Wenn Sie beispielsweise eine DB2-Datenquelle mit dem Namen "DSN4" und eine VSAM-Datenquelle mit dem Namen "Navdemo" haben, geben Sie in das Feld "Datenquelle" folgende Werte ein: DSN4;Navdemo 2. Wenn Sie für einen Attunity-Connector-Datastore mehrere Datenquellennamen aufführen, müssen folgende Anforderungen erfüllt werden: ○ Der Zugriff auf alle Attunity-Datenquellen muss mit demselben Benutzernamen und demselben Kennwort möglich sein. ○ Alle Attunity-Datenquellen müssen denselben Arbeitsbereich verwenden. Verwenden Sie beim Festlegen des Zugriffs auf die Datenquellen in Attunity Studio für jede Datenquelle denselben Arbeitsbereichsnamen. 5.2.1.4 Data-Services-Namenskonvention für AttunityTabellen Das Format von Data Services für den Zugriff auf Attunity-Tabellen ist Data-Services-spezifisch. Da ein einzelner Datastore auf mehrere Softwaresysteme zugreifen kann, die nicht denselben Namespace verwenden, muss der Name der Attunity-Datenquelle beim Referenzieren einer Tabelle angegeben werden. Bei Verwendung eines Attunity-Connectors stellen Sie dem Tabellennamen die Datenquellen- und Eigentümernamen getrennt durch einen Doppelpunkt voran. Das Format sieht wie folgt aus: AttunityDataSource:OwnerName.TableName Designer-Handbuch Datastores PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 69 Wenn Sie mit dem Designer Jobs mit importierten Attunity-Tabellen anlegen, generiert Data Services automatisch den richtigen SQL-Code für dieses Format. Wenn Sie allerdings selbst SQL-Code schreiben, sollten Sie unbedingt dieses Format verwenden. Sie können SQL-Code in den folgenden Konstrukten schreiben: ● SQL-Funktion ● SQL-Transformation ● Pushdown_sql-Funktion ● Pre-Load-Befehle im Tabellen-Loader ● Post-Load-Befehle im Tabellen-Loader Hinweis Bei Tabellen in Data Services darf bei den meisten Repository-Typen der Name des Eigentümers 256 Zeichen nicht überschreiten (MySQL ist 64 und MS SQL Server 128 sein). Bei Attunity-Tabellen beträgt die maximal zulässige Länge des Attunity-Datenquellennamens und des tatsächlichen Eigentümernamens jeweils 63 Zeichen (der Doppelpunkt entspricht 1 Zeichen). 5.2.1.5 Einschränkungen für Attunity-Datastore Wenn Sie einen Attunity-Connector-Datastore verwenden, stehen fast alle Data-Services-Funktionen zur Verfügung. ● Massenladen ● Importierte Funktionen (importiert nur Metadaten für Tabellen) ● Vorlagentabellen (Tabellenanlage) ● Der Datetime-Datentyp unterstützt nur bis zu zweistellige Sekundenbruchteile ● Data Services kann keine Zeitstempeldaten in eine Zeitstempelspalte in einer Tabelle laden, da Attunity varchar-Daten auf 8 Zeichen verkürzt, was für eine korrekte Darstellung eines Zeitstempelwerts nicht ausreicht. ● Beim Ausführen eines Jobs unter UNIX kann der Job mit der folgenden Meldung fehlschlagen: [D000] Cannot open file /usr1/attun/navroot/def/sys System error 13: The file access permissions do not allow the specified action.; (OPEN) Dieser Fehler tritt aufgrund unzureichender Dateiberechtigungen für einige Dateien im AttunityInstallationsverzeichnis auf. Um das Auftreten dieses Fehlers zu vermeiden, ändern Sie die Dateiberechtigungen für alle Dateien im Attunity-Verzeichnis auf 777, indem Sie den folgenden Befehl aus dem Attunity-Installationsverzeichnis ausführen: $ chmod -R 777 * 5.2.2 Definieren eines Datenbank-Datastores Definieren Sie mindestens einen Datenbank-Datastore für jede Datenbank oder jedes Mainframe-System, mit der bzw. dem Sie Daten austauschen. 70 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datastores Zum Definieren von Datenbank-Datastores benötigen Sie ausreichende Zugriffsberechtigungen für die Datenbank oder das Dateisystem, die bzw. das den Datastore beschreibt. Soll die Software beispielsweise parametrisiertes SQL beim Lesen aus oder Schreiben in DB2-Datenbanken verwenden, müssen Sie dem Benutzer (des Datastores/der Datenbank) die Berechtigung zum Anlegen, Ausführen und Löschen gespeicherter Prozeduren erteilen. Verfügt ein Benutzer nicht über die Berechtigung zum Anlegen, Ausführen und Löschen gespeicherter Prozeduren, werden die Jobs dennoch ausgeführt. Die Jobs geben jedoch eine Warnmeldung aus und werden weniger effizient ausgeführt. 1. Klicken Sie auf dem Tab Datastores der Objektbibliothek mit der rechten Maustaste, und wählen Sie Neu aus. 2. Geben Sie den Namen des neuen Datastores im Feld Datastore-Name ein. Der Name darf beliebige alphabetische oder numerische Zeichen oder Unterstriche (_) enthalten. Er darf keine Leerzeichen enthalten. 3. Wählen Sie im Feld Datastore-Typ den Eintrag Datenbank aus. Es werden Optionen angezeigt, die für diesen Typ relevant sind. Weitere Informationen zu diesen Optionen und Informationen zu Datenbanktypen, die im vorliegenden Dokument nicht thematisiert wurden, finden Sie unter "Datenbank-Datastores" im Referenzhandbuch. Datenbanktyp Zusätzliche Informationen Oracle Der Oracle-Datenbanktyp unterstützt TNS-lose Verbindungen. Um eine TNSlose Verbindung zu verwenden, heben Sie die Auswahl von TNS-Name verwenden auf, und geben Sie den Hostnamen, die SID und den Port ein. DSN-lose Verbindungen Datenbanken von DB2, Informix, MySQL, Netezza und SAP HANA unterstüt zen DSN-lose Verbindungen. Die neueste Liste der unterstützten Datenbanken für DSN-lose Verbindun gen finden Sie in den Versionshinweisen. Um eine DSN-lose Verbindung zu verwenden, heben Sie die Auswahl von Datenquellenname (DSN) verwenden auf, und geben Sie den Datenbankser vernamen, den Datenbanknamen (bei DB2 und MySQL) und den Port ein. Wenn Sie Informix ausgewählt haben und DNS-lose Verbindungen verwen den möchten, wenn Data Services nicht auf einem Rechner auf dem Infor mix-Server installiert wurde, müssen Sie den Informix-Host wie folgt ermit teln: 1. Navigieren Sie zum Informix-Clientinstallationsordner (z.B. C: \Programme\IBM\Informix\Client-SDK\bin Run setnet32.exe). 2. Geben Sie auf dem Tab "Serverinformation" den Namen des IBM-Infor mix-Servers, den Hostnamen und weitere erforderliche Informationen ein. 3. Machen Sie den IBM-Informix-Server zum Standardserver. Für DNS-lose Verbindungen mit einer Informix-Datenbank kann Designer jetzt den Informix-Hostnamen für den von Ihnen angegebenen Informix-Ser vernamen abrufen. Data Federator Designer-Handbuch Datastores Wenn Sie diesen Datenbanktyp verwenden, müssen Sie sowohl den Katalog namen als auch den Schemanamen in der URL angeben. Andernfalls werden möglicherweise alle Tabellen jedes Katalogs angezeigt. PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 71 Datenbanktyp Zusätzliche Informationen 1. Wählen Sie "ODBC-Admin" und anschließend den Tab "System-DSN" aus. 2. Markieren Sie Data Federator, und klicken Sie dann auf Konfigurieren. 3. Geben Sie in der URL den Katalognamen und den Schemanamen an. Beispiel: jdbc:leselect://localhost/ <Katalogname>;schema=<Schemaname> 4. Wählen Sie Automatische Datenübertragung aktivieren, damit die Data_Transfer-Transformation Transfertabellen in diesem Datastore verwenden kann, um nachfolgende Datenbankoperationen weiterzugeben. Dieses Kontrollkästchen wird für alle Datenbanken mit Ausnahme von Attunity-Connector, Data Federator, Speicher und Persistenter Cache angezeigt. 5. Wenn Sie weitere Informationen hinzufügen möchten, klicken Sie auf Erweitert. Klicken Sie auf die Zelle unterhalb der jeweiligen Konfigurationsoption, und geben Sie einen Wert ein bzw. wählen Sie einen aus. 6. Wenn Sie möchten, dass ein Datentyp in Ihrer Quelle konvertiert wird, der normalerweise nicht unterstützt wird, wählen Sie die Option Nicht unterstützte Datentypen importieren als VARCHAR der Größe aus, und geben Sie die Anzahl der zulässigen Zeichen ein. Weitere Informationen zu Datentypen finden Sie im Referenzhandbuch. 7. Klicken Sie auf OK, um den Datenbank-Datastore zu speichern. Hinweis In Data Integrator-Versionen vor 11.7.0 musste beim Anlegen eines Datastores auf Netezza der Datenbanktyp ODBC verwendet werden. SAP Data Services 11.7.1 bietet eine spezifische Netezza-Option, um anstelle von ODBC Netezza als Datenbanktyp festzulegen. Wenn Sie Netezza als Datenbank mit der Software verwenden, empfiehlt es sich, als Datenbanktyp die softwareeigene Netezza-Option und nicht ODBC zu verwenden. Weitere Informationen Methoden zum Importieren von Metadaten [Seite 78] Anlegen und Verwalten mehrerer Datastore-Konfigurationen [Seite 95] Referenzhandbuch: Datenbank-Datastores Referenzhandbuch: Objekte, Datastore Administratorhandbuch: DSN-lose und TNS-lose Verbindungen Performance Optimization Guide: Data Transfer transform for push-down operations 72 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datastores 5.2.3 Konfigurieren von ODBC-Datenquellen unter UNIX Um ODBC-Datenquellen auf UNIX-Plattformen verwenden zu können, müssen Sie möglicherweise eine zusätzliche Konfiguration vornehmen. Data Services bietet den Verbindungs-Manager zur Vereinfachung der Konfiguration nativ unterstützter ODBCDatenquellen wie MySQL und Teradata. Bei anderen ODBC-Datenquellen ist möglicherweise eine manuelle Konfiguration erforderlich. Weitere Informationen Administratorhandbuch: Konfigurieren von ODBC-Datenquellen unter UNIX 5.2.4 Durchsuchen von Metadaten über einen DatenbankDatastore Sie können Metadaten für importierte oder nicht importierte Objekte anzeigen und prüfen, ob sich die Metadaten für bereits importierte Objekte geändert haben. Metadateninformationen werden für alle importierten Objekte in einem Datastore gespeichert. 5.2.4.1 Anzeigen von importierten Objekten 1. Wechseln Sie in der Objektbibliothek zum Tab Datastores. 2. Klicken Sie auf das Pluszeichen (+) neben dem Namen des gewünschten Datastores, um die darin enthaltenen Objekttypen anzuzeigen. Datenbank-Datastores haben beispielsweise Funktionen, Tabellen und Vorlagentabellen. 3. Klicken Sie auf das Pluszeichen (+) neben einem Objekttyp, um die aus dem Datastore importierten Objekte dieses Typs anzuzeigen. Klicken Sie beispielsweise neben Tabellen auf das Pluszeichen (+), um die importierten Tabellen anzuzeigen. 5.2.4.2 Sortieren der Objektliste Klicken Sie auf die Spaltenüberschrift, um die Objekte in den einzelnen Gruppierungen und die Gruppierungen in den einzelnen Datastores alphabetisch zu sortieren. Klicken Sie erneut, um in umgekehrter alphabetischer Reihenfolge zu sortieren. Designer-Handbuch Datastores PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 73 5.2.4.3 Anzeigen von Datastore-Metadaten 1. Wählen Sie in der Objektbibliothek den Tab Datastores aus. 2. Markieren Sie einen Datastore, klicken Sie mit der rechten Maustaste, und wählen Sie Öffnen aus. (Alternativ können Sie auf das Datastore-Symbol doppelklicken.) Die Software öffnet den Datastore-Explorer im Arbeitsbereich. Der Datastore-Explorer listet die Tabellen im Datastore auf. Sie können Tabellen in der externen Datenbank oder Tabellen im internen Repository anzeigen. Außerdem haben Sie die Möglichkeit, diese zu durchsuchen. 3. Wählen Sie Externe Metadaten aus, um Tabellen in der externen Datenbank anzuzeigen. Wenn Sie mindestens eine Tabelle auswählen, können Sie mit der rechten Maustaste klicken, um weitere Optionen zu erhalten. Tabelle 34: Befehl Beschreibung Öffnen (Nur verfügbar, wenn Sie eine Tabelle auswählen.) Öffnet den Editor für die Tabellenmetadaten. Importieren Importiert (oder importiert neu) Metadaten aus der Daten bank in das Repository. Abstimmen Prüft, ob zwischen Metadaten in der Datenbank und Meta daten im Repository Unterschiede vorliegen. 4. Wählen Sie Repository-Metadaten aus, um die importierten Tabellen anzuzeigen. Wenn Sie mindestens eine Tabelle auswählen, können Sie mit der rechten Maustaste darauf klicken, um weitere Optionen anzuzeigen. Tabelle 35: Befehl Beschreibung Öffnen (Nur verfügbar, wenn Sie eine Tabelle auswählen) Öffnet den Editor für die Tabellenmetadaten. Abstimmen Prüft, ob zwischen Metadaten im Repository und Metada ten in der Datenbank Unterschiede vorliegen. Neu importieren Importiert Metadaten aus der Datenbank neu in das Reposi tory. Löschen Löscht die Tabelle oder die Tabellen aus dem Repository. Eigenschaften (Nur verfügbar, wenn Sie eine Tabelle aus Zeigt die Eigenschaften der ausgewählten Tabelle an. wählen) Daten anzeigen Öffnet das Fenster "Daten anzeigen", in dem Sie die derzeit in der Tabelle enthaltenen Daten anzeigen können. 74 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datastores Weitere Informationen Importieren mittels Suchen [Seite 80] 5.2.4.4 Ermitteln, ob ein Schema seit dem Import geändert wurde 1. Wählen Sie in dem Browserfenster, in dem die Liste der Repository-Tabellen angezeigt wird, Externe Metadaten aus. 2. Wählen Sie die Tabelle oder die Tabellen, die Sie auf Änderungen überprüfen möchten. 3. Klicken Sie mit der rechten Maustaste, und wählen Sie Abstimmen. Die Spalte "Geändert" zeigt "JA" an, um darauf hinzuweisen, dass sich die Datenbanktabellen von den in die Software importierten Metadaten unterscheiden. Um die zuletzt verwendeten Metadaten aus der Software zu verwenden, importieren Sie die Tabelle neu. Die Spalte "Importiert" zeigt "JA" an, um darauf hinzuweisen, dass die Tabelle in das Repository importiert wurde. 5.2.4.5 Durchsuchen der Metadaten für eine externe Tabelle 1. Wählen Sie in dem Browserfenster, in dem die Liste der externen Tabellen angezeigt wird, die Tabelle aus, die Sie anzeigen möchten. 2. Klicken Sie mit der rechten Maustaste, und wählen Sie Öffnen aus. Im Arbeitsbereich wird ein Tabelleneditor eingeblendet, der das Schema und die Attribute der Tabelle anzeigt. 5.2.4.6 Anzeigen von Metadaten für eine importierte Tabelle 1. Wählen Sie den Tabellennamen in der Liste der importierten Tabellen aus. 2. Klicken Sie mit der rechten Maustaste, und wählen Sie Öffnen aus. Im Arbeitsbereich wird ein Tabelleneditor eingeblendet, der das Schema und die Attribute der Tabelle anzeigt. 5.2.4.7 Anzeigen sekundärer Indexinformationen für Tabellen Sekundäre Indexinformationen veranschaulichen das Schema einer importierten Tabelle. 1. Klicken Sie im Designer im Datastores-tab mit der rechten Maustaste, um das Kontextmenü zu öffnen. Designer-Handbuch Datastores PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 75 2. Klicken Sie im Kontextmenü auf Eigenschaften, um das Fenster "Eigenschaften" zu öffnen. 3. Klicken Sie im Fenster "Eigenschaften" auf den Tab Indizes. Die Indexliste wird im Fenster auf der linken Seite angezeigt. 4. Klicken Sie auf einen Index, um den Inhalt anzuzeigen. 5.2.5 Importieren von Metadaten über einen DatenbankDatastore Für Datenbank-Datastores können Sie Metadaten für Tabellen und Funktionen importieren. 5.2.5.1 Importierte Tabelleninformationen Die Software bestimmt und speichert einen bestimmten Satz an Metadateninformationen für Tabellen. Nach dem Importieren von Metadaten können Sie Spaltennamen, Beschreibungen und Datentypen bearbeiten. Die Bearbeitungen werden an alle Objekte weitergegeben, die diese Objekte aufrufen. Tabelle 36: Metadaten Beschreibung Tabellenname Der Name der Tabelle, wie er in der Datenbank angezeigt wird. Hinweis Die maximal zulässige Länge richtet sich nach dem DataServices-Repository-Typ. Bei den meisten Repository-Ty pen beträgt die Maximallänge 256, bei MySQL 64 und bei MS SQL Server 128 Zeichen. Tabellenbeschreibung Die Beschreibung der Tabelle. Spaltenname Der Name der Spalte. Spaltenbeschreibung Die Beschreibung der Spalte. Spaltendatentyp Der Datentyp für die Spalte. Wenn eine Spalte als ein nicht unterstützter Datentyp definiert wird, wird der Datentyp in einen Datentyp konvertiert, der un terstützt wird. Wenn der Datentyp nicht konvertiert werden kann, wird die Spalte in einigen Fällen vollständig ignoriert. Spalteninhaltstyp 76 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Der Inhaltstyp identifiziert den Datentyp im Feld. Designer-Handbuch Datastores Metadaten Beschreibung Primärschlüsselspalte Die Spalte(n), die den Primärschlüssel für die Tabelle enthält/ enthalten. Nachdem einem Datenflussdiagramm eine Tabelle hinzuge fügt wurde, werden diese Spalten in der Spaltenliste durch ein Schlüsselsymbol neben dem Spaltennamen angegeben. Tabellenattribut Informationen, die von der Software über die Tabelle aufge zeichnet werden, beispielsweise das Analgedatum und das Änderungsdatum dieser Werte, stehen zur Verfügung. Eigentümername Der Name des Tabelleneigentümers. Hinweis Der Eigentümername für MySQL- und Netezza-Daten ent spricht dem Namen der Datenbank oder des Schemas, in der bzw. dem die Tabelle angezeigt wird. 5.2.5.1.1 Varchar- und Spalteninformationen aus SAP Data Federator Alle Dezimalspalten, die von einer Datenquelle von SAP Data Federator in Data Services importiert wurden, werden in die Dezimalgenauigkeit und Dezimalstellen (28,6) konvertiert. Jede varchar-Spalte, die aus einer Datenquelle von SAP Data Federator in die Software importiert wurde, ist varchar(1024). Sie können die Dezimalgenauigkeit oder -stellen und die varchar-Größe nach dem Import aus der Datenquelle von SAP Data Federator in der Software ändern. 5.2.5.2 Informationen zu importierten gespeicherten Funktionen und gespeicherten Prozeduren Die Software kann Funktionen und gespeicherte Prozeduren aus einer Reihe von Datenbanken importieren. Sie können gespeicherte Prozeduren aus DB2-, MS-SQL-Server-, Oracle-, SAP-HANA-, SQL-Anywhere-, SybaseASE-, Sybase-IQ- und Teradata-Datenbanken importieren. Außerdem besteht die Möglichkeit, gespeicherte Funktionen und Pakete aus Oracle zu importieren. Sie können diese Funktionen und Prozeduren in den Extraktionsspezifikationen verwenden, die sie an Data Services übergeben. Unter anderem werden folgende Informationen zu Funktionen importiert: ● Funktionsparameter Designer-Handbuch Datastores PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 77 ● Rückgabetyp ● Name, Eigentümer Importierte Funktionen und Prozeduren werden auf dem Tab Datastores der Objektbibliothek angezeigt. Funktionen und Prozeduren werden unter dem Knoten Funktion der einzelnen Datastore-Strukturen angezeigt. Sie können importierte Funktionen und Prozeduren über den Funktionsassistenten und den Smart Editor in einer Kategorie konfigurieren, die durch den Datastore-Namen identifiziert wird. Weitere Informationen Referenzhandbuch: Informationen zu Prozeduren 5.2.5.3 Methoden zum Importieren von Metadaten Erläutert Methoden zum Importieren von Metadaten. 5.2.5.3.1 Importieren mittels Durchsuchen Hinweis Funktionen können mit dieser Methode nicht importiert werden. 1. Öffnen Sie die Objektbibliothek. 2. Öffnen Sie den Tab Datastores. 3. Markieren Sie den zu verwendenden Datastore. 4. Klicken Sie mit der rechten Maustaste, und wählen Sie Öffnen aus. Die Elemente, die über den Datastore importiert werden können, werden im Arbeitsbereich angezeigt. In manchen Umgebungen werden die Tabellen in einer Baumstruktur angezeigt. Wenn dies der Fall ist, befindet sich links neben dem Namen ein Pluszeichen (+). Klicken Sie auf das Pluszeichen, um durch die Struktur zu navigieren. Der Arbeitsbereich enthält Spalten, die angeben, ob die Tabelle bereits in die Software importiert wurde ("Importiert") und ob sich das Tabellenschema seit dem Import geändert hat ("Geändert"). Um zu prüfen, ob das Repository die aktuellsten Metadaten für ein Objekt enthält, klicken Sie mit der rechten Maustaste auf das Objekt und wählen "Abstimmen" aus. 5. Wählen Sie die Elemente aus, für die Sie Metadaten importieren möchten. Um beispielsweise eine Tabelle zu importieren, müssen Sie diese auswählen, und nicht einen Ordner, der Tabellen enthält. 6. Klicken Sie mit der rechten Maustaste, und wählen Sie Importieren aus. 78 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datastores 7. Gehen Sie in der Objektbibliothek zum Tab Datastores, um die Liste der importieren Objekte anzuzeigen. 5.2.5.3.2 Importieren nach Namen 1. Öffnen Sie die Objektbibliothek. 2. Klicken Sie auf den Tab Datastores. 3. Markieren Sie den zu verwendenden Datastore. 4. Klicken Sie mit der rechten Maustaste, und wählen Sie Nach Namen importieren aus. 5. Wählen Sie im Fenster "Nach Namen importieren" den zu importierenden Typ von Element aus der Liste Typ aus. Wenn Sie eine gespeicherte Prozedur importieren, wählen Sie Funktion aus. 6. Gehen Sie zum Importieren von Tabellen wie folgt vor: a. Geben Sie einen Tabellennamen im Feld Name ein, um eine bestimmte Tabelle anzugeben, oder aktivieren Sie gegebenenfalls das Kontrollkästchen Alle, um alle Tabellen anzugeben. Wenn in der Datenbank die Groß- und Kleinschreibung beim Namen beachtet wird und dieser nicht nur aus Großbuchstaben besteht, geben Sie den Namen so ein, wie er in der Datenbank erscheint, und setzen den Namen in doppelte Anführungszeichen ("), um die Groß- und Kleinschreibung beizubehalten. b. Geben Sie einen Eigentümernamen in das Feld Eigentümer ein, um die angegebenen Tabellen auf einen bestimmten Eigentümer zu beschränken. Wenn Sie das Eigentümerfeld leer lassen, werden übereinstimmende Tabellen ungeachtet des Eigentümers verwendet (also jede Tabelle mit dem angegebenen Tabellennamen). 7. Gehen Sie zum Importieren von Funktionen und Prozeduren wie folgt vor: ○ Geben Sie im Feld Name den Namen der Funktion oder gespeicherten Prozedur ein. Wenn in der Datenbank die Groß- und Kleinschreibung beim Namen beachtet wird und dieser nicht nur aus Großbuchstaben besteht, geben Sie den Namen so ein, wie er in der Datenbank erscheint, und setzen den Namen in doppelte Anführungszeichen ("), um die Groß- und Kleinschreibung beizubehalten. Ansonsten wandelt die Software Namen so um, dass sie ausschließlich aus Großbuchstaben bestehen. Sie können auch den Namen eines Pakets eingeben. Ein Oracle-Paket ist eine gekapselte Sammlung zusammengehörender Programmobjekte (zum Beispiel Prozeduren, Funktionen, Variablen, Konstanten, Cursor und Ausnahmen), die zusammen in der Datenbank gespeichert sind. Sie können Prozeduren oder Funktionen importieren, die in Paketen angelegt wurden, und sie als Prozeduren oder Funktionen auf oberster Ebene verwenden. Wenn Sie einen Paketnamen eingeben, werden alle gespeicherten Prozeduren und Funktionen importiert, die im Oracle-Paket definiert sind. Einzelne Funktionen oder Prozeduren lassen sich aus einem Paket nicht importieren. ○ Geben Sie einen Eigentümernamen in das Feld Eigentümer ein, um die angegebenen Funktionen auf einen bestimmten Eigentümer zu beschränken. Wenn Sie das Eigentümerfeld leer lassen, werden übereinstimmende Funktionen ungeachtet des Eigentümers verwendet (also jede Funktion mit dem angegebenen Namen). ○ Falls Sie eine Funktion oder gespeicherte Prozedur von Oracle importieren und eine der folgenden Bedingungen erfüllt ist, deaktivieren Sie das Kontrollkästchen Über SQL-Ausdruck aufrufbar. Eine gespeicherte Prozedur kann nicht innerhalb einer anderen SQL-Anweisung an eine Datenbank übergeben werden, wenn die gespeicherte Prozedur eine DDL-Anweisung enthält, die die aktuelle Transaktion mit COMMIT oder ROLLBACK beendet oder Befehle vom Typ ALTER SESSION oder ALTER SYSTEM absetzt. Designer-Handbuch Datastores PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 79 8. Klicken Sie auf OK. 5.2.5.3.3 Importieren mittels Suchen Hinweis Funktionen können mit dieser Methode nicht importiert werden. 1. Öffnen Sie die Objektbibliothek. 2. Klicken Sie auf den Tab Datastores. 3. Markieren Sie den Namen des zu verwendenden Datastores. 4. Klicken Sie mit der rechten Maustaste, und wählen Sie Suchen aus. Das Fenster "Suchen" wird angezeigt. 5. Geben Sie den Namen des Elements ganz oder teilweise in das Textfeld Name ein. Wenn in der Datenbank die Groß- und Kleinschreibung beim Namen beachtet wird und dieser nicht nur aus Großbuchstaben besteht, geben Sie den Namen so ein, wie er in der Datenbank erscheint, und setzen den Namen in doppelte Anführungszeichen ("), um die Groß- und Kleinschreibung beizubehalten. 6. Wählen Sie Enthält oder Entspricht aus der Drop-Down-Liste auf der rechten Seite aus, je nachdem, ob Sie den Suchwert vollständig oder teilweise angeben. Bei Wahl von "Entspricht" wird nur die vollständige Suchzeichenfolge zurückgegeben. Es wird also nach "Eigentümer.Tabellenname" gesucht, nicht nur nach "Tabellenname". 7. (Optional) Geben Sie eine Beschreibung in das Textfeld Beschreibung ein. 8. Wählen Sie den Objekttyp im Feld Typ aus. 9. Wählen Sie den Datastore, der durchsucht werden soll, im Feld Suchen in aus. 10. Wählen Sie aus dem Drop-Down-Feld rechts des Felds Suchen in die Option Extern aus. Mit "Extern" geben Sie an, dass in der gesamten Datenbank, die durch den Datastore definiert ist, nach dem Element gesucht wird. Bei Wahl von "Intern" werden nur die importieren Elemente durchsucht. 11. Gehen Sie zum Tab Erweitert, um die Suche unter Verwendung der Attributwerte der Software auszuführen. Die erweiterten Optionen gelten nur für Suchvorgänge nach importierten Elementen. 12. Klicken Sie auf Suchen. Es werden die Tabellen aufgeführt, die den Suchkriterien entsprechen. 13. Um eine Tabellen aus der zurückgegebenen Liste zu importieren, klicken Sie mit der rechten Maustaste und wählen Importieren aus. 80 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datastores 5.2.5.4 Erneutes Importieren von Objekten Sie können ein bereits importiertes Objekt, beispielsweise einen Datastore, eine Funktion oder eine Tabelle, erneut importieren, um die Metadaten des Objekts aus der Datenbank zu aktualisieren (beim Neuimport werden alle Änderungen überschrieben, die Sie unter Umständen am Objekte in der Software vorgenommen haben). In Vorgängerversionen der Software haben Sie zum erneuten Importieren von Objekten den Datastore geöffnet, die Repository-Metadaten angezeigt und die erneut zu importierenden Objekte ausgewählt. In dieser Version der Software können Sie Objekte mithilfe der Objektbibliothek auf verschiedenen Ebenen erneut importieren: ● Einzelne Objekte – Es werden die Metadaten für ein einzelnes Objekt wie eine Tabelle oder Funktion erneut importiert. ● Kategorieknotenebene – Es werden die Definitionen aller Objekte dieses Typs im jeweiligen Datastore neu importiert, beispielsweise alle Tabellen im Datastore. ● Datastore-Ebene – Es werden der gesamte Datastore und alle seine abhängigen Objekte erneut importiert, einschließlich Tabellen, Funktionen, IDocs und Hierarchien. 5.2.5.4.1 Erneutes Importieren von Objekten aus der Objektbibliothek 1. Klicken Sie in der Objektbibliothek auf den Tab Datastores. 2. Klicken Sie mit der rechten Maustaste auf ein bestimmtes Objekt, und klicken Sie auf Erneut importieren, oder klicken Sie mit der rechten Maustaste auf einen Kategorieknoten oder Datastore-Namen, und klicken Sie auf Alle erneut importieren. Mit Strg-Klicken oder Umschalt-Klicken können Sie auch mehrere einzelne Objekte auswählen. 3. Klicken Sie auf Ja, um die Metadaten erneut zu importieren. 4. Wenn Sie mehrere Objekte für den Neuimport ausgewählt haben (beispielsweise mit Alle erneut importieren), fordert die Software eine Bestätigung für jedes Objekt an, sofern Sie nicht das Kontrollkästchen Frage nach verbleibenden Objekten nicht mehr stellen aktiviert haben. Wenn Sie einzelne Objekte beim Neuimport überspringen möchten, klicken Sie für das jeweilige Objekt auf "Nein". Falls Sie sich bei einem bestimmten Objekt nicht sicher sind, ob es erneut importiert (und damit überschrieben) werden soll, klicken Sie auf "Verwendungsort anzeigen", um die derzeitigen Verwendungsorte des Objekts in Ihren Jobs anzuzeigen. 5.2.6 Speicher-Datastores Ein Speicher-Datastore ist ein Container für Speichertabellen. In der Software können Sie einen Datenbank-Datastore anlegen, indem Sie als Datenbanktyp Speicher verwenden. Speicher-Datastores sollen die Verarbeitungsleistung von Datenflüssen verbessern, die in Echtzeitjobs ausgeführt werden. Die Daten (üblicherweise kleine Datenmengen in Echtzeitjobs) werden im Speicher abgelegt, sodass unverzüglich auf sie zugegriffen werden kann, ohne dass die ursprüngliche Datenquelle verwendet werden muss. Designer-Handbuch Datastores PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 81 Ein Datastore ermöglicht üblicherweise eine Verbindung mit einer Datenbank, einer Anwendung oder einem Adapter. Ein Speicher-Datastore enthält hingegen im Repository gespeicherte Speichertabellenschemas. Speichertabellen sind Schemas für das Zwischenspeichern von Zwischendaten. In Speichertabellen können Daten aus relationalen Datenbanktabellen und hierarchischen Datendateien wie XML-Meldungen und SAP-IDocs zwischengespeichert werden (die beide verschachtelte Schemas enthalten). Speichertabellen können für Folgendes verwendet werden: ● Verschieben von Daten zwischen Datenflüssen in Echtzeitjobs. Durch das Zwischenspeichern von Zwischendaten ist die Leistung von Echtzeitjobs mit mehreren Datenflüssen deutlich besser, als wenn zum Speichern der Zwischendaten Dateien oder reguläre Tabellen verwendet würden. Verwenden Sie für eine optimale Leistung Speichertabellen nur dann, wenn Sie kleine Datenmengen verarbeiten. ● Speichern von Tabellendaten im Speicher während der Dauer eines Jobs. Indem die Tabellendaten im Speicher abgelegt werden, können die LOOKUP_EXT-Funktion und andere Transformationen und Funktionen, die keine Datenbankoperationen erfordern, auf die Daten zugreifen, ohne sie aus einer Remote-Datenbank auslesen zu müssen. Die Lebensdauer der Speichertabellendaten entspricht der Dauer des Jobs. Die Daten in Speichertabellen können nicht von verschiedenen Echtzeitjobs gemeinsam verwendet werden. Die Verwendung von Speichertabellen in Batch-Jobs wird nicht unterstützt. 5.2.6.1 Definieren eines Speicher-Datastores 1. Wählen Sie im Menü Projekt die Option Neu Datastore . 2. Geben Sie in das Feld Name den Namen für den neuen Datastore ein. Verwenden Sie unbedingt die Namenskonvention "Memory_DS". Datastore-Namen werden an Tabellennamen angehängt, wenn Tabellensymbole im Arbeitsbereich angezeigt werden. Arbeitsspeichertabellen werden im Arbeitsbereich durch normale Tabellensymbole dargestellt. Daher sollten Sie einen In-Memory-Datastore so bezeichnen, dass sich seine Arbeitsspeichertabellen von normalen Datenbanktabellen im Arbeitsbereich unterscheiden. 3. Behalten Sie im Feld Datastore-Typ die Standardeinstellung Datenbank bei. 4. Wählen Sie im Feld Datenbank-Typ den Typ Arbeitsspeicher aus. Für den In-Memory-Datastore werden keine zusätzlichen Attribute benötigt. 5. Klicken Sie auf OK. 5.2.6.2 Anlegen einer Speichertabelle 1. Klicken Sie in der Toolpalette auf das Vorlagentabellen-Symbol. 2. Klicken Sie in einen Datenfluss, um die Vorlagentabelle einzufügen. Das Fenster Tabelle anlegen wird geöffnet. 3. Wählen Sie im Fenster Tabelle anlegen den Speicher-Datastore. 4. Geben Sie einen Tabellennamen ein. 82 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datastores 5. Wenn die Tabelle eine systemgenerierte Zeilen-ID-Spalte enthalten soll, aktivieren Sie das Kontrollkästchen Zeilen-ID anlegen. 6. Klicken Sie auf OK. Die Speichertabelle wird im Arbeitsbereich als Vorlagentabellen-Symbol angezeigt. 7. Verbinden Sie die Speichertabelle mit dem Datenfluss als Ziel. 8. Wählen Sie aus dem Menü Projekt die Option Speichern aus. Das Speichertabellen-Symbol im Arbeitsbereich ändert sich in ein Zieltabellen-Symbol und die Tabelle wird in der Objektbibliothek unterhalb der Tabellenliste des Speicher-Datastores angezeigt. Weitere Informationen Zeilen-ID anlegen (Option) [Seite 84] 5.2.6.3 Verwenden einer Speichertabelle als Quelle oder Ziel 1. Klicken Sie in der Objektbibliothek auf den Tab Datastores. 2. Erweitern Sie den Speicher-Datastore, der die Speichertabelle enthält, die Sie verwenden möchten. 3. Erweitern Sie Tabellen. Eine Tabellenliste wird angezeigt. 4. Wählen Sie die Speichertabelle aus, die Sie als eine Quelle oder ein Ziel verwenden möchten, und ziehen Sie sie in einen geöffneten Datenfluss. 5. Verbinden Sie die Speichertabelle als eine Quelle oder ein Ziel im Datenfluss. Wenn Sie eine Speichertabelle als ein Ziel verwenden, öffnen Sie den Zieltabelleneditor der Speichertabelle, um die Tabellenoptionen einzustellen. 6. Speichern Sie den Job. Weitere Informationen Optionen des Speichertabellenziels [Seite 84] 5.2.6.4 Schema aktualisieren (Option) Möglicherweise möchten Sie das Schema einer Arbeitsspeicher-Zieltabelle rasch aktualisieren, wenn das vorhergehende Schema geändert wurde. Verwenden Sie hierfür die Option Schema aktualisieren. Andernfalls müssten Sie eine neue Arbeitsspeichertabelle hinzufügen, um das Schema zu aktualisieren. Designer-Handbuch Datastores PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 83 1. Klicken Sie mit der rechten Maustaste auf das Symbol der Arbeitsspeicher-Zieltabelle im Arbeitsbereich. 2. Wählen Sie Schema aktualisieren. Das Schema des vorhergehenden Objekts wird verwendet, um das Schema der Arbeitsspeicher-Zieltabelle zu aktualisieren. Die aktuelle Arbeitsspeichertabelle wird in Ihrem Repository aktualisiert. Alle Instanzen der aktuellen Arbeitsspeichertabelle werden mit dem neuen Schema aktualisiert. 5.2.6.5 Optionen des Speichertabellenziels Die Option Daten vor dem Laden aus Tabelle löschen steht für Speichertabellenziele zur Verfügung. Standardmäßig ist die Option ausgewählt (das Kästchen ist aktiviert). Um diese Option festzulegen, öffnen Sie den Editor für Speicherzieltabellen. Wenn Sie diese Option deaktivieren, werden neue Daten an die bestehenden Tabellendaten angehängt. 5.2.6.6 Zeilen-ID anlegen (Option) Wenn die Option Zeilen-ID anlegen im Fenster "Speichertabelle anlegen" aktiviert ist, wird eine Ganzzahlspalte namens DI_Row_ID angelegt, in der die erste eingefügte Spalte den Wert 1 erhält, die zweite eingefügte Spalte den Wert 2 usw. Diese neue Spalte ermöglicht die Verwendung einer LOOKUP_EXT-Ausdrucks als Iterator in einem Skript. Hinweis Dieselbe Funktion ist für andere Datastore-Typen unter Verwendung der SQL-Funktion verfügbar. Verwenden Sie die Spalte DI_Row_ID, um mithilfe einer lookup_ext-Funktion in einem Skript durch eine Tabelle zu iterieren. Beispiel: $NumOfRows = total_rows (memory_DS..table1) $I = 1; $count=0 while ($count < $NumOfRows) begin $data = lookup_ext([memory_DS..table1, 'NO_CACHE','MAX'],[A],[O],[DI_Row_ID,'=',$I]); $1 = $I + 1; if ($data != NULL) begin $count = $count + 1; end end Im vorherigen Skript ist table1 eine Speichertabelle. Dem Tabellennamen wird der Datastore-Name (memory_DS), ein Punkt, ein Leerzeichen (an der Stelle in einer regulären Tabelle, an der der Tabelleneigentümer stehen würde), gefolgt von einem zweiten Punkt vorangestellt. Die Speicher-Datastores haben keine Eigentümer, so dass die Tabellen einfach durch den Datastore-Namen und durch den Tabellennamen wie angezeigt identifiziert werden. Wählen Sie bei der Definitionen einer LOOKUP_EXT-Funktion die LOOKUP_EXT-Funktionsargumente (Zeile 7) im Funktionseditor. 84 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datastores Die TOTAL_ROWS-Funktion(DatastoreName.Eigentümer.Tabellenname) gibt die Anzahl an Zeilen in einer bestimmten Tabelle in einem Datastore zurück. Diese Funktion kann mit jedem beliebigen Datastore-Typ verwendet werden. Bei Verwendung mit einem In-Memory-Datastore verwenden Sie die folgende Syntax: TOTAL_ROWS(<Datastore-Name.Tabellenname>) Außerdem verfügt die Software über eine integrierte Funktion, die Sie zum ausdrücklichen Löschen von Daten aus einer Speichertabelle verwenden können. Diese ermöglicht eine feinere Kontrolle als diejenige, die der aktive Job über Ihre Datennutzung und Speicherauslastung hat. Die Funktion TRUNCATE_TABLE (<DatastoreName.Tabellenname>) kann nur mit Arbeitsspeichertabellen verwendet werden. Weitere Informationen Referenzhandbuch: Funktionen und Prozeduren, Beschreibungen von integrierten Funktionen 5.2.6.7 Fehlerbehebung bei Arbeitsspeichertabellen ● Insbesondere bei der Verwendung von Arbeitsspeichertabellen kann der Fehler auftreten, dass nicht genügend virtueller Arbeitsspeicher für die Software zur Verfügung steht. Die Software wird beendet, wenn während der Ausführung einer beliebigen Operation der Arbeitsspeicher nicht ausreicht. ● Ein Validierungs- und Laufzeitfehler tritt auf, wenn das Schema einer Arbeitsspeichertabelle nicht mit dem Schema des vorausgehenden Objekts im Datenfluss übereinstimmt. Zum Beheben dieses Fehlers verwenden Sie die Option "Schema aktualisieren", oder legen Sie eine neue Arbeitsspeichertabelle an, die mit dem Schema des vorausgehenden Objekts im Datenfluss übereinstimmt. ● Zwei Protokolldateien enthalten spezielle Informationen zu Arbeitsspeichertabellen: die Protokolle trace_memory_reader und trace_memory_loader. 5.2.7 Persistenter Cache (Datastores) Ein Datastore des Typs "Persistenter Cache" ist ein Container für Cachetabellen. Mit der Software können Sie auch einen Datenbank-Datastore anlegen, wobei Persistenter Cache als Datenbanktyp verwendet wird. Datastores des Typs "Persistenter Cache" bieten Datenflüssen, mit denen große Datenmengen verarbeitet werden, folgende Vorzüge: ● Sie können große Datenmengen in einem persistenten Cache speichern, den die Software schnell in den Arbeitsspeicher lädt, um während eines Jobs unmittelbaren Zugriff darauf zu ermöglichen. Sie können beispielsweise lokal auf eine Lookup-Tabelle oder eine Vergleichstabelle zugreifen (statt auf eine abgesetzte Datenbank zugreifen zu müssen). ● Sie können Cachetabellen anlegen, auf die mehrere Datenflüsse gemeinsam zugreifen können (im Gegensatz zu einer Speichertabelle, die von verschiedenen Echtzeit-Jobs nicht gemeinsam verwendet werden kann). Wenn sich z.B. eine große Lookup-Tabelle, die in einer Funktion des Typs lookup_ext verwendet wird, nur selten ändert, können Sie einmal einen Cache anlegen. Dann können nachfolgende Jobs diesen Cache verwenden und müssen ihn nicht jedes Mal anlegen. Designer-Handbuch Datastores PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 85 Ein Datastore ermöglicht üblicherweise eine Verbindung mit einer Datenbank, einer Anwendung oder einem Adapter. Im Gegensatz dazu enthält ein Datastore des Typs "Persistenter Cache" Cachetabellenschemas, die im Repository gespeichert werden. Mit persistenten Cachetabellen können Sie große Datenmengen zwischenspeichern. Persistente Cachetabellen können Daten von relationalen Datenbanktabellen und Dateien zwischenspeichern. Hinweis Sie können keine Daten von hierarchischen Datendateien, wie XML-Meldungen und SAP IDocs zwischenspeichern (beide Beispiele enthalten verschachtelte Schemas). In einer persistenten Cachetabelle können Sie keine inkrementellen Einfügungen, Löschungen oder Aktualisierungen vornehmen. Sie legen eine persistente Cachetabelle an, indem Sie Daten mit einem Datenfluss in die Zieltabelle des Typs "Persistenter Cache" laden. Anschließend können Sie die Daten von der Cachetabelle in einem anderen Datenfluss lesen. Wenn Sie Daten in eine persistente Cachetabelle laden, schneidet die Software die Tabelle immer ab und legt sie neu an. 5.2.7.1 Anlegen persistenter Cache-Datastores Sie können im Fenster Datastore-Editor persistente Cache-Datastores anlegen. 1. Wählen Sie im Menü Projekt die Option Neu Datastore . 2. Geben Sie in das Feld Name den Namen für den neuen Datastore ein. Verwenden Sie unbedingt eine Namenskonvention wie „Persist_DS“. Datastore-Namen werden an Tabellennamen angehängt, wenn Tabellensymbole im Arbeitsbereich angezeigt werden. Persistente Cachetabellen werden im Arbeitsbereich durch normale Tabellensymbole dargestellt. Daher sollten Sie für einen persistenten Cache-Datastore eine Bezeichnung wählen, die eine Unterscheidung zwischen seinen persistenten Cachetabellen und den normalen Datenbanktabellen im Arbeitsbereich ermöglicht. 3. Behalten Sie im Feld Datastore-Typ die Standardoption Datenbank bei. 4. Wählen Sie im Feld Datenbanktyp die Option Persistenter Cache aus. 5. Geben Sie im Feld Cacheverzeichnis ein Verzeichnis ein, oder navigieren Sie zu einem Verzeichnis, in dem der persistente Cache gespeichert werden soll. 6. Klicken Sie auf OK. 5.2.7.2 Anlegen persistenter Cachetabellen Wenn Sie eine persistente Cachetabelle anlegen, müssen Sie weder das Schema der Tabelle angeben noch die Metadaten der Tabelle importieren. Die Software legt stattdessen das Schema für jede persistente Cachetabelle auf Basis des vorherigen Schemas automatisch an. Wenn Sie den Job das erste Mal speichern, definiert die Software das Schema der persistenten Cachetabelle und speichert die Tabelle. Danach wird die Tabelle mit einem Tabellensymbol im Arbeitsbereich und in der Objektbibliothek unter dem persistenten Cache-Datastore angezeigt. Sie können persistente Cachetabellen auf zwei Arten anlegen: 86 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datastores ● Als Zielvorlagentabelle in einem Datenfluss ● Als Teil der Data_Transfer-Transformation während der Jobausführung Weitere Informationen Referenzhandbuch: Data_Transfer 5.2.7.2.1 Anlegen einer persistenten Cachetabelle als Ziel in einem Datenfluss 1. Öffnen Sie das Fenster Vorlage anlegen mit einer der folgenden Methoden: ○ Über die Symbolleiste: 1. Klicken Sie auf das Vorlagentabellensymbol. 2. Klicken Sie innerhalb eines Datenflusses, um die Vorlagentabelle im Arbeitsbereich zu platzieren. 3. Wählen Sie im Fenster Vorlage anlegen den persistenten Cache-Datastore aus. ○ Über die Objektbibliothek: 1. Klappen Sie einen persistenten Cache-Datastore auf. 2. Klicken Sie auf das Vorlagentabellensymbol, und ziehen Sie es in den Arbeitsbereich. 2. Geben Sie im Fenster Vorlage anlegen einen Tabellennamen ein. 3. Klicken Sie auf OK. Die persistente Cachetabelle erscheint im Arbeitsbereich als Vorlagentabellensymbol. 4. Verbinden Sie die persistente Cachetabelle als Ziel mit dem Datenfluss (normalerweise eine Query- Transformation). 5. Ordnen Sie in der Query-Transformation die Eingabeschemaspalten zu, die Sie in die persistente Cachetabelle aufnehmen möchten. 6. Öffnen Sie den Zieltabelleneditor der persistenten Cachetabelle, um die Tabellenoptionen festzulegen. 7. Auf dem Tab "Optionen" des Zieltabelleneditors der persistenten Cachetabelle können Sie die folgenden Optionen für die persistente Cachetabelle ändern. ○ Spaltenvergleich – Gibt an, wie die Eingabespalten den Spalten der persistenten Cachetabelle zugeordnet werden. Es gibt zwei Optionen: ○ Nach Position vergleichen: Die Software lässt die Spaltennamen außer Acht und ordnet Quellspalten den Zielspalten nach Position zu. ○ Nach Namen vergleichen: Die Software ordnet Quellspalten den Zielspalten nach Namen zu. Diese Option ist die Standardeinstellung. ○ Doppelte Schlüssel einschließen – Aktivieren Sie dieses Kontrollkästchen, um doppelte Schlüssel zwischenzuspeichern. Diese Option ist standardmäßig ausgewählt. Designer-Handbuch Datastores PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 87 8. Geben Sie auf dem Tab "Schlüssel" die Schlüsselspalte oder die Spalten an, die in der persistenten Cachetabelle als Schlüssel zu verwenden sind. 9. Wählen Sie aus dem Menü Projekt die Option Speichern aus. Im Arbeitsbereich ändert sich das Symbol der Vorlagentabelle in ein Zieltabellensymbol, und die Tabelle wird in der Objektbibliothek in der Liste der Tabellen des persistenten Cache-Datastores geführt. Weitere Informationen Referenzhandbuch: Persistente Zielcachetabellen 5.2.7.3 Verwenden von persistenten Cachetabellen als Quellen Nachdem Sie eine persistente Cachetabelle als Ziel in einem Datenfluss angelegt haben, können Sie diese Tabelle als Quelle in einem beliebigen anderen Datenfluss verwenden. Sie können sie auch als Lockup-Tabelle oder Vergleichstabelle verwenden. Weitere Informationen Referenzhandbuch: Persistente Cachequelle 5.2.8 Verknüpfte Datastores Verschiedene Datenbankanbieter unterstützen einfachgerichtete Kommunikationswege von einem Datenbankserver zu einem anderen. Oracle nennt diese Wege Datenbankverknüpfungen. In DB2 wird der einfachgerichtete Kommunikationsweg von einem Datenbankserver zu einem anderen Datenbankserver von einem Informationsserver bereitgestellt, der es einer Reihe von Servern ermöglicht, Daten von entfernten Datenquellen zu erhalten. In Microsoft SQL Server stellen verknüpfte Server den einfachgerichteten Kommunikationsweg von einem Datenbankserver zu einem anderen bereit. Mit Hilfe dieser Lösungen können lokale Benutzer auf Daten in einer entfernten Datenbank zugreifen, die sich auf dem lokalen oder einem entfernten Rechner befinden kann. Dabei kann es sich um denselben oder einen anderen Datenbanktyp handeln. Beispielsweise kann ein lokaler Oracle-Datenbankserver mit der Bezeichnung "Bestellungen" eine Datenbankverknüpfung haben, mit der auf Daten in einer entfernten Oracle-Datenbank mit der Bezeichnung "Kunden" zugegriffen werden kann. Benutzer, die mit "Kunden" verbunden sind, können jedoch nicht dieselbe Verknüpfung für den Zugriff auf Daten in "Bestellungen" verwenden. Benutzer, die in der Datenbank "Kunden" angemeldet sind, müssen für den Zugriff auf Daten in "Bestellungen" eine gesonderte Verknüpfung definieren, die im Datenverzeichnis der Datenbank "Kunden" gespeichert ist. 88 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datastores Die Software bezeichnet Kommunikationswege zwischen Datenbanken als Datenbankverknüpfungen. Die Datastores in einer Datenbankverknüpfungsbeziehung werden als verknüpfte Datastores bezeichnet. Die Software verwendet verknüpfte Datastores zur Leistungsverbesserung, indem Operationen mit Hilfe eines ZielDatastores an eine Zieldatenbank übergeben werden (Push-down-Operationen). Weitere Informationen Performance Optimization Guide: Database link and linked remote server support for push-down operations across datastores 5.2.8.1 Beziehung zwischen Datenbankverknüpfungen und Datastores In einer Datenbankverknüpfung werden Informationen zur Herstellung einer Verbindung mit einer RemoteDatenquelle gespeichert, beispielsweise Hostname, Datenbankname, Benutzername, Kennwort und Datenbanktyp. Dieselben Informationen werden in einem Datenbank-Datastore von SAP Data Services gespeichert. Sie können den Datastore mit einem anderen Datastore verknüpfen und anschließend eine externe Datenbankverknüpfung als eine Option eines Datastores importieren. Die Datastores müssen eine Verbindung zu den in der Datenbankverknüpfung definierten Datenbanken herstellen. Zusätzliche Anforderungen: ● Ein lokaler Server für Datenbankverknüpfungen muss in der Software ein Zielserver sein ● Ein Remote-Server für Datenbankverknüpfungen muss in der Software ein Quellserver sein ● Eine externe Datenbankverknüpfung (ist zuerst in Datenbank vorhanden) stellt die Beziehung zwischen einem beliebigen Ziel-Datastore und einem Quell-Datastore her ● Ein lokaler Datastore kann sich auf keinen oder mehrere Datastores beziehen, wobei eine Datenbankverknüpfung für jede Remote-Datenbank verwendet wird ● Zwei Datastores können über nur eine Verknüpfung miteinander verknüpft sein Im folgenden Diagramm sind die möglichen Beziehungen zwischen Datenbankverknüpfungen und verknüpften Datastores dargestellt: Designer-Handbuch Datastores PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 89 Vier Datenbankverknüpfungen, DB-Verknüpfung 1 bis 4, sind auf Datenbank DB1, und werden von der Software über Datastore DS1 gelesen. ● DB-Verknüpfung 1 verknüpft Datastore DS1 mit Datastore DS2. Diese Beziehung wird als verknüpfter Datastore DB-Verknüpfung1 bezeichnet (der verknüpfte Datastore hat denselben Namen wie die externe Datenbankverknüpfung). ● DB-Verknüpfung 2 ist keinem Datastore in der Software zugeordnet, da sie DS1 mit DS2 verbindet, die ebenfalls über DB-Verknüpfung 1 verbunden sind. Auch wenn dies nicht üblich ist, können Sie mehrere externe Datenbankverknüpfungen anlegen, die eine Verbindung mit derselben Remote-Quelle herstellen. Die Software ermöglicht jedoch nur eine Datenbankverknüpfung zwischen einem Ziel-Datastore-/QuellDatastore-Paar. Wenn Sie beispielsweise DB-Verknüpfung 1 wählen, um den Ziel-Datastore Ds1 mit dem Quell-Datastore DS2 zu verbinden, können Sie nicht die DB-Verknüpfung 2 für dieselbe Aktion importieren. ● DB-Verknüpfung 3 ist in der Software keinem Datastore zugeordnet, da für die Remote-Datenquelle kein Datastore definiert wurde, auf den die externe Datenbankverknüpfung verweist. ● DB-Verknüpfung 4 verbindet DS1 mit DS3. Weitere Informationen Referenzhandbuch: Datastore-Editor 5.3 Adapter-Datastores Adapter-Datastores ermöglichen Ihnen, eine Verbindung mit Adaptern herzustellen. Je nach Adapterimplementierung ermöglichen Ihnen Adapter Folgendes: ● Durchsuchen von Anwendungsmetadaten ● Importieren von Anwendungsmetadaten in ein Repository ● Verschieben von Batch- und Echtzeitdaten zwischen der Software und Anwendungen SAP bietet ein Software Development Kit (SDK) für Adapter, mit dem Sie eigene Adapter entwickeln können. Außerdem können Sie die vordefinierten Adapter der Software erwerben, um auf Metadaten und andere Daten beliebiger Anwendungen zuzugreifen. Weitere Informationen zu diesen Produkten erhalten Sie von dem für Sie zuständigen SAP-Vertriebsmitarbeiter. Adapter werden im Designer durch Adapter-Datastores dargestellt. Mithilfe von Jobs können Daten in Batches und Echtzeit zwischen der Software und Anwendungen verschoben werden. Hierzu kommen untergeordnete Objekte eines Adapter-Datastores zum Einsatz: Tabelle 37: Untergeordnete Objekte Verwendungsart Verwendet für Tabellen Quelle oder Ziel Batch-Datenverschiebung Dokumente Quelle oder Ziel 90 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datastores Untergeordnete Objekte Verwendungsart Funktionen Funktionsaufruf in Abfrage Meldungsfunktionen Funktionsaufruf in Abfrage Ausgehende Meldungen Nur Ziel Verwendet für Echtzeit-Datenverschiebung Adapter bieten Zugriff auf die Daten und Metadaten oder nur die Metadaten einer Anwendung. Wenn die Datenquelle beispielsweise SQL-kompatibel ist, könnte der Adapter Zugriff auf Metadaten ermöglichen, während die Software Daten aus der Anwendung extrahiert bzw. direkt in die Anwendung lädt. Ausführliche Informationen über Installation, Konfiguration und Verwendung von Adaptern finden Sie im Supplement for Adapters. Weitere Informationen Quell- und Zielobjekte [Seite 158] Echtzeitquell- und -zielobjekte [Seite 267] Supplement for Adapters: Data Services adapters Management-Console-Handbuch: Adapter 5.4 Web-Service-Datastores Web-Service-Datastores stellen eine Verbindung von Data Services zu einer externen web-service-basierten Datenquelle dar. 5.4.1 Definieren eines Web-Service-Datastore Sie müssen mindestens einen Datastore für jeden Web-Service definieren, mit dem Sie Daten austauschen. Zum Definieren eines Datastores müssen Sie über ausreichende Zugriffsberechtigungen für die Web-Services verfügen, die der Datastore beschreibt. 1. Klicken Sie auf dem Tab Datastores der Objektbibliothek mit der rechten Maustaste, und wählen Sie Neu aus. 2. Geben Sie den Namen des neuen Datastores im Feld Datastore-Name ein. Der Name darf beliebige alphabetische oder numerische Zeichen oder Unterstriche (_) enthalten. Er darf keine Leerzeichen enthalten. 3. Wählen Sie den Datastore-Typ aus. Wählen Sie eine Web-Service-Option. Wenn Sie einen Datastore-Typ auswählen, zeigt Data Services weitere Optionen an, die für diesen Typ relevant sind. Designer-Handbuch Datastores PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 91 4. Geben Sie die Web-Service-URL an. Die URL muss Verbindungen akzeptieren und die WSDL zurückgeben. Für REST-Web-Services können Sie eine URL oder den Pfad zur lokalen WADL-Datei eingeben. Weitere Informationen zu WSDL- und WADLDateien finden Sie unter „Web Services Technologies“ im Integrator's Guide. 5. Klicken Sie auf OK. Die Datastore-Konfiguration wird in Ihrem Metadaten-Repository gespeichert, und der neue Datastore wird in der Objektbibliothek angezeigt. 5.4.2 Ändern der Konfiguration eines Web-ServiceDatastores 1. Klicken Sie mit der rechten Maustaste auf den zu durchsuchenden Datastore, und wählen Sie Bearbeiten, um das Fenster Datastore-Editor zu öffnen. 2. Bearbeiten Sie die Konfigurationsdaten. 3. Klicken Sie auf OK. Die geänderte Datastore-Konfiguration wird im Metadaten-Repository gespeichert. 5.4.3 Löschen von Web-Service-Datastores und verknüpften Metadatenobjekten 1. Klicken Sie mit der rechten Maustaste auf den zu löschenden Datastore und wählen Löschen. 2. Klicken Sie im Bestätigungsfenster auf OK. Data Services entfernt den Datastore und alle darin enthaltenen Metadatenobjekte aus dem MetadatenRepository. Wenn diese Objekte in eingerichteten Datenflüssen vorhanden sind, werden Sie mit einem "Gelöscht" Symbol angezeigt. 5.4.4 Durchsuchen von WSDL- und WADL-Metadaten über einen Web-Service-Datastore Data Services speichert Metadateninformationen für alle importierten Objekte in einem Datastore. Sie können mit Data Services Metadaten für importierte oder nicht importierte Objekte anzeigen und außerdem prüfen, ob sich Metadaten für bereits importierte Objekte geändert haben. Weitere Informationen zu WSDL- und WADL-Dateien finden Sie unter „Web services technologies“ (Web-ServiceTechnologien) im Integrator's Guide. 92 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datastores 5.4.4.1 Anzeigen von importierten Objekten 1. Öffnen Sie in der Objektbibliothek den Tab Datastores. 2. Klicken Sie auf das Pluszeichen (+) neben dem Namen des gewünschten Datastores, um die darin enthaltenen Objekttypen anzuzeigen. Web-Service-Datastores verfügen über Funktionen. 3. Klicken Sie auf das Pluszeichen (+) neben einem Objekttyp, um die aus dem Datastore importierten Objekte dieses Typs anzuzeigen. 5.4.4.2 Sortieren der Objektliste Klicken Sie auf die Spaltenüberschrift, um die Objekte in den einzelnen Gruppierungen und die Gruppierungen in den einzelnen Datastores alphabetisch zu sortieren. Klicken Sie erneut, um in umgekehrter alphabetischer Reihenfolge zu sortieren. 5.4.4.3 Anzeigen von WSDL- und WADL-Metadaten 1. Wählen Sie in der Objektbibliothek den Tab Datastores aus. 2. Markieren Sie einen Datastore, klicken Sie mit der rechten Maustaste, und wählen Sie Öffnen aus. (Alternativ können Sie auf das Datastore-Symbol doppelklicken.) Data Services öffnet den Datastore-Explorer im Arbeitsbereich. Im Datastore-Explorer sind die Web-ServicePorts und -Operationen im Datastore aufgelistet. Sie können Ports und Operationen im externen Web-Service oder im internen Repository anzeigen. Außerdem haben Sie die Möglichkeit, diese zu durchsuchen. 3. Wählen Sie Externe Metadaten, um Web-Service-Ports und -Operationen aus der externen WSDL- oder WADL-Datei anzuzeigen. Weitere Informationen zu WSDL- und WADL-Dateien finden Sie unter „Web Services Technologies“ im Integrator's Guide. Wenn Sie eine oder mehrere Operationen ausgewählt haben, können Sie mit der rechten Maustaste klicken, um weitere Optionen anzuzeigen. Tabelle 38: Befehl Beschreibung Importieren Importiert Operationen aus der Datenbank in das Repository (oder importiert diese er neut). 4. Wählen Sie "Repository-Metadata" aus, um importierte Web-Serviceoperationen anzuzeigen. Wenn Sie eine oder mehrere Operationen ausgewählt haben, können Sie mit der rechten Maustaste klicken, um weitere Optionen anzuzeigen. Tabelle 39: Befehl Beschreibung Löschen Löscht die Operation(en) aus dem Repository. Eigenschaften Zeigt die Eigenschaften der ausgewählten Web-Serviceoperation an. Designer-Handbuch Datastores PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 93 5.4.5 Importieren von Metadaten über einen Web-ServiceDatastore Bei Web-Service-Datastores können Sie Metadaten für Web-Service-Operationen importieren. 5.4.5.1 Importieren von Web-Service-Operationen 1. Klicken Sie mit der rechten Maustaste auf den zu durchsuchenden Datastore, und wählen Sie anschließend Öffnen. 2. Suchen Sie die zu importierende Web-Service-Operation in der durchsuchbaren Liste aus. 3. Klicken Sie mit der rechten Maustaste auf die Operation und wählen Importieren. Die Operation wird in den Funktionscontainer des Web-Service-Datastores importiert. 5.5 Ändern einer Datastore-Definition Wie alle Objekte werden Datastores durch Optionen und Eigenschaften definiert. Optionen steuern die Funktionsweise von Objekten. Der Name der Datenbank, zu der die Verbindung hergestellt wird, ist beispielsweise eine Datastore-Option. Eigenschaften dokumentieren das Objekt. Der Name des Datastores und das Datum seiner Anlage sind beispielsweise Datastore-Eigenschaften. Eigenschaften beschreiben lediglich das Objekt und wirken sich nicht auf seine Funktionsweise aus. 5.5.1 Ändern von Datastore-Optionen 1. Gehen Sie in der Objektbibliothek zum Tab Datastores. 2. Klicken Sie mit der rechten Maustaste auf den Namen des Datastores, und wählen Sie Bearbeiten aus. Der Datastore-Editor wird angezeigt (die Titelleiste dieses Dialogfensters lautet "Datastore bearbeiten"). Sie können folgende Aufgaben ausführen: ○ Ändern Sie die Verbindungsinformationen für die aktuelle Datastore-Konfiguration. ○ Klicken Sie auf Erweitert, und ändern Sie die Eigenschaften für die aktuelle Konfiguration. ○ Klicken Sie auf Bearbeiten, um andere Konfigurationen hinzuzufügen, zu bearbeiten oder zu löschen. Wenn Sie im Datastore-Editor Bearbeiten auswählen, wird das Dialogfenster Konfigurationen für den Datastore geöffnet. Nachdem Sie eine neue Konfiguration zu einem bestehenden Datastore hinzugefügt haben, können Sie mit den Feldern der Tabelle Verbindungswerte und -eigenschaften für die neue Konfiguration ändern. 3. Klicken Sie auf OK. Die Optionen werden sofort wirksam. 94 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datastores Weitere Informationen Referenzhandbuch: Datenbank-Datastores 5.5.2 Ändern von Datastore-Eigenschaften 1. Wechseln Sie in der Objektbibliothek zum Tab "Datastore". 2. Klicken Sie mit der rechten Maustaste auf den Namen des Datastores, und wählen Sie Eigenschaften aus. Das Fenster "Eigenschaften" wird geöffnet. 3. Ändern Sie die Eigenschaften des Datastores. 4. Klicken Sie auf OK. Weitere Informationen Referenzhandbuch: Datastore 5.6 Anlegen und Verwalten mehrerer DatastoreKonfigurationen Wenn Sie mehrere Konfigurationen für einen einzigen Datastore anlegen, können Sie separate DatastoreVerbindungen für ähnliche Quellen und Ziele in einen einzigen Quell- oder Ziel-Datastore mit mehreren Konfigurationen konsolidieren. Anschließend können Sie beim Ausführen oder Einplanen des Jobs durch Auswählen einer Systemkonfiguration eine Gruppe von Konfigurationen auswählen, die die gewünschten Quellen und Ziele enthält. Die Möglichkeit zur Anlage mehrerer Datastore-Konfigurationen erhöht die Benutzerfreundlichkeit in Szenarien für Jobportabilität, z.B.: ● OEM (verschiedene Datenbanken für Entwurf und Verteilung) ● Migration (verschiedene Verbindungen für DEV, TEST und PROD) ● Mehrere Instanzen (Datenbanken mit verschiedenen Versionen oder Gebietsschemas) ● Mehrere Benutzer (Datenbanken für zentrale und lokale Repositorys) Weitere Informationen Portabilitätslösungen [Seite 100] Designer-Handbuch Datastores PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 95 5.6.1 Definitionen Mit einigen Begriffen sollten Sie vertraut sein, wenn Sie mehrere Datastore-Konfigurationen anlegen und verwalten. Tabelle 40: Begriff Definition Datastore-Konfiguration Erlaubt es Ihnen, mehrere Metadatenquellen oder -ziele für Datastores bereitzustellen. Jede Konfiguration ist eine Eigenschaft eines Datastores, die auf einen Satz konfigurierba rer Optionen (wie Datenbankverbindungsname, Datenbanktyp, Benutzername, Kennwort und Gebietsschema) und deren Werte verweist. Standard-Datastore-Konfigura tion Die Datastore-Konfiguration, die von der Software für das Durchsuchen und Importieren von Datenbankobjekten (Tabellen und Funktionen) und das Ausführen von Jobs verwen det wird, wenn keine Systemkonfiguration angegeben wird. Wenn ein Datastore über meh rere Konfiguration verfügt, wählen Sie nach Bedarf eine Standardkonfiguration aus. Wenn ein Datastore über nur eine Konfiguration verfügt, wird sie von der Software als Standard konfiguration verwendet. Aktuelle Datastore-Konfiguration Die Datastore-Konfiguration, die von der Software verwendet wird, um einen Job auszu führen. Wenn Sie eine Systemkonfiguration definieren, wird der Job mit der Systemkonfi guration ausgeführt. Geben Sie für jede Systemkonfiguration eine aktuelle Konfiguration an. Wenn Sie keine Systemkonfiguration anlegen oder in der Systemkonfiguration keine Konfiguration für einen Datastore angegeben ist, wird bei der Jobausführung die Stan dard-Datastore-Konfiguration als aktuelle Konfiguration verwendet. Datenbankobjekte Die aus einem Datastore importierten Tabellen und Funktionen. Datenbankobjekte haben üblicherweise zwei Eigentümer. Einige Datenbankobjekte haben keinen Eigentümer. Da tenbankobjekte in einem ODBC-Datastore, die eine Verbindung mit einer Access-Daten bank herstellen, haben keine Eigentümer. Eigentümername Der Eigentümername eines Datenbankobjekts (beispielsweise einer Tabelle) in einer zu grunde liegenden Datenbank. Auch als Datenbank-Eigentümername oder physischer Ei gentümername bezeichnet. Alias Ein logischer Eigentümername. Sie erstellen einen Alias für Objekte, die sich in verschie denen Datenbankumgebungen befinden, wenn Sie verschiedene Eigentümernamen in die sen Umgebungen haben. Sie können mit dem Datastore-Editor einen Alias für jede Data store-Konfiguration anlegen. Abhängige Objekte Abhängige Objekte sind die Jobs, Workflows, Datenflüsse und benutzerdefinierten Funkti onen, in denen ein Datenbankobjekt verwendet wird. Die Informationen abhängiger Ob jekte werden vom Verwendungsnachweishilfsprogramm generiert. 5.6.2 Zweck von mehreren Datastore-Konfigurationen Durch die Anlage mehrere Datastore-Konfigurationen können Sie die Entwicklungszeit in einer rund um die Uhr verfügbaren Unternehmens-Data-Warehouse-Umgebung mit mehreren Quellen insgesamt verkürzen, da sich Jobs leicht unter verschiedenen Datenbanktypen, Versionen und Instanzen übertragen lassen. Die Übertragung kann beispielsweise so einfach wie folgt sein: 1. Sie legen eine neue Konfiguration innerhalb eines vorhandenen Quell- oder Ziel-Datastores an. 2. Sie fügen einen Datastore-Alias hinzu, und ordnen diesem dann Konfigurationen mit unterschiedlichen Objekteigentümernamen zu. 96 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datastores 3. Sie definieren eine Systemkonfiguration und fügen anschließend Datastore-Konfigurationen hinzu, die für eine bestimmte Umgebung benötigt werden. Sie wählen eine Systemkonfiguration aus, wenn Sie einen Job ausführen. 5.6.3 Anlegen einer neuen Konfiguration Sie können mehrere Konfigurationen für alle Datastore-Typen mit Ausnahme von Speicher-Datastores anlegen. Verwenden Sie den Datastore-Editor, um Datastore-Konfigurationen anzulegen und zu bearbeiten. Weitere Informationen Referenzhandbuch: Beschreibung von Objekten, Datastore 5.6.3.1 Anlegen einer neuen Datastore-Konfiguration 1. Klicken Sie auf dem Tab "Datastores" der Objektbibliothek mit der rechten Maustaste auf einen vorhandenen Datastore und wählen Bearbeiten. 2. Klicken Sie auf Erweitert, um vorhandene Konfigurationsinformationen anzuzeigen. Jeder Datastore benötigt mindestens eine Konfiguration. Falls nur eine Konfiguration vorhanden ist, ist dies die Standardkonfiguration. 3. Klicken Sie auf Bearbeiten, um das Fenster „Konfigurationen für den Datastore“ anzuzeigen. 4. Klicken Sie in der Symbolleiste auf das Symbol Neue Konfiguration anlegen. Die Fenster "Neue Konfiguration anlegen" wird geöffnet. 5. Führen Sie im Fenster "Neue Konfiguration anlegen" folgende Schritte aus: a. Geben Sie eine eindeutigen, logischen Konfigurationsnamen ein. b. Wählen Sie im Drop-Down-Menü einen Datenbanktyp aus. c. Wählen Sie im Drop-Down-Menü eine Datenbankversion aus. d. Im Bereich "Werte für Zieltabellen und SQL-Transformationen" wird der Wert Werte verwenden aus basierend auf dem vorhandenen Datenbanktyp und der vorhandenen Datenbankversion vorbelegt. Der Designer verwendet die vorhandenen SQL-Transformations- und Zielwerte für denselben Datenbanktyp und dieselbe Datenbankversion. Wenn die Datenbank, die Sie mit einer neuen Konfiguration verknüpfen möchten, eine höhere Version als die mit anderen vorhandenen Konfigurationen verknüpfte Datenbank ist, füllt der Designer die Option Werte verwenden aus automatisch aus der früheren Version. Falls der Datenbanktyp und die Datenbankversion noch in keiner vorhandenen Konfiguration angegeben wurden, oder wenn die Datenbankversion älter als Ihre vorhandene Konfiguration ist, können Sie die Werte aus einer anderen vorhandenen Konfiguration oder den Standardwert für den Datenbanktyp und die Datenbankversion verwenden. Designer-Handbuch Datastores PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 97 e. Wählen Sie die Option Werte wiederherstellen, wenn sie bereits vorhanden sind aus, oder heben Sie ihre Auswahl auf. Wenn Sie Datastore-Konfigurationen löschen, werden alle zugehörigen Zielwerte und SQLTransformationen gespeichert. Wenn Sie eine neue Datastore-Konfiguration mit demselben Datenbanktyp und derselben Datenbankversion wie die zuvor gelöschte anlegen, können Sie über die Option "Werte wiederherstellen, wenn sie bereits vorhanden sind" auf die gespeicherten Werteeinstellungen zugreifen und diese nutzen.) ○ Wenn Sie diese Option beibehalten (standardmäßig ausgewählt), verwendet die Software die angepassten Ziel- und SQL-Transformationswerte aus zuvor gelöschten Datastore-Konfigurationen. ○ Wenn Sie Werte wiederherstellen, wenn Sie bereits vorhanden sind deaktivieren, wird nicht versucht, die Ziel- und SQL-Transformationswerte wiederherzustellen, so dass Sie neue Werte eingeben können. f. Klicken Sie auf OK, um die neue Konfiguration zu speichern. Falls Ihr Datastore bereits vorhandene Datenflüsse mit SQL-Transformationen oder Zielobjekten verwendet, muss die Software diesen Transformations- und Zielobjekten neue Datenbanktyp- und versionswerte hinzufügen. Unter diesen Umständen wird, wenn Sie eine neue Datastore-Konfiguration hinzufügen, das Fenster Neue Werte hinzugefügt – geänderte Objekte angezeigt, das detaillierte Informationen zu betroffenen Datenflüssen und geänderten Objekten anzeigt. Dieselben Ergebnisse werden auch im Ausgabefenster des Designers angezeigt. Für jeden Datastore muss eine Konfiguration als Standardkonfiguration definiert sein. Die Standardkonfiguration wird zum Importieren von Metadaten verwendet. Darüber hinaus wird die Standardkonfiguration während des Exports und sowie bei Mehrbenutzeroperationen beibehalten. Ihre erste Datastore-Konfiguration wird automatisch als Standardkonfiguration festgelegt; nachdem Sie jedoch eine oder mehrere weitere DatastoreKonfigurationen hinzugefügt haben, können Sie mit dem Datastore-Editor eine andere Konfiguration als Standardkonfiguration auswählen. Beim Export eines Repositorys werden alle Konfigurationen in allen Datastores beibehalten, einschließlich zugehöriger SQL-Transformationstext und Zieltabelleneditor-Einstellungen. Wenn der Datastore, den Sie gerade exportieren, bereits im Ziel-Repository vorhanden ist, werden die Konfigurationen im Ziel mit Quellkonfigurationen überschrieben. Die Systemkonfigurationen werden separat von anderen jobbezogenen Objekten exportiert. 5.6.4 Hinzufügen eines Datastore-Alias Sie können im Datastore-Editor mehrere Aliase für einen Datastore anlegen und dann jedem Alias DatastoreKonfigurationen zuordnen. 5.6.4.1 Anlegen eines Alias 1. Klicken Sie im Datastore-Editor auf Erweitert und dann auf Aliase (zum Anlegen hier klicken). Das Fenster "Neuen Alias anlegen" wird geöffnet. 2. Verwenden Sie unter Aliasname in Designer nur alphanumerische Zeichen und das Unterstrichzeichen (_) zur Eingabe eines Aliasnamens. 98 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datastores 3. Klicken Sie auf OK. Das Fenster Neuen Alias anlegen wird geschlossen, und der neue Alias erscheint unter der Kategorie "Aliase". Wenn Sie einen Datastore-Alias definieren, ersetzt die Software den angegebenen Datastore-Konfigurationsalias durch den tatsächlichen Eigentümernamen, wenn Sie Metadaten für Datenbankobjekte importieren. Nach dem Import von Tabellen und Funktionen können Sie diese auch umbenennen. Weitere Informationen Umbenennen von Tabellen- und Funktionseigentümern [Seite 106] 5.6.5 Funktionen zum Identifizieren der Konfiguration Die Software bietet Funktionen, die beim Arbeiten mit mehreren Quell- und Ziel-Datastore-Konfigurationen nützlich sind. Tabelle 41: Funktion Kategorie Beschreibung db_type Verschiedenes Gibt den Datenbanktyp der aktuellen Datastore-Konfiguration zurück. db_version Verschiedenes Gibt die Datenbankversion der aktuellen Datastore-Konfigura tion zurück. db_database_name Verschiedenes Gibt den Datenbanknamen der aktuellen Datastore-Konfigura tion zurück, wenn es sich bei dem Datenbanktyp um MS SQL Server oder SAP ASE handelt. db_owner Verschiedenes Gibt den Namen des tatsächlichen Eigentümers zurück, der dem gegebenen Aliasnamen unter der aktuellen DatastoreKonfiguration entspricht. current_configuration Verschiedenes Gibt den Namen der Datastore-Konfiguration zurück, die zur Laufzeit verwendet wird. current_system_configura tion Verschiedenes Gibt den Namen der aktuellen Systemkonfiguration zurück. Wenn keine Systemkonfiguration definiert ist, wird ein NULLWert zurückgegeben. Alle SQL-Transformations- und Zieltabelleneditor-Einstellungen, die in einem Datenfluss verwendet werden, werden mit den Datastore-Konfigurationen verknüpft. Sie können bei diesen Funktionen auch Variableninterpolation in SQL-Text verwenden, um einer SQL-Transformation unabhängig davon, welche Konfiguration vom Jobserver zur Jobausführungszeit verwendet wird, eine erfolgreiche Ausführung zu ermöglichen. Designer-Handbuch Datastores PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 99 Wählen Sie mithilfe des Administrators eine Systemkonfiguration aus, und zeigen Sie die zugehörige zugrunde liegende Datastore-Konfiguration an, wenn Sie Folgendes tun: ● Batch-Jobs ausführen ● Batch-Jobs planen ● Batch-Jobverlauf anzeigen ● Dienste für Echtzeitjobs anlegen Um mehrere Konfigurationen erfolgreich zu verwenden, entwerfen Sie Ihre Jobs so, dass Sie keine Schemas, Datentypen, Funktionen, Variablen usw. ändern müssen, wenn Sie zwischen den Datastore-Konfigurationen wechseln. Wenn Sie beispielsweise einen Datastore mit einer Konfiguration für Oracle-Quellen und SQL-Quellen haben, stellen Sie sicher, dass die Tabellen-Metadatenschemas exakt übereinstimmen. Verwenden Sie die gleichen Tabellennamen, Aliasnamen, Spaltenanzahl und -reihenfolge sowie die gleichen Spaltennamen, Datentypen und Inhaltstypen. Weitere Informationen Referenzhandbuch: Beschreibung der integrierten Funktionen Referenzhandbuch: SQL Tipps zur Jobportabilität [Seite 104] 5.6.6 Portabilitätslösungen Legen Sie mehrere Quell- oder Zielkonfigurationen für einen einzelnen Datastore fest, wenn Sie die Verbindungen schnell auf eine andere Quell- oder Zieldatenbank ändern möchten. Die Software bietet verschiedene Lösungen zum Portieren von Jobs. Weitere Informationen Mehrbenutzerumgebung [Seite 738] Arbeiten in einer Mehrbenutzerumgebung [Seite 751] 5.6.6.1 Migration zwischen Umgebungen Die Verschiebung von Repository-Metadaten in eine andere Umgebung (z.B. aus der Entwicklungs- in die Testumgebung oder aus der Test- in die Produktivumgebung) verwendet unterschiedliche Quell- und Zieldatenbanken. Der Prozess schließt normalerweise folgende Eigenschaften ein: ● Die Umgebungen verwenden denselben Datenbanktyp, können aber eindeutige Datenbankversionen oder Gebietsschemas haben. 100 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datastores ● Datenbankobjekte (Tabellen und Funktionen) können verschiedenen Eigentümern gehören. ● Jede Umgebung verfügt über einen eindeutigen Datenbankverbindungsnamen, einen Benutzernamen, ein Kennwort, andere Verbindungseigenschaften und eine Eigentümerzuordnung. ● Sie verwenden eine typische Repository-Migrationsprozedur. Entweder exportieren Sie Jobs in eine ATLDatei und importieren dann die ATL-Datei in ein anderes Repository, oder Sie exportieren Jobs direkt von einem Repository in ein anderes Repository. Da Datastore-Konfigurationen beim Export überschrieben werden, sollten Sie Konfigurationen für die Zielumgebung (fügen Sie beispielsweise beim Migrieren von der Entwicklungs- zur Testumgebung Konfigurationen für die Testumgebung hinzu) zum Quell-Repository hinzufügen (fügen Sie beispielsweise die Konfigurationen dem Entwicklungs-Repository hinzu, bevor Sie in die Testumgebung migrieren). Das ExportHilfsprogramm speichert zusätzliche Konfigurationen in der Zielumgebung, was bedeutet, dass Sie Datastores nicht bearbeiten müssen, bevor Sie übertragene Jobs in der Zielumgebung ausführen. Diese Lösung bietet folgende Vorteile: ● Minimale Ausfallzeit der Produktion: Sie können Jobs direkt nach dem Exportieren starten. ● Minimale Sicherheitsprobleme: Tester und Operatoren in der Produktion benötigen keine Berechtigung, um Repository-Objekte zu ändern. Weitere Informationen Administratorhandbuch: Exportieren und Importieren 5.6.6.2 Laden mehrerer Instanzen Wenn Sie mehrere Instanzen einer Datenquelle in ein Ziel-Data-Warehouse laden müssen, ist die Aufgabe die gleiche wie im Migrationsszenario, außer dass Sie nur ein Repository verwenden. 5.6.6.2.1 Laden mehrerer Instanzen einer Datenquelle in ein Ziel-Data-Warehouse 1. Legen Sie einen Datastore an, der mit einer bestimmten Instanz verbunden ist. 2. Definieren Sie die erste Datastore-Konfiguration. Diese Datastore-Konfiguration enthält alle konfigurierbaren Eigenschaften wie Datenbanktyp, Database-Verbindungsname, Benutzername, Kennwort, Datenbankversion und Gebietsschemainformationen. Wenn Sie für einen Adapter-Datastore eine Konfiguration definieren, stellen Sie sicher, dass der relevante Jobserver ausgeführt wird, damit der Designer alle verfügbaren Adapterinstanzen für den Datastore finden kann. 3. Definieren Sie in der Datastore-Konfiguration einen Zuordnungssatz zwischen Alias und Eigentümer. Wenn Sie einen Alias für eine Konfiguration verwenden, werden alle Objekte anhand des Metadatenalias statt des tatsächlichen Eigentümernamens importiert. So können Sie Datenbankobjekte für Jobs verwenden, die für andere Datenbankinstanzen transparent sind. Designer-Handbuch Datastores PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 101 4. Verwenden Sie das Tool zur Umbenennung von Datenbankobjekt-Eigentümern, um Eigentümer aller vorhandenen Datenbankobjekte umzubenennen. 5. Importieren Sie Datenbankobjekte, und entwickeln Sie Jobs mithilfe dieser Objekte, und führen Sie dann die Jobs aus. 6. Um die Ausführung von Jobs unter verschiedenen Instanzen zu unterstützen, fügen Sie jeder zusätzlichen Instanz Datastore-Konfigurationen hinzu. 7. Ordnen Sie den in einem früheren Schritt definierten Aliasen Eigentümernamen aus den neuen Datenbankinstanz-Konfigurationen zu. 8. Führen Sie die Jobs in allen Datenbankinstanzen aus. Weitere Informationen Umbenennen von Tabellen- und Funktionseigentümern [Seite 106] 5.6.6.3 OEM-Deployment Sie können Jobs für einen Datenbanktyp entwerfen und auf anderen Datenbanktypen als OEM-Partner implementieren. Die Implementierung schließt normalerweise folgende Eigenschaften ein: ● Diese Instanzen erfordern verschiedene Quell-Datenbanktypen und Versionen. ● Da ein Datastore jeweils nur auf eine Instanz zugreifen kann, müssen Sie möglicherweise Funktionen zur Laufzeit auslösen, um die verschiedenen Instanzen abzugleichen. In diesem Fall benötigt die Software unterschiedlichen SQL-Text für Funktionen (beispielsweise lookup_ext und sql) und Transformationen (beispielsweise die SQL-Transformation). Die Software benötigt außerdem verschiedene Einstellungen für die Zieltabelle (im Zieltabelleneditor konfigurierbar). ● Die Instanzen können verschiedene Gebietsschemata verwenden. ● Datenbanktabellen in verschiedenen Datenbanken gehören verschiedenen Eigentümern. ● Jede Datenbank hat einen eindeutigen Datenbank-Verbindungsnamen, Benutzernamen, ein eindeutiges Kennwort, andere Verbindungseigenschaften und Eigentümerzuordnungen. ● Sie exportieren Jobs für das Deployment in ATL-Dateien. 5.6.6.3.1 Implementieren von Jobs in andere Datenbanktypen als OEM-Partner 1. Entwickeln Sie Jobs für einen bestimmten Datenbanktyp, indem Sie die im Laden mehrerer Instanzen [Seite 101]-Szenario beschriebenen Schritte ausführen. Um eine neue Instanz unter einem neuen Datenbanktyp zu unterstützen, werden die Zieltabellen- und SQLTransformations-Datenbankeigenschaften von der vorherigen Konfiguration beim Speichern in jede zusätzliche Konfiguration kopiert. 102 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datastores Wenn Sie eine Bulkloader-Methode für mindestens eine Zieltabelle in den Datenflüssen Ihres Jobs ausgewählt haben und neue Konfigurationen auf verschiedene Datenbanktypen angewendet werden, öffnen Sie die Ziele, und legen Sie die Bulkloader-Option manuell fest (vorausgesetzt Sie möchten die Bulkloader-Methode auch beim neuen Datenbanktyp verwenden). Es werden keine Bulkloader-Optionen für Ziele von einem Datenbanktyp zu einem anderen kopiert. Beim Speichern einer neuen Konfiguration wird auch ein Bericht generiert, der eine Liste der automatisch für Massenladen festgelegten Ziele liefert. Sehen Sie sich diesen Bericht an, um nach Bedarf manuelle Änderungen vorzunehmen. 2. Wenn der SQL-Text in irgendeiner SQL-Transformation nicht auf den neuen Datenbanktyp angewendet werden kann, ändern Sie den SQL-Text für den neuen Datenbanktyp. Wenn der SQL-Text hartkodierte Eigentümernamen oder Datenbanknamen enthält, sollten Sie diese Namen durch Variablen ersetzen, um Eigentümernamen oder Datenbanknamen für mehrere Datenbanktypen bereitzustellen. So brauchen Sie den SQL-Text nicht für jede Umgebung zu ändern. 3. Da die Software keinen einzigartigen SQL-Text für jeden Datenbanktyp oder jede Version der sql()-, lookup_ext()- und pushdown_sql()-Funktionen unterstützt, rufen Sie den Datenbanktyp und die Version der aktuellen Datastore-Konfiguration mithilfe von db_type() und ähnlichen Funktionen ab, und liefern Sie den richtigen SQL-Text für diesen Datenbanktyp und diese Version mithilfe der Variablenersetzungs(Interpolations-)Technik. Weitere Informationen Referenzhandbuch: SQL 5.6.6.4 Mehrbenutzerentwicklung Bei der Verwendung des zentralen Repository-Management-Systems können mehrere Entwickler, die über eigene lokale Repositorys verfügen, Jobs ein- und auschecken. Die Entwicklungsumgebung schließt normalerweise folgende Eigenschaften ein: ● Sie verfügt über ein zentrales Repository und eine Reihe von lokalen Repositorys. ● Mehrere Entwicklungsumgebungen werden von Zeit zu Zeit zusammengeführt (über Operationen im zentralen Repository wie Ein- und Auschecken). Wenn dies der Fall ist, müssen die echten Eigentümernamen (die anfangs zum Importieren von Objekten verwendet werden) später einem Satz an Aliasen zugeordnet werden, die von allen Benutzern gemeinsam verwendet werden. ● Der Objektverlauf (Versionen und Bezeichnungen) bleibt in der Software erhalten. ● Die Instanzen verwenden denselben Datenbanktyp, können jedoch unterschiedliche Versionen und Gebietsschemas aufweisen. ● Datenbankobjekte können zu verschiedenen Eigentümern gehören. ● Jede Instanz hat einen eindeutigen Datenbankverbindungsnamen, -benutzernamen, -kennwort, weitere Verbindungseigenschaften und eine eindeutige Benutzerzuordnung. Im Mehrbenutzer-Entwicklungsszenario müssen Sie Aliase definieren, damit der Verlauf für alle Objekte in der gemeinsamen Umgebung ordnungsgemäß beibehalten werden kann. Designer-Handbuch Datastores PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 103 5.6.6.4.1 Portieren von Jobs in eine Mehrbenutzerumgebung Beachten Sie beim Portieren von Jobs in eine Mehrbenutzerumgebung Folgendes: ● Benennen Sie Tabelleneigentümer und Funktionseigentümer um, um ObjektdatenbankObjekteigentümernamen in Aliase zu konsolidieren. ○ Die Umbenennung erfolgt in lokalen Repositorys. Um die im zentralen Repository gespeicherten Datenbankobjekte umzubenennen, checken Sie den Datastore in ein lokales Repository aus und wenden das Umbenennungstool im lokalen Repository an. ○ Wenn die umzubenennden Objekte abhängige Objekte aufweisen, werden Sie dazu aufgefordert, die abhängigen Objekte auszuchecken. ○ Wenn alle abhängigen Objekte ausgecheckt werden können, wird durch die Umbenennung ein neues Objekt angelegt, das über den Alias verfügt. Das ursprüngliche Objekt mit dem ursprünglichen Eigentümernamen wird gelöscht. ○ Wenn keines der abhängigen Objekte ausgecheckt werden kann (Datenflüsse werden von einem anderen Benutzer ausgecheckt), wird eine Meldung angezeigt, in der Sie die Option zum Fortfahren oder Abbrechen wählen können. Wenn Sie einige abhängige Objekte nicht auschecken können, wirkt sich die Aktion des Umbenennungstools nur auf die Flüsse aus, die Sie auschecken können. Nach der Umbenennung ist das ursprüngliche Objekt sowie das neue Objekt vorhanden. Die Anzahl der vom Umbenennungsprozess betroffenen Flüsse wirkt sich auf die Informationen über die Verwendung im Designer sowohl für das ursprüngliche als auch für das neue Objekt aus. ● Sie sind für das Einchecken aller abhängigen Objekte verantwortlich, die während des EigentümerUmbenennungsprozesses ausgecheckt wurden. Durch das Einchecken der neuen Objekte werden die abhängigen Objekte, die ausgecheckt wurden, nicht automatisch eingecheckt. ○ Die ursprünglichen Objekte werden von der Software nicht aus dem zentralen Repository gelöscht, wenn Sie die neuen Objekte einchecken. ○ Beachten Sie, dass durch das Einchecken von Datastores und das Auschecken der Datastores als Mehrbenutzeroperationen die Datastore-Konfigurationen überschrieben werden können. ○ Behalten Sie die Datastore-Konfigurationen aller Benutzer bei, indem Sie die von ihnen angelegten Konfigurationen nicht überschreiben. Fügen Sie stattdessen eine Konfiguration hinzu und legen Sie sie als Ihre Standardkonfiguration fest, während Sie in Ihrer eigenen Umgebung arbeiten. ○ Wenn Ihre Gruppe die Entwicklungsphase abschließt, wird empfohlen, dass der letzte Entwickler die Konfigurationen löscht, die sich auf die Entwicklungsumgebungen beziehen, und die Konfigurationen hinzufügt, die sich auf die Test- oder Produktivumgebungen beziehen. 5.6.7 Tipps zur Jobportabilität ● Es wird davon ausgegangen, dass die Metadaten einer Tabelle oder Funktion über die verschiedenen, in unterschiedlichen Konfigurationen desselben Datastores angegebenen Datenbanktypen und -versionen hinweg identisch sind. Wenn Sie beispielsweise eine Tabelle importieren und die Standardkonfiguration des Datastores Oracle ist, und später verwenden Sie diese Tabelle in einem Job zur Extraktion aus DB2, wird der Job ausgeführt. ● Importieren Sie die Metadaten für ein Datenbankobjekt unter Verwendung der Standardkonfiguration, und verwenden Sie dieselben Metadaten mit allen in demselben Datastore definierten Konfigurationen. ● In einigen Datenbanktypen oder -versionen werden Optionen unterstützt, die in anderen nicht unterstützt werden. Beispielsweise wird das parallele Lesen in hash-partitionierten Oracle-Tabellen unterstützt, jedoch 104 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datastores nicht in DB2- oder anderen hash-partitionierten Datenbanktabellen. Wenn Sie eine hash-partitionierte OracleTabelle importieren und den Datenfluss auf die parallele Ausführung festlegen, wird aus allen Partitionen parallel gelesen. Wenn Sie jedoch den Job unter Verwendung von Quellen aus einer DB2-Umgebung ausführen, wird nicht parallel gelesen. ● Folgende Funktionen unterstützen die Jobportabilität: ○ Erweiterte SQL-Transformation Mit der erweiterten SQL-Transformation können Sie unterschiedliche SQL-Texte für verschiedenen Datenbanktypen/-versionen eingeben und die Variablenersetzung im SQL-Text verwenden, so dass der richtige Text für die entsprechende Datastore-Konfiguration gelesen wird. ○ Erweiterter Zieltabelleneditor Mit den Optionen des erweiterten Zieltabelleneditors können Sie Datenbanktabellenziele für verschiedene Datenbanktypen/-versionen so konfigurieren, dass sie den Datastore-Konfigurationen entsprechen. ○ Erweiterter Datastore-Editor Mit dem erweiterten Datastore-Editor können Sie beim Anlegen einer neuen Datastore-Konfiguration auswählen, ob die Datenbankeigenschaften (einschließlich Datastore- und Tabellenzieloptionen sowie der SQL-Transformationstext) aus einer vorhandenen Konfiguration kopiert werden oder ob die aktuellen Werte verwendet werden. ● Wenn Sie einen Job entwerfen, der aus verschiedenen Datenbanktypen oder -versionen ausgeführt wird, geben Sie den Datenbanktabellen, Funktionen und gespeicherten Prozeduren für alle Quellen denselben Namen. Wenn Sie Konfigurationen für Datenbanken, bei denen die Groß-/Kleinschreibung nicht beachtet wird, und Datenbanken, bei denen die Groß-/Kleinschreibung beachtet wird, in demselben Datastore anlegen, wird empfohlen, die Namen der Tabellen, Funktionen und gespeicherten Prozeduren nur in Großbuchstaben zu schreiben. ● Tabellenschemas sollten datenbankübergreifend in einem Datastore übereinstimmen. Das bedeutet, die Anzahl an Spalten, die Spaltennamen und Spaltenpositionen sollten exakt gleich sein. Die Spaltendatentypen sollten identisch oder kompatibel sein. Wenn Sie beispielsweise eine VARCHAR-Spalte in einer Oracle-Quelle haben, verwenden Sie ebenfalls eine VARCHAR-Spalte in der Microsoft-SQL-Server-Quelle. Wenn Sie beispielsweise eine DATE-Spalte in einer Oracle-Quelle haben, verwenden Sie eine DATETIME-Spalte in der Microsoft-SQL-Server-Quelle. Definieren Sie Primär- und Fremdschlüssel auf dieselbe Art und Weise. ● Die Schemas der gespeicherten Prozeduren sollten übereinstimmen. Wenn Sie eine gespeicherte Prozedur aus einer Datastore-Konfiguration importieren und versuchen, sie für eine andere Datastore-Konfiguration zu verwenden, wird davon ausgegangen, dass die Signatur der gespeicherten Prozedur für die beiden Datenbanken identisch ist. Wenn beispielsweise eine gespeicherte Prozedur eine gespeicherte Funktion ist (gespeicherte Funktionen werden nur in Oracle unterstützt), müssen Sie sie als eine Funktion mit allen anderen Konfigurationen in einem Datastore verwenden (d.h. alle Datenbanken müssen Oracle-Datenbanken sein). Wenn die gespeicherte Prozedur drei Parameter in einer Datenbank aufweist, sollte sie genau drei Parameter in den anderen Datenbanken haben. Darüber hinaus müssen die Namen, Positionen, Datentypen und die Eingangs-/Ausgangstypen der Parameter genau übereinstimmen. Weitere Informationen Advanced Development Guide: Multi-user Development [Seite 738] Advanced Development Guide: Multi-user Environment Setup [Seite 742] Designer-Handbuch Datastores PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 105 5.6.8 Umbenennen von Tabellen- und Funktionseigentümern Verwenden Sie die Eigentümerumbenennung, um einen einzelnen Metadatenalias anstelle des realen Eigentümernamens für Datenbankobjekte im Datastore zuzuweisen. Sie können den Eigentümer von importierten Tabellen, Vorlagentabellen oder Funktionen umbenennen. Durch das Konsolidieren von Metadaten unter einem einzigen Aliasnamen können Sie jederzeit auf exakte, konsistente Abhängigkeitsinformationen zugreifen, während Sie gleichzeitig leichter zwischen Konfigurationen wechseln können, wenn Sie Jobs in verschiedene Umgebungen verschieben. Bei der Verwendung von Objekten, die in einem zentralen Repository gespeichert sind, erleichtert ein gemeinsam genutzter Alias das Verfolgen von Objekten, die von mehreren Benutzern eingecheckt wurden. Wenn alle Benutzer lokaler Repositorys denselben Alias verwenden, können Abhängigkeiten für Objekte verfolgt werden, die Ihr Team am zentralen Repository ein- und auscheckt. Wenn Sie einen Eigentümer umbenennen, sind hiervon die Instanzen einer Tabelle oder Funktion in einem Datenfluss betroffen, nicht aber der Datastore, aus dem sie importiert wurden. 1. Klappen Sie auf dem Tab „Datastore“ der lokalen Objektbibliothek eine Tabelle, eine Vorlagentabelle oder eine Funktionskategorie auf. 2. Klicken Sie mit der rechten Maustaste auf die Tabelle bzw. Funktion, und wählen Sie Eigentümer umbenennen aus. 3. Geben Sie unter Eigentümername einen neuen Namen ein, und klicken Sie dann auf Umbenennen. Wenn Sie einen neuen Eigentümernamen eingeben, wird er von der Software als Metadatenalias für die Tabelle bzw. Funktion verwendet. Hinweis Wenn das Objekt, das Sie umbenennen möchten, bereits im Datastore vorhanden ist, wird geprüft, ob die beiden Objekte dasselbe Schema haben. Wenn die Objekte dasselbe Schema haben, wird die Verarbeitung fortgesetzt. Wenn sich die Schemas unterscheiden, wird eine entsprechende Meldung angezeigt. Sie müssen dann möglicherweise einen anderen Objektnamen auswählen. Die Eigentümerumbenennung unter Beachtung der Groß-/Kleinschreibung und die hiervon unabhängige Umbenennung werden unterstützt. ● Wenn die Objekte, die Sie umbenennen möchten, aus einer von der Groß-/Kleinschreibung abhängigen Datenbank stammen, behält der Eigentümerumbenennungsmechanismus diese Unterscheidung zwischen Groß- und Kleinschreibung bei. ● Wenn die Objekte, die Sie umbenennen möchten, aus einem Datastore stammen, der beide Arten von Datenbanken enthält – solche, bei denen zwischen Groß- und Kleinschreibung unterschieden wird, und solche, bei denen dies nicht der Fall ist –, wird anhand der Standardkonfiguration ermittelt, ob bei neuen Eigentümernamen Groß-/Kleinschreibung unterschieden wird oder nicht. Damit in diesem Szenario alle Objekte über alle Konfigurationen portabel sind, müssen Sie alle Eigentümer- und Objektnamen in Großbuchstaben eingeben. Während des Eigentümerumbenennungsprozesses: ● Die abhängigen Objekte (Jobs, Workflows und Datenflüsse, die das umbenannte Objekt verwenden) werden dahingehend aktualisiert, dass sie den neuen Eigentümernamen verwenden. ● In der Objektbibliothek wird der Eintrag des Objekts mit dem neuen Eigentümernamen angezeigt. Die angezeigten Verwendungs- und Verwendungsnachweisinformationen spiegeln die Anzahl der aktualisierten abhängigen Objekte wider. 106 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datastores ● Nachdem alle abhängigen Objekte erfolgreich aktualisiert wurden, werden die Metadaten für das Objekt mit dem ursprünglichen Eigentümernamen aus der Objektbibliothek und dem Repository gelöscht. 5.6.8.1 Verwenden des Fensters "Umbenennen" in einem Mehrbenutzerszenario Die Verwendung eines Alias für alle Objekte, die in einem zentralen Repository gespeichert sind, ermöglicht der Software, alle von mehreren Benutzern eingecheckten Objekte zu verfolgen. Wenn alle Benutzer von lokalen Repositorys denselben Alias verwenden, kann die Software Abhängigkeiten für Objekte verfolgen, die das Team in das zentrale Repository eincheckt bzw. aus diesem auscheckt. Die Schaltfläche Umbenennen weist beim Ein- und Auschecken von Objekten in bzw. aus einem zentralen Repository verschiedene Verhaltensweisen auf, je nachdem, wie der Auscheckstatus eines umbenannten Objekts aussieht und ob dieses Objekt mit abhängigen Objekten verknüpft ist. Tabelle 42: Szenario Verhalten bei Verwendung der Funktion „Umbenennen“ 1. Das Objekt ist nicht ausgecheckt und verfügt über keine abhängigen Objekte im lokalen oder zentralen Repository. Wenn Sie auf Umbenennen klicken, benennt die Software den Objekteigentümer um. 2. Das Objekt ist ausgecheckt und verfügt über keine abhängigen Ob jekte im lokalen oder zentralen Re pository. Wenn Sie auf Umbenennen klicken, benennt die Software den Objekteigentümer um. Wenn Sie auf Umbenennen klicken, zeigt die Software ein zweites Fenster an, in dem die 3. Das Objekt ist nicht ausgecheckt und verfügt über ein oder mehrere abhängigen Objekte aufgeführt werden (die das umbenannte Objekt verwenden oder abhängige Objekte (im lokalen Repo referenzieren). sitory). Wenn Sie auf Weiter klicken, benennt die Software das Objekt um und ändert die abhän gigen Objekte so, dass sie das umbenannte Objekt unter Verwendung des neuen Eigen tümernamens referenzieren. Wenn Sie auf Abbrechen klicken, kehren Sie im Designer zum Fenster „Eigentümer umbenennen“ zurück. Hinweis Ein Objekt kann noch immer über ein oder mehrere abhängige Objekte im zentralen Repository verfügen. Wenn das umzubenennende Objekt jedoch nicht ausgecheckt ist, wirkt sich der Eigentümer-umbenennen-Mechanismus nicht auf die abhängigen Objekte im zentralen Repository aus. Dies ist so im Entwurf vorgesehen. Designer-Handbuch Datastores PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 107 Szenario Verhalten bei Verwendung der Funktion „Umbenennen“ 4. Das Objekt ist ausgecheckt und verfügt über ein oder mehrere ab hängige Objekte. Dieses Szenario ist etwas komplizierter. ● Wenn Sie nicht mit dem zentralen Repository verbunden sind, lautet die Status meldung wie folgt: This object is checked out from central repository <X>. Please select Tools | Central Repository… to activate that repository before renaming. ● Wenn Sie mit dem zentralen Repository verbunden sind, wird das Fenster "Eigen tümer umbenennen" geöffnet. Falls Sie auf Umbenennen klicken, wird ein zweites Fenster geöffnet, in dem die ab hängigen Objekte und eine Statusmeldung, die über Auscheckstatus und -ort der Objekte Aufschluss gibt, angezeigt werden. Wenn ein abhängiges Objekt nur im lo kalen Repository vorliegt, werden Sie in einer Statusmeldung darauf hingewiesen, dass das Objekt nur im lokalen Repository verwendet wird und nicht ausgecheckt werden muss. ● Ist das abhängige Objekt im zentralen Repository gespeichert und nicht ausge checkt, weist sie die Statusmeldung darauf hin, dass das Objekt nicht ausgecheckt ist. ● Wenn Sie das abhängige Objekt ausgecheckt haben oder es von einem anderen Benutzer ausgecheckt wurde, wird in der Statusmeldung der Name des Reposito rys angezeigt, aus dem es ausgecheckt wurde. Beispiel: Oracle.production.user1. Wie in Szenario 2 dient dieses zweite Fenster dazu, die abhängigen Objekte anzu zeigen. Darüber hinaus ermöglicht Ihnen das Fenster, die entsprechenden abhän gigen Objekte aus dem zentralen Repository auszuchecken, ohne das Fenster "Zentrale Objektbibliothek" zu öffnen. Klicken Sie auf die Schaltfläche Liste aktualisieren, um den Auscheckstatus in der Liste zu aktualisieren. Dies ist nützlich, wenn die Software ein abhängiges Objekt im zentralen Repository identifiziert, jedoch ein anderer Benutzer dieses ausge checkt hat. Wenn dieser Benutzer das abhängige Objekt eincheckt, klicken Sie auf Liste aktualisieren, um den Status zu aktualisieren und sicherzustellen, dass das abhän gige Objekt nicht mehr ausgecheckt ist. Tipp Um die Funktion "Eigentümer umbenennen" optimal einzusetzen, sollten Sie zu gehörige abhängige Objekte aus dem zentralen Repository auschecken. Damit vermeiden Sie abhängige Objekte, die Objekte mit Eigentümernamen referen zieren, die nicht existieren. Wählen Sie im zentralen Repository ein oder meh rere Objekte aus, klicken Sie mit der rechten Maustaste, und wählen Sie Auschecken aus. Nachdem Sie das abhängige Objekt ausgecheckt haben, aktualisiert der Designer den Status. Wenn das Auschecken erfolgreich verlief, wird im Status der Name des lokalen Repositorys angezeigt. 108 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datastores Szenario Verhalten bei Verwendung der Funktion „Umbenennen“ In dieser Situation zeigt die Software ein weiteres Dialogfenster an, das Sie auf noch 4a. Sie klicken auf Weiter, aber ein nicht ausgecheckte Objekte hinweist und Sie auffordert, das Fortfahren zu bestätigen. oder mehrere abhängige Objekte sind nicht aus dem zentralen Reposi Sie sollten: tory ausgecheckt. ● auf Nein klicken, um zum vorherigen Dialogfenster mit den abhängigen Objekten zurückzukehren. ● auf Ja klicken, um mit der Umbenennung der ausgewählten Objekte fortzufahren und die abhängigen Objekte zu bearbeiten. Sie Software ändert die Objekte, die im lokalen Repository nicht ausgecheckt sind, so dass sie den neuen Eigentümernamen referenzieren. Es liegt in Ihrer Verantwortung, die Konsistenz mit den Objekten im zentralen Repository zu wahren. 4b. Sie klicken auf Weiter, und alle abhängigen Objekte sind aus dem zentralen Repository ausgecheckt. Die Software benennt den Eigentümer des ausgewählten Objekts um und ändert alle abhängigen Objekte so, dass sie den neuen Eigentümernamen referenzieren. Obwohl es für Sie so aussieht, als ob das ursprüngliche Objekt einen neuen Eigentümernamen er halten hätte, wurde das ursprüngliche Objekt in Wirklichkeit nicht geändert. Die Soft ware hat lediglich ein neues Objekt angelegt, das mit dem ursprünglichen identisch ist, jedoch den neuen Eigentümernamen benutzt. Das ursprüngliche Objekt mit dem alten Eigentümernamen existiert noch immer. Die Software führt dann die Funktion " Che ckout rückgängig machen" für das ursprüngliche Objekt aus. Sie sind dann dafür zu ständig, das umbenannte Objekt einzuchecken. Wenn die Umbenennungsoperation erfolgreich verlief, aktualisiert die Software auf dem Tab Datastore der lokalen Objektbibliothek die Tabelle oder Funktion mit dem neuen Ei gentümernamen, und im Fenster „Ausgabe“ wird die folgende Meldung angezeigt: Object <Object_Name>: Owner name <Old_Owner> successfully renamed to <New_Owner>, including references from dependent objects. Wenn die Software den Eigentümer nicht erfolgreich umbenennt, ist im Fenster "Aus gabe" folgende Meldung zu sehen: Object <Object_Name>: Owner name <Old_Owner> could not be renamed to <New_Owner>. 5.6.9 Definieren einer Systemkonfiguration Beim Entwerfen von Jobs definieren und legen Sie Datastore-Konfigurationen und Systemkonfigurationen in Abhängigkeit von Business-Umgebung und -Regeln an. Zu diesem Zweck müssen Sie den Unterschied zwischen Datastore-Konfigurationen und Systemkonfigurationen kennen. Tabelle 43: Datastore-Konfigurationen Designer-Handbuch Datastores Jede Datastore-Konfiguration definiert eine Verbindung eines einzigen Datastores mit einer bestimmten Datenbank. PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 109 Systemkonfigurationen Jede Systemkonfiguration definiert eine Gruppe von Datastore-Konfigurationen, die Sie bei der Ausführung eines Jobs gemeinsam verwenden möchten. Sie können eine Systemkonfi guration definieren, wenn das Repository mindestens einen Datastore mit mehreren Konfi gurationen enthält. Sie können Systemkonfigurationen auch Ersatzparameterkonfiguratio nen zuweisen. Legen Sie Datastore-Konfigurationen für die Datastores im Repository an, bevor Sie Systemkonfigurationen anlegen, um Datastore-Konfigurationen zu organisieren und zu gruppieren. Wählen Sie eine Systemkonfiguration aus, die zur Laufzeit verwendet werden soll. In vielen Unternehmen definiert eine Person, die für den Entwurf von Jobs verantwortlich ist, die erforderlichen Datastore- und Systemkonfigurationen. Anschließend legt ein Systemadministrator bei der Einplanung oder beim Starten eines Jobs fest, welche Systemkonfiguration verwendet werden soll. Die Software verwaltet Systemkonfigurationen getrennt von Jobs. In einer Umgebung mit mehreren Benutzern können Sie Systemkonfigurationen nicht ein- oder auschecken. Sie können Systemkonfigurationen jedoch in ein separates Flatfile exportieren, das Sie später importieren können. Weitere Informationen Anlegen einer neuen Konfiguration [Seite 97] 5.6.9.1 Anlegen einer Systemkonfiguration 1. Wählen Sie in der Designer-Menüleiste Tools Systemkonfigurationen . Das Fenster Systemkonfigurationen bearbeiten wird angezeigt. 2. Um eine neue Systemkonfiguration hinzuzufügen, führen Sie einen der folgenden Schritte aus: ○ Klicken Sie auf das Symbol Neue Konfiguration anlegen, um eine Konfiguration hinzuzufügen, die auf die Standardkonfiguration der Ersetzungsparameter und jede Datastore-Verbindung verweist. ○ Wählen Sie eine vorhandene Konfiguration aus, und klicken Sie auf das Symbol Konfiguration duplizieren, um eine Kopie der ausgewählten Konfiguration anzulegen. Sie können die Kopie als Vorlage verwenden und die Auswahlen für Ersatzparameter oder DatastoreKonfiguration nach Bedarf bearbeiten. 3. Benennen Sie die neue Systemkonfiguration ggf. um. a. Wählen Sie die Systemkonfiguration aus, die Sie umbenennen möchten. b. Klicken Sie auf das Symbol Konfiguration umbenennen, um den Bearbeitungsmodus für das Feld für den Konfigurationsnamen zu aktivieren. c. Geben Sie einen neuen, eindeutigen Namen ein, und klicken Sie auf eine Position außerhalb des Namensfelds, um den Namen zu akzeptieren. Es wird empfohlen, dass Sie eine konsistente Benennungskonvention einhalten und das Präfix SC_ für jeden Systemkonfigurationsnamen verwenden, damit Sie diese Datei sofort als Systemkonfiguration identifizieren können. Dieses Verfahren ist besonders hilfreich, wenn Sie die Systemkonfiguration exportieren. 110 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datastores 4. Wählen Sie in der Liste eine Ersatzparameterkonfiguration aus, die der Systemkonfiguration zugewiesen werden soll. 5. Wählen Sie für jeden Datastore die Datastore-Konfiguration aus, die Sie verwenden möchten, wenn Sie einen Job mit der Systemkonfiguration ausführen. Wenn Sie einer Systemkonfiguration keine Datastore-Konfiguration zuordnen, verwendet der Jobserver zur Laufzeit die Standard-Datastore-Konfiguration. 6. Klicken Sie auf OK, um die Einstellungen zur Systemkonfiguration zu speichern. Weitere Informationen Zuordnen von Ersatzparameterkonfigurationen zu Systemkonfigurationen [Seite 307] 5.6.9.2 Exportieren einer Systemkonfiguration 1. Wählen Sie in der Objektbibliothek den Tab "Datastores" aus, und klicken Sie mit der rechten Maustaste auf einen Datastore. 2. Wählen Sie Repository Systemkonfigurationen exportieren . Es wird empfohlen, dass Sie das Präfix SC_ jeder .atl-Datei für eine exportierte Systemkonfiguration hinzufügen, damit Sie diese Datei sofort als Systemkonfiguration identifizieren können. 3. Klicken Sie auf OK. Designer-Handbuch Datastores PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 111 6 Dateiformate Ein Satz von Eigenschaften, die die Struktur eines Flatfiles (ASCII) beschreiben. Dateiformate beschreiben die Metadatenstruktur. Ein Dateiformat beschreibt eine bestimmte Datei. Eine Dateiformatvorlage ist eine generische Beschreibung, die für mehrere Datendateien verwendet werden kann. In diesem Abschnitt werden Dateiformate, die Verwendung des Dateiformateditors und das Anlegen eines Dateiformats in der Software behandelt. Weitere Informationen Referenzhandbuch: Dateiformat 6.1 Verstehen der Dateiformate In der Software können Daten verwendet werden, die in Dateien für Datenquellen und -ziele gespeichert sind. Ein Dateiformat definiert eine Verbindung zu einer Datei. Daher verwenden Sie ein Dateiformat, um eine Verbindung zu Quell- oder Zieldaten herzustellen, wenn die Daten in einer Datei und nicht in einer Datenbanktabelle gespeichert sind. In der Objektbibliothek werden Dateiformatvorlagen gespeichert, mit denen Sie bestimmte Dateiformate als Quellen und Ziele in Datenflüssen definieren. Um mit Dateiformaten zu arbeiten, führen Sie die folgenden Aufgaben aus: ● Legen Sie eine Dateiformatvorlage an, mit der die Struktur für eine Datei definiert wird. ● Legen Sie ein konkretes Quell- oder Zieldateiformat in einem Datenfluss an. Das Quell- bzw. Zieldateiformat basiert auf einer Vorlage und gibt Verbindungsinformationen wie den Dateinamen an. Dateiformatobjekte können Dateien der folgenden Typen beschreiben: ● Getrennt: Zeichen wie Kommata oder Tabulatoren trennen die einzelnen Felder. ● Feste Breite: Sie geben die Spaltenbreite an. ● SAP-Transport: Wird verwendet, um Datentransportobjekte in Datenflüssen von SAP-Anwendungen zu definieren. ● Unstrukturierter Text: Wird verwendet, um eine oder mehrere Dateien mit unstrukturiertem Text aus einem Verzeichnis zu lesen. ● Unstrukturiert binär: Wird verwendet, um eines oder mehrere binäre Dokumente aus einem Verzeichnis zu lesen. 112 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Dateiformate Weitere Informationen Supplement for SAP: Connecting to SAP Applications, File formats 6.2 Dateiformateditor Verwenden Sie den Dateiformateditor, um Eigenschaften für Dateiformatvorlagen und Quell- und Zieldateiformate festzulegen. Die verfügbaren Eigenschaften hängen vom Modus des Dateiformateditors ab: Tabelle 44: Modus Beschreibung Neuer Modus Anlegen einer neuen Dateiformatvorlage Bearbeitungsmodus Bearbeiten einer vorhandenen Dateiformatvorlage Quellmodus Bearbeiten des Dateiformats einer bestimmten Quelldatei Zielmodus Bearbeiten des Dateiformats einer bestimmten Zieldatei Der Dateiformateditor verfügt über drei Arbeitsbereiche: Tabelle 45: Arbeitsbereich Beschreibung Eigenschaften-Werte Bearbeiten der Werte für Dateiformateigenschaften. Klappen Sie die Eigenschaftsgrup pen auf bzw. zu, indem Sie auf das führende Plus- bzw. Minuszeichen klicken. Spaltenattribute Bearbeiten und Definieren der Spalten oder Felder in der Datei. Feldspezifische Formate überschreiben das im Bereich "Eigenschaften-Werte" festgelegte Standardformat. Datenvorschau Zeigt an, wie sich die Einstellungen auf Beispieldaten auswirken. Der Dateiformateditor enthält Teilerleisten, mit denen die Größe des Fensters und aller Arbeitsbereiche geändert werden kann. Sie können den Dateiformateditor auf Vollbildschirmgröße aufklappen. Die Eigenschaften und das Aussehen der Arbeitsbereiche ändern sich mit dem Format der Datei. Designer-Handbuch Dateiformate PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 113 Innerhalb des Dateiformateditors können Sie wie folgt navigieren: ● Mit der Tabulatortaste wechseln Sie zwischen den Arbeitsbereichen. ● Mit der Bild-nach-oben-Taste, der Bild-nach-unten-Taste und den Pfeiltasten navigieren Sie durch die Felder des Bereichs "Datenvorschau". ● Durch gleichzeitiges Drücken der Taste ALT und der Pfeil-nach-unten-Taste öffnen Sie ein Drop-Down-Menü im Bereich "Eigenschaften-Werte". ● Wenn für den Dateiformatyp eine feste Breite festgelegt wurde, können Sie im Bereich "Datenvorschau" auch die Struktur der Spaltenmetadaten bearbeiten. Hinweis Mit der Schaltfläche ATL anzeigen wird eine schreibgeschützte Kopie der für Ihr Dateiformat generierten Transformationssprachendatei angezeigt. Sie werden möglicherweise vom SAP-Geschäftsbenutzer-Support aufgefordert, diese Datei zu verwenden. Weitere Informationen Referenzhandbuch: Dateiformat 114 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Dateiformate 6.3 Anlegen von Dateiformaten Zum Angeben einer Quell- oder Zieldatei legen Sie eine Dateiformatvorlage an, die die Struktur einer Datei definiert. Wenn Sie das Dateiformat ziehen und auf einem Datenfluss ablegen, stellt das Format eine Datei dar, die auf der Vorlage basiert und Verbindungsinformationen wie den Dateinamen angibt. 6.3.1 Anlegen eines neuen Dateiformats 1. Klicken Sie mit der rechten Maustaste auf Flatfiles auf dem Tab Formate der Objektbibliothek, und wählen Sie Neu. 2. Wählen Sie auf Grundlage der nachfolgenden Beschreibungen einen Typ aus: Tabelle 46: Typ Beschreibung Getrennt Für eine Datei, in der eine Zeichenfolge zum Trennen von Spalten verwendet wird. Feste Breite Für eine Datei, in der eine feste Breite für jede Spalte ver wendet wird. SAP-Transport Für Datentransportobjekte in SAP-Anwendungsdatenflüs sen. Unstrukturierter Text Für mindestens eine Datei mit unstrukturiertem Text in ei nem Verzeichnis. Das Schema für diesen Typ ist fest. Unstrukturiert binär Für mindestens eine Datei mit unstrukturiertem Text und binärem Inhalt in einem Verzeichnis. Das Schema für diesen Typ ist fest. Die Optionen im Editor ändern sich auf der Basis des ausgewählten Typs. 3. Geben Sie bei Name einen Namen ein, der diese Dateiformatvorlage beschreibt. Nachdem Sie die Dateiformatvorlage gespeichert haben, können Sie den Namen nicht mehr ändern. 4. Dateien des Typs „Getrennt“ und „Feste Breite“ können Sie mithilfe eines Dateiübertragungsprogramms eines Drittherstellers lesen und laden, wenn Sie Ja bei Benutzerdefiniertes Übertragungsprogramm auswählen. Tipp Um weitere Dateiübertragungsprotokolltypen (z.B. SFTP, SCP) für andere Dateiformate wie Flatfiles oder verschachtelte Schemas einzuschließen, legen Sie ein Dateispeicherortobjekt an, und ordnen Sie das Dateiformat dem Dateispeicherortobjekt zu. Richten Sie ein Dateispeicherortobjekt mit mehreren Konfigurationen ein und wechseln Sie einfach die Konfigurationen für ausgeführte Jobs. Weitere Informationen finden Sie unter Dateispeicherorte [Seite 144]. Designer-Handbuch Dateiformate PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 115 Sie können Nein für Benutzerdefiniertes Übertragungsprogramm wählen und weiterhin Ihre eigenen Dateiübertragungsprotokoll-Informationen verwenden, um Dateien durch die Zuordnung eines Dateispeicherortobjekts zum Dateiformat zu übertragen. Weitere Informationen finden Sie unter Dateispeicherorte [Seite 144]. 5. Füllen Sie die übrigen Eigenschaften aus, um die Dateien zu beschreiben, die diese Vorlage darstellt. Suchen Sie nach Eigenschaften, die verfügbar sind, wenn der Dateiformateditor sich im Quell- oder Zielmodus befindet. 6. Für Quelldateien können Sie bei einigen Dateiformaten die Struktur der Spalten im Bereich für Spaltenattribute (oberer rechter Fensterbereich) angeben: a. Geben Sie den Feldnamen ein. b. Legen Sie Datentypen fest. c. Geben Sie die Feldgröße für die Datentypen an. d. Geben Sie die Informationen zu Dezimalstellen und Genauigkeit für dezimale und numerische Datentypen an. e. Geben Sie den Inhaltstyp ein. Wenn Sie beim Anlegen eines neuen Formats eine Spalte hinzugefügt haben, wird möglicherweise der Inhaltstyp auf der Basis des Feldnamens für Sie bereitgestellt. Ist kein geeigneter Inhaltstyp verfügbar, ist der Eintrag standardmäßig leer. f. Geben Sie ggf. Informationen für geeignete Datentypen in das Feld Format ein. Diese Informationen setzen das Standardformat außer Kraft, das im Bereich für Eigenschaften und Werte für diesen Datentyp festgelegt ist. Sie können ein Dateiformat auf der Basis einer Beispieldatei anlegen. Hinweis Sie brauchen keine Spalten für Dateien anzugeben, die als Ziele verwendet werden. Geben Sie jedoch Spalten an und stimmen diese Spalten nicht mit dem Ausgabeschema der vorherigen Transformation überein, verwendet die Software beim Schreiben in die Zieldatei das Ausgabeschema der Transformation. Hinweis Geben Sie bei dem Datentyp DECIMAL oder REAL nur ein Quellspaltenformat an und stimmen die Spaltennamen und Datentypen im Zielschema nicht mit den Spaltennamen und Datentypen im Quellschema überein, kann die Software das angegebene Quellspaltenformat nicht verwenden. Stattdessen wird standardmäßig das Format der Codepage auf dem Rechner verwendet, auf dem der Jobserver installiert ist. 7. Klicken Sie auf Speichern und schließen, um die Dateiformatvorlage zu speichern und den Dateiformateditor zu schließen. Weitere Informationen Benutzerdefinierte Dateiübertragungen [Seite 130] Referenzhandbuch: Gebietsschemas und Multibyte-Funktionalität Referenzhandbuch: Dateiformat 116 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Dateiformate 6.3.2 Modellieren eines Dateiformats anhand einer Beispieldatei 1. Legen Sie in der lokalen Objektbibliothek über den Tab Formate eine neue Flatfile-Formatvorlage an, oder bearbeiten Sie eine bestehende Flatfile-Formatvorlage. 2. Gehen Sie unter Datendatei(en) folgendermaßen vor: ○ Wenn sich die Beispieldatei auf dem Rechner mit dem Designer befindet, stellen Sie die Option Speicherort auf Lokal ein. Navigieren Sie, um das Root-Verzeichnis und die Datei(en) auf die Beispieldatei zu setzen. Hinweis Während des Entwurfs können Sie eine Datei auf dem Rechner angeben, auf dem der Designer oder der Jobserver ausgeführt wird. Geben Sie den Speicherort der Datei in der Eigenschaft "Speicherort" an. Während der Ausführung müssen Sie eine Datei angeben, die sich auf dem Rechner mit dem Jobserver befindet, der den Job ausführt. ○ Wenn sich die Beispieldatei auf dem aktuellen Rechner mit dem Jobserver befindet, setzen Sie die Option Speicherort auf Jobserver. Geben Sie zur Angabe der Beispieldatei das Root-Verzeichnis und die Datei(en) an. Wenn Sie Jobserver auswühlen, wird das Symbol Durchsuchen deaktiviert, sodass Sie den Pfad zur Datei eingeben müssen. Sie können einen absoluten oder einen relativen Pfad eingeben, aber der Jobserver muss darauf zugreifen können. Ein UNIX-Pfad könnte beispielsweise folgendermaßen lauten: /usr/data/abc.txt. Ein Windows-Pfad könnte wie folgt lauten: C:\DATA\abc.txt. Hinweis Im Betriebssystem Windows muss bei Dateinamen Groß- und Kleinschreibung nicht beachtet werden; in der UNIX-Umgebung muss jedoch zwischen Groß- und Kleinschreibung unterschieden werden. (Beispielsweise wären "abc.txt" und "aBc.txt" zwei verschiedene Dateien in demselben UNIXVerzeichnis.) Um die Gefahr von Schreibfehlern zu verringern, können Sie via Telnet eine Verbindung mit dem Jobserver-Rechner (UNIX oder Windows) herstellen und die vollständige Pfadbezeichnung der Datei herausfinden, die Sie verwenden möchten. Dann können Sie den Pfadnamen in der Telnet-Anwendung kopieren und direkt in das Textfeld "Root-Verzeichnis" im Dateiformateditor einfügen. Sie können mit dem Windows Explorer nicht den genauen Speicherort unter Windows ermitteln. 3. Wenn es sich um einen getrennten Dateityp handelt, stellen Sie das entsprechende Spaltentrennzeichen für die Beispieldatei ein. Sie können eine Auswahl aus der Drop-Down-Liste treffen oder Unicode-Trennzeichen angeben, indem Sie den Unicode-Zeichencode direkt im Format /XXXX eingeben, wobei XXXX ein UnicodeDezimalzeichencode ist. /44 ist beispielsweise das Unicode-Zeichen für das Kommazeichen (,). 4. Setzen Sie unter Eingabe/Ausgabe die Option Zeilenkopf überspringen auf Ja, wenn Sie in der ersten Zeile der Datei Feldnamen angeben möchten. Der Dateiformateditor zeigt die Spaltennamen im Datenvorschaubereich an und legt die Metadatenstruktur automatisch an. 5. Bearbeiten Sie die Metadatenstruktur nach Bedarf. Sowohl bei Dateien mit Trennzeichen als auch bei Dateien mit fester Breite können Sie die Metadatenstruktur im Arbeitsbereich "Spaltenattribute" bearbeiten: Designer-Handbuch Dateiformate PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 117 a. Klicken Sie mit der rechten Maustaste, um Felder einzufügen oder zu löschen. b. Benennen Sie Felder um. c. Legen Sie Datentypen fest. d. Geben Sie die Feldlängen für den Datentyp BLOB und VarChar ein. e. Geben Sie Skalierungs- und Genauigkeitsinformationen für die Datentypen Numeric und Decimal ein. f. Geben Sie bei Bedarf Format-Feldinformationen für entsprechende Datentypen ein. Diese Formatinformationen setzen das Standardformat außer Kraft, das im Bereich "Eigenschaftswerte" für diesen Datentyp festgelegt wurde. g. Geben Sie Informationen zum Inhaltstyp ein. Sie brauchen keine Spalten für Dateien anzugeben, die als Ziele verwendet werden. Wenn Sie bei der Anlage eines neuen Formats eine Spalte hinzugefügt haben, können Daten zum Inhaltstyp automatisch auf der Grundlage des Feldnamens vorgegeben werden. Wenn ein entsprechender Inhaltstyp nicht automatisch vorgegeben werden kann, ist dieses Feld standardmäßig leer. Bei Dateien mit fester Breite können Sie auch die Metadatenstruktur im Datenvorschaubereich bearbeiten: a. Klicken Sie, um Spalten auszuwählen und zu markieren. b. Klicken Sie mit der rechten Maustaste, um Felder einzufügen oder zu löschen. Hinweis Im Datenvorschaubereich können keine BLOB-Daten angezeigt werden. 6. Klicken Sie auf Speichern und schließen, um die Dateiformatvorlage zu speichern und den Dateiformateditor zu schließen. 6.3.3 Replizieren und Umbenennen von Dateiformaten Nach dem Anlegen eines Dateiformatschemas können Sie schnell ein weiteres Dateiformatobjekt mit demselben Schema anlegen, indem Sie das vorhandene Dateiformat replizieren und umbenennen. Um bei der Anlage von Dateiformatobjekten Zeit zu sparen, replizieren Sie ein Schema und benennen es um, anstatt es von Grund auf neu zu konfigurieren. 6.3.3.1 Anlegen eines Dateiformats aus einem vorhandenen Dateiformat 1. Klicken Sie auf dem Tab "Formate" der Objektbibliothek mit der rechten Maustaste auf ein vorhandenes Dateiformat, und wählen Sie im Menü Replizieren aus. Der Dateiformateditor wird mit dem Schema des kopierten Dateiformats geöffnet. 2. Wählen Sie durch Doppelklicken den Eigenschaftswert Name aus (der denselben Namen enthält wie das ursprüngliche Dateiformatobjekt). 3. Geben Sie einen neuen, eindeutigen Namen für das replizierte Dateiformat ein. 118 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Dateiformate Hinweis Sie müssen einen neuen Namen für die replizierte Datei eingeben. In der Software kann die replizierte Datei nicht unter demselben Namen wie das Original (bzw. unter dem Namen eines anderen vorhandenen Dateiformatobjekts) gespeichert werden. Außerdem können Sie nur an dieser Stelle den Wert für die Eigenschaft "Name" ändern. Nach dem Speichern können Sie den Namen nicht mehr ändern. 4. Bearbeiten Sie ggf. weitere Eigenschaften. Suchen Sie nach verfügbaren Eigenschaften, wenn der Dateiformateditor sich im Quell- oder Zielmodus befindet. 5. Klicken Sie auf Speichern, um das neue Dateiformatschema zu speichern und anzuzeigen. Klicken Sie auf "Abbrechen", oder drücken Sie die Taste "Esc" der Tastatur, um den Replikationsprozess zu beenden (und zwar auch dann, wenn Sie den Namen geändert und auf "Speichern" geklickt haben). 6. Klicken Sie auf Speichern und Schließen. Weitere Informationen Referenzhandbuch: Dateiformat 6.3.4 Anlegen eines Dateiformats aus einem Schema für flache Tabellen 1. Klicken Sie im Abfrageeditor mit der rechten Maustaste auf ein Schema, und wählen Sie Dateiformat anlegen aus. Der Dateiformateditor wird mit dem von Ihnen ausgewählten Schema geöffnet. 2. Bearbeiten Sie das neue Schema wie gewünscht, und klicken Sie auf Speichern und Schließen. Das Dateiformat wird im Repository gespeichert. Sie können auf dem Tab "Formate" der Objektbibliothek auf das Dateiformat zugreifen. 6.3.5 Anlegen einer bestimmten Quell- oder Zieldatei 1. Wählen Sie auf dem Tab Formate der lokalen Objektbibliothek eine Formatvorlage für Flatfiles aus. 2. Ziehen Sie die Dateiformatvorlage in den Arbeitsbereich des Datenflusses. 3. Wählen Sie Als Quelle verwenden aus, um ein Quelldateiformat zu definieren, oder wählen Sie Als Ziel verwenden aus, um ein Zieldateiformat zu definieren. 4. Klicken Sie im Arbeitsbereich auf den Namen des Dateiformatobjekts, um den Dateiformateditor zu öffnen. 5. Geben Sie die spezifischen Eigenschaften für die Quell- bzw. Zieldatei ein. Suchen Sie nach verfügbaren Eigenschaften, wenn der Dateiformateditor sich im Quell- oder Zielmodus befindet. Designer-Handbuch Dateiformate PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 119 Vergessen Sie nicht, unter "Dateiname(n)" für die Eigenschaften "Datei" und "Speicherort" den Dateinamen und den Speicherort auszuwählen. Hinweis Sie können Variablen als Dateinamen verwenden. 6. Verbinden Sie ggf. das Dateiformatobjekt mit anderen Objekten im Datenfluss. Weitere Informationen Referenzhandbuch: Dateiformat Festlegen von Dateinamen zur Laufzeit mithilfe von Variablen [Seite 302] 6.4 Bearbeiten von Dateiformaten Sie können vorhandene Dateiformatvorlagen ändern, damit sie mit Änderungen an dem Format oder der Struktur einer Datei übereinstimmen. Sie können nicht den Namen einer Dateiformatvorlage ändern. Beispiel: Wenn ein Datumsfeld in einer Quell- oder Zieldatei das Format MM/TT/JJ aufweist und die Daten für dieses Feld sich aufgrund von Änderungen in dem Programm, das die Quelldatei generiert, in das Format TT-MMJJ ändern, können Sie die entsprechende Dateiformatvorlage bearbeiten und die Informationen zum Datumsformat ändern. Bei bestimmten Quell- oder Zieldateiformaten können Sie Eigenschaften bearbeiten, die diese Quelle oder dieses Ziel eindeutig definieren, beispielsweise Namen und Speicherort der Datei. Achtung Wird die Vorlage in anderen Jobs verwendet (die Verwendung ist größer als 0), werden die Änderungen, die Sie an der Vorlage vornehmen, auch an den Dateien vorgenommen, die diese Vorlage verwenden. So bearbeiten Sie eine Dateiformatvorlage: 1. Im Tab Formate der Objektbibliothek doppelklicken Sie auf ein vorhandenes Flatfile-Format (oder klicken Sie mit der rechten Maustaste, und wählen Sie Bearbeiten aus). Der Dateiformateditor wird mit den vorhandenen Formatwerten geöffnet. 2. Bearbeiten Sie die Werte nach Bedarf. Suchen Sie nach verfügbaren Eigenschaften, wenn der Dateiformateditor sich im Quell- oder Zielmodus befindet. Achtung Wird die Vorlage in anderen Jobs verwendet (die Verwendung ist größer als 0), werden die Änderungen, die Sie an der Vorlage vornehmen, auch an den Dateien vorgenommen, die diese Vorlage verwenden. 120 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Dateiformate 3. Klicken Sie auf Speichern. Weitere Informationen Referenzhandbuch: Dateiformat 6.4.1 Bearbeiten einer Quell- oder Zieldatei 1. Klicken Sie im Arbeitsbereich auf den Namen einer Quell- oder Zieldatei. Der Dateiformateditor wird geöffnet und zeigt die Eigenschaften für die ausgewählte Quell- oder Zieldatei an. 2. Bearbeiten Sie die gewünschten Eigenschaften. Suchen Sie nach verfügbaren Eigenschaften, wenn der Dateiformateditor sich im Quell- oder Zielmodus befindet. Um Eigenschaften zu ändern, die im Quell- oder Zielmodus nicht verfügbar sind, müssen Sie die Dateiformatvorlage der Datei bearbeiten. Alle Änderungen, die Sie an Werten in einem Quell- oder Zieldateieditor vornehmen, setzen die Werte im ursprünglichen Dateiformat außer Kraft. 3. Klicken Sie auf Speichern. Weitere Informationen Referenzhandbuch: Dateiformat 6.4.2 Ändern von Eigenschaften für mehrere Spalten Gehen Sie anhand der folgenden Schritte vor, wenn Sie ein neues Dateiformat anlegen oder ein vorhandenes Dateiformat ändern möchten. 1. Wählen Sie den Tab Format in der Objektbibliothek aus. 2. Klicken Sie mit der rechten Maustaste auf ein vorhandenes Dateiformat, das unter "Flatfiles" aufgelistet ist, und wählen Sie Bearbeiten aus. Der Dateiformateditor wird geöffnet. 3. Wählen Sie im Bereich für Spaltenattribute (oberer rechter Fensterbereich) die Spalten aus, die Sie ändern möchten. ○ Zum Auswählen von aufeinanderfolgenden Spalten wählen Sie die erste Spalte aus, drücken Sie die Taste Umschalt auf der Tastatur, und wählen Sie die letzte Spalte aus. ○ Zum Auswählen von nicht aufeinanderfolgenden Spalten halten Sie die Taste Strg gedrückt, und wählen Sie die Spalten aus. Designer-Handbuch Dateiformate PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 121 4. Klicken Sie mit der rechten Maustaste, und wählen Sie Eigenschaften aus. Das Fenster Eigenschaften mehrerer Spalten wird geöffnet. 5. Ändern Sie den Datentyp und/oder den Inhaltstyp und klicken Sie auf OK. Der Datentyp und der Inhaltstyp der ausgewählten Spalten ändern sich gemäß Ihren Einstellungen. 6.5 Dateiformatfunktionen Es gibt mehrere Funktionen zum Verarbeiten von Dateien. 6.5.1 Lesen mehrerer Dateien gleichzeitig Es können mehrere Dateien mit demselben Format unter Verwendung eines einzelnen Quellobjekts aus einem einzelnen Verzeichnis gleichzeitig gelesen werden. 1. Öffnen Sie den Editor für Ihr Quelldateiformat 2. Setzen Sie im Dateiformateditor unter Datendatei(en) die Option Speicherort der Quelldateien auf Lokal oder Jobserver. 3. Legen Sie das Root-Verzeichnis im Root-Verzeichnis fest. Hinweis Falls Ihr Jobserver sich auf einem anderen Rechner als der Designer befindet, kann das Root-Verzeichnis nicht über „Durchsuchen“ angegeben werden. Sie müssen den Pfad eingeben. Sie können einen absoluten oder relativen Pfad eingeben, der Jobserver muss jedoch darauf zugreifen können. 4. Geben Sie unter Dateiname(n) eine der folgenden Optionen ein: ○ Eine kommagetrennte Liste der Dateinamen oder ○ Einen Dateinamen, der einen Platzhalter (* oder ?) enthält. Beispiel: 1999????.txt könnte Dateien ab dem Jahr 1999 lesen *.txt kann alle Dateien mit der Erweiterung txt im angegebenen Root-Verzeichnis lesen 6.5.2 Identifizieren von Quelldateinamen Sie können die Quelldatei für jede Zeile im Ziel identifizieren. Dies kann in den folgenden Situationen sinnvoll sein: ● Sie haben einen Platzhalter angegeben, um mehrere Quelldateien gleichzeitig zu lesen ● Sie laden aus verschiedenen Quelldateien bei verschiedenen Ausführungen So identifizieren Sie eine Quelldatei: 122 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Dateiformate 1. Setzen Sie im Dateiformateditor unter Quellinformationen den Wert für Dateinamenspalte einschließen auf Ja. Diese Option generiert eine Spalte namens DI_FILENAME, die den Namen der Quelldatei enthält. 2. Ordnen Sie im Abfrageeditor die Spalte DI_FILENAME von „Eingabeschema“ dem „Ausgabeschema“ zu. 3. Bei der Ausführung des Jobs enthält die Spalte DI_FILENAME für jede Zeile im Ziel den Quelldateinamen. 6.5.3 Zahlenformate Punkt (.) und Komma (,) sind die beiden gängigsten Formate, die bei numerischen Datentypen als Dezimal- und als Tausendertrennzeichen verwendet werden. Beim Formatieren von Dateien in der Software können die Datentypen Decimal, Numeric, Float und Double diese Symbole enthalten. Sie können eines der Zeichen als Tausender- und das jeweils andere Zeichen als Dezimaltrennzeichen verwenden. Beispiel: 2,098.65 oder 2.089,65. Tabelle 47: Format Beschreibung {ohne} Die Zahl darf nur das Dezimalzeichen enthalten. Das Lesen der Zahlendaten und dieses Dezimaltrenn zeichens wird durch die Gebietsschemaregion des Data-Services-Jobservers bestimmt. Das Komma (,) wird als Dezimaltrennzeichen verwendet, wenn das Data-Services-Gebietsschema auf ein Land ge setzt ist, das Kommata verwendet (wie Deutschland oder Frankreich). Der Punkt (.) wird als Dezimal trennzeichen verwendet, wenn das Gebietsschema auf ein Land gesetzt ist, das Punkte verwendet (wie die USA, Indien und das Vereinigte Königreich). In diesem Format wird ein Fehler ausgegeben, wenn eine Zahl ein Tausendertrennzeichen enthält. Beim Schreiben der Daten wird nur das Dezimal trennzeichen des Jobservergebietsschemas verwendet. Tausendertrennzeichen werden nicht ver wendet. #,##0.0 Das Dezimaltrennzeichen einer Zahl muss ein Punkt (.) sein, das Tausendertrennzeichen ein Komma (,). Wenn die Daten in ein Flatfile geladen werden, wird ein Komma (,) als Tausendertrennzeichen und ein Punkt (.) als Dezimaltrennzeichen verwendet. #.##0,0 Das Dezimaltrennzeichen einer Zahl muss ein Komma (,) das Tausendertrennzeichen ein Punkt (.) sein. Wenn die Daten in ein Flatfile geladen werden, wird ein Punkt (.) als Tausendertrennzeichen und ein Komma (,) als Dezimaltrennzeichen verwendet. Führende und nachfolgende Dezimaltrennzeichen werden ebenfalls unterstützt. Beispiel: +12,000.00 oder 32.32-. Designer-Handbuch Dateiformate PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 123 6.5.4 Ignorieren von Zeilen mit angegebenen Markierungen Der Dateiformateditor bietet eine Möglichkeit, beim Lesen von Dateien die Zeilen zu ignorieren, die eine angegebene Markierung (oder Markierungen) enthalten. Beispielsweise möchten Sie Kommentarzeilenmarkierungen wie # und // ignorieren. Zu dieser Funkktion gehören zwei spezielle Zeichen, das Semikolon (;) und der umgekehrte Schrägstrich (\), die die Definition mehrerer Markierungen in Ihrer Zeichenfolge "Zeilenmarkierungen ignorieren" ermöglichen. Verwenden Sie das Semikolon zur Trennung der einzelnen Markierungen und den umgekehrten Schrägstrich zur Kennzeichnung spezieller Zeichen als Markierungen (wie den umgekehrten Schrägstrich und das Semikolon). Der standardmäßige Markierungswert ist eine leere Zeichenfolge. Wenn Sie den Standardwert angeben, werden keine Zeilen ignoriert. So geben Sie Markierungen für zu ignorierende Zeilen an: 1. Öffnen Sie den Dateiformateditor aus der Objektbibliothek oder durch Öffnen eines Quellobjekts im Arbeitsbereich. 2. Suchen Sie nach Zeilenmarkierung(en) ignorieren unter der Eigenschaft Format. 3. Klicken Sie auf das verknüpfte Textfeld, und geben Sie eine Zeichenfolge ein, um eine oder mehrere Markierungen anzugeben, die Zeilen darstellen, die beim Lesen der Datei und/oder bei der Metadatenanlage übersprungen werden sollen. In der folgenden Tabelle sind einige Beispiele für ignorierte Zeilenmarkierungen aufgeführt. (Jeder Wert wird durch ein Semikolon getrennt, es sei denn, vor dem Semikolon steht ein umgekehrter Schrägstrich). Tabelle 48: Markierungswert(e) Ignorierte Zeile(n) Ohne (dies ist der Standardwert) abc Zeilen, die mit der Zeichenfolge abc beginnen abc;def;hi Zeilen, die mit abc oder def oder hi beginnen abc;\; Zeilen, die mit abc oder ; beginnen abc;\\;\; Zeilen, die mit abc oder \ oder ; beginnen 6.5.5 Datumsformate auf der Feldebene Sie können ein Datumsformat auf der Feldebene angeben, um die Standardformate für Datum, Uhrzeit oder Datum-Uhrzeit zu überschreiben, die im Wertfeld in den Eigenschaften festgelegt sind. Beispiel: Ist Datentyp auf "Datum" gesetzt, können Sie den Wert im entsprechenden Feld Format auf ein anderes Datumsformat wie einen der folgenden Werte setzen: ● jjjj.mm.tt ● MM/TT/JJ ● TT.MM.JJ 124 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Dateiformate 6.5.6 Parallele Verarbeitungsthreads Data Services kann für das Lesen und Laden von Dateien parallele Threads verwenden, um die Leistung zu maximieren. So geben Sie parallele Threads für die Verarbeitung Ihres Dateiformats an: 1. Öffnen Sie mit einer der folgenden Vorgehensweisen den Dateiformateditor: ○ Klicken Sie auf dem Tab "Formate" in der Objektbibliothek mit der rechten Maustaste auf einen Dateiformatnamen, und klicken Sie dann auf Bearbeiten. ○ Doppelklicken Sie im Arbeitsbereich auf ein Quell- oder Zielobjekt. 2. Suchen Sie unter der Eigenschaft Allgemein den Eintrag Parallele Verarbeitungsthreads. 3. Geben Sie die Anzahl der Threads an, die für das Lesen bzw. Laden dieses Dateiformats verwendet werden sollen. Wenn Ihr Jobserverrechner beispielsweise vier CPUs hat, geben Sie in das Feld Parallele Verarbeitungsthreads die Zahl "4" ein. Weitere Informationen Performance Optimization Guide: Using Parallel Execution, File multi-threading 6.5.7 Fehlerbehandlung bei Quellen aus Flatfiles Sie können den Dateiformateditor so konfigurieren, dass Zeilen aus Flatfiles erkannt werden, die Fehler enthalten. Während der Jobausführung werden Zeilen aus Quellen, die aus Flatfiles bestehen, nacheinander verarbeitet. Sie können Informationen über folgende Fehler anzeigen: Tabelle 49: Fehlertyp Beispiel Datentypkonvertierungsfehler Ein Feld könnte beispielsweise im Dateiformateditor mit dem Datentyp INTEGER definiert sein, während die vorhandenen Daten den Datentyp VARCHAR aufweisen. Zeilenformatierungsfehler Bei einer Datei mit fester Breite werden beispielsweise Zeilen identifiziert, die nicht den gewünschten Breitenwert aufweisen. Diese Eigenschaften für die Fehlerbehandlung gelten nur für Quellen, die aus Flatfiles bestehen. Weitere Informationen Referenzhandbuch: Dateiformat Designer-Handbuch Dateiformate PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 125 6.5.7.1 Optionen zur Fehlerbehandlung Im Dateiformateditor können Sie mithilfe der Gruppe von Eigenschaften unter Fehlerbehandlung festlegen, ob die Software Fehlerbehandlungsaktionen ausführt. Aktionen: ● Prüfung auf Fehler, die in eine der zwei Fehlerkategorien für Flatfiles fallen ● Schreiben der ungültigen Zeile(n) in eine angegebene Fehlerdatei ● Stoppen der Verarbeitung der Quelldatei, wenn eine angegebene Anzahl ungültiger Zeilen erreicht wird ● Protokollieren von Warnmeldungen bezüglich der Datentypkonvertierung oder des Zeilenformats im Fehlerprotokoll. In diesem Fall kann die Anzahl der Warnmeldungen festgelegt werden, die protokolliert werden können, ohne dass der Job angehalten wird. 6.5.7.2 Informationen zur Fehlerdatei Wenn sie aktiviert ist, sind in der Fehlerdatei Fehlerinformationen eingeschlossen. Das Format ist eine durch Semikolon getrennte Textdatei. Sie können mehrere Eingabequelldateien für die Fehlerdatei haben. Die Datei befindet sich auf demselben Rechner wie der Jobserver. Die Einträge in einer Fehlerdatei haben folgende Syntax: source file path and name; row number in source file; Data Services error; column number where the error occurred; all columns from the invalid row Der folgende Eintrag stellt einen Zeilenformatfehler dar: d:/acl_work/in_test.txt;2;-80104: 1-3-A column delimiter was seen after column number <3> for row number <2> in file <d:/acl_work/in_test.txt>. The total number of columns defined is <3>, so a row delimiter should be seen after column number <3>. Please check the file for bad data, or redefine the input schema for the file by editing the file format in the UI.;3;defg;234;def wobei 3 einen Fehler angibt, der nach der dritten Spalte aufgetreten ist, und defg;234;def die drei Spalten mit Daten aus der ungültigen Zeile sind. Hinweis Wenn Sie die Option Parallele Verarbeitungsthreads des Dateiformats auf einen Wert festlegen, der größer als 0 ist oder {ohne}, lautet die Zeilenanzahl im Quelldateiwert -1. 126 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Dateiformate 6.5.7.3 6.5.7.3.1 Konfigurieren des Dateiformateditors für die Fehlerbehandlung Erfassen von Datentypkonvertierungs- oder Zeilenformatfehlern 1. Klicken Sie in der Objektbibliothek auf den Tab Formate. 2. Klappen Sie Flatfiles auf, und klicken Sie mit der rechten Maustaste auf ein Format. Klicken Sie dann auf Bearbeiten. 3. Der Dateiformateditor wird geöffnet. 4. Um Datenkonvertierungsfehler zu erfassen, klicken Sie unter den Eigenschaften von Fehlerbehandlung für Datenkonvertierungsfehler erfassen auf Ja. 5. Um Fehler in Bezug auf das Zeilenformat zu erfassen, klicken Sie für Zeilenformatfehler erfassen auf Ja. 6. Klicken Sie auf Speichern oder Speichern und schließen. 6.5.7.3.2 Protokollieren von ungültigen Zeilen in einer Fehlerdatei 1. Klicken Sie in der Objektbibliothek auf den Tab Formate. 2. Klappen Sie Flatfiles auf, und klicken Sie mit der rechten Maustaste auf ein Format. Klicken Sie dann auf Bearbeiten. Der Dateiformateditor wird geöffnet. 3. Klicken Sie unter den Eigenschaften von Fehlerbehandlung für Datenkonvertierungsfehler erfassen oder Zeilenformatfehler erfassen oder für beide Eigenschaften auf Ja. 4. Klicken Sie für Fehlerzeilen in Datei schreiben auf Ja. Zwei weitere Felder werden angezeigt: "Root-Verzeichnis der Fehlerdatei" und "Fehlerdateiname". 5. Geben Sie unter Root-Verzeichnis der Fehlerdatei ein Verzeichnis zur Speicherung der Fehlerdatei ein. Wenn Sie hier einen Verzeichnispfad eingeben, brauchen Sie für die Eigenschaft "Fehlerdateiname" nur den Dateinamen einzugeben. 6. Geben Sie unter Fehlerdateinamen einen Namen ein. Wenn Sie "Root-Verzeichnis der Fehlerdatei" leer gelassen haben, geben Sie hier einen vollständigen Pfad mit Dateinamen ein. 7. Klicken Sie auf Speichern oder Speichern und schließen. Um die Benennung der Fehlerdatei flexibler zu gestalten, können Sie eine Variable eingeben, die auf eine bestimmte Datei mit vollständigem Pfadnamen eingestellt ist. Verwenden Sie Variablen, um Dateinamen anzugeben, die Sie sonst nicht eingeben könnten, beispielsweise Namen mit Mehrfachbyte-Zeichen. Designer-Handbuch Dateiformate PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 127 6.5.7.3.3 Beschränken der Anzahl an vor dem Anhalten des Jobs verarbeiteten ungültigen Zeilen 1. Klicken Sie in der Objektbibliothek auf den Tab Formate. 2. Klappen Sie Flatfiles auf, und klicken Sie mit der rechten Maustaste auf ein Format. Klicken Sie dann auf Bearbeiten. Der Dateiformateditor wird geöffnet. 3. Klicken Sie unter den Eigenschaften von Fehlerbehandlung für Datenkonvertierungsfehler erfassen oder Zeilenformatfehler erfassen oder für beide Eigenschaften auf Ja. 4. Geben Sie für Maximale Anzahl von Fehlern zum Stoppen des Jobs eine Zahl ein. Hinweis Diese Eigenschaft wurde früher "Grenzwert für fehlerhafte Zeilen" genannt. 5. Klicken Sie auf Speichern oder Speichern und schließen. 6.5.7.3.4 Protokollieren von DatentypkonvertierungsWarnmeldungen im Fehlerprotokoll 1. Klicken Sie in der Objektbibliothek auf den Tab Formate. 2. Klappen Sie Flatfiles auf, und klicken Sie mit der rechten Maustaste auf ein Format. Klicken Sie dann auf Bearbeiten. Der Dateiformateditor wird geöffnet. 3. Klicken Sie unter den Eigenschaften für die Fehlerbehandlung für Datenkonvertierungswarnungen protokollieren auf Ja. 4. Klicken Sie auf Speichern oder Speichern und schließen. 6.5.7.3.5 Protokollieren von Zeilenformat-Warnmeldungen im Fehlerprotokoll 1. Klicken Sie in der Objektbibliothek auf den Tab Formate. 2. Klappen Sie Flatfiles auf, und klicken Sie mit der rechten Maustaste auf ein Format. Klicken Sie dann auf Bearbeiten. Der Dateiformateditor wird geöffnet. 3. Klicken Sie unter den Eigenschaften für die Fehlerbehandlung für Zeilenformatwarnmeldungen protokollieren auf Ja. 4. Klicken Sie auf Speichern oder Speichern und schließen. 128 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Dateiformate 6.5.7.3.6 Beschränken der Anzahl an zu protokollierenden Warnmeldungen Wenn Sie Datentyp- oder Zeilenformatwarnmeldungen protokollieren, können Sie festlegen, wie viele Warnmeldungen maximal protokolliert werden können, bevor die Jobausführung unterbrochen wird. 1. Klicken Sie in der Objektbibliothek auf den Tab Formate. 2. Klappen Sie Flatfiles auf, und klicken Sie mit der rechten Maustaste auf ein Format. Klicken Sie dann auf Bearbeiten. Der Dateiformateditor wird geöffnet. 3. Klicken Sie unter den Eigenschaften für die Fehlerbehandlung für Zeilenformatwarnmeldungen protokollieren oder Datenkonvertierungswarnungen protokollieren (oder beides) auf Ja. 4. Geben Sie für Maximale Anzahl zu protokollierender Warnmeldungen eine Zahl ein. 5. Klicken Sie auf Speichern oder Speichern und schließen. 6.6 Dateiübertragungsprotokolle Beschreibt zwei Methoden zur Einrichtung von Dateiübertragungsprotokollen in einem Dateiformat. In der folgenden Tabelle werden zwei Methoden für die Verknüpfung eines Dateiübertragungsprotokolls mit einem Dateiformat beschrieben. Tabelle 50: Dateiübertragungsmethode Benutzerdefiniertes Übertragungsprogramm Vorgehensweise: 1. Legen Sie die Option Benutzerdefiniertes Übertragungsprogramm auf Ja fest. 2. Klappen Sie Benutzerdefinierte Übertragung auf, und ge ben Sie den Namen und die Argumente des benutzerdefi nierten Übertragungsprogramms ein. Dateispeicherortobjekt 1. Legen Sie die Option Benutzerdefiniertes Übertragungsprogramm auf Nein fest. 2. Wählen Sie in der Drop-Down-Liste Speicherort den Na men eines Dateispeicherortobjekts aus. 3. Geben Sie den Namen einer vorhandenen Datei zur Bear beitung in die Option Dateiname(n) ein. 4. Wählen Sie Ja oder Nein für Datei nach Übertragung löschen. Wenn Sie Ja wählen, wird die Dateikopie auf dem lokalen Server gelöscht, nachdem sie als Quelle und/oder Ziel in einem Datenfluss verwendet wurde. Designer-Handbuch Dateiformate PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 129 Weitere Informationen Benutzerdefinierte Dateiübertragungen [Seite 130] Dateispeicherorte [Seite 144] 6.6.1 Benutzerdefinierte Dateiübertragungen Die Software kann Dateien mithilfe eines Drittherstellerprogramms für die Übertragung von Flatfiles lesen und laden. Mit Drittherstellerprogrammen (benutzerdefinierten Programmen) für die Übertragung können Sie folgende Aufgaben ausführen: ● Dem Unternehmensstandard entsprechende Dateiübertragungsanwendungen in die Jobausführung durch die Software einschließen ● Hohe Flexibilität und Sicherheit für Dateien bereitstellen, die über eine Firewall übertragen werden Über die Option für benutzerdefiniertes Übertragungsprogramm können Sie Folgendes angeben: ● Ein benutzerdefiniertes Übertragungsprogramm (das während der Jobausführung aufgerufen wird) ● Weitere Argumente, die von den verfügbaren Funktionen in dem Programm abhängig sind, darunter Folgendes: ○ Verbindungsdaten ○ Mechanismen für Verschlüsselung/Entschlüsselung ○ Mechanismen für Komprimierung 6.6.1.1 Benutzerdefinierte Übertragungssystemvariablen für Flatfiles Durch die Verwendung von Variablen als benutzerdefinierte Übertragungsprogrammargumente können Sie in die Software eingegebene Verbindungsinformationen sammeln und diese Daten zur Laufzeit mit Ihrem benutzerdefinierten Übertragungsprogramm verwenden. Wenn Sie benutzerdefinierte Übertragungsoptionen für externe Dateiquellen und -ziele festlegen, müssen einige Übertragungsinformationen wie der Name des Remote-Servers, an den bzw. von dem die Datei übertragen wird, möglicherweise buchstabengetreu als Übertragungsprogrammargument eingegeben werden. Sie können weitere Informationen mit den folgenden Systemvariablen eingeben: Tabelle 51: Eingegebene Daten für: Werden durch diese Variable ersetzt, wenn sie im Feld "Argumente" definiert wurde Benutzername $AW_USER Kennwort $AW_PASSWORD Lokales Verzeichnis $AW_LOCAL_DIR 130 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Dateiformate Eingegebene Daten für: Werden durch diese Variable ersetzt, wenn sie im Feld "Argumente" definiert wurde Datei(en) $AW_FILE_NAME Die folgenden benutzerdefinierten Übertragungsoptionen verwenden eine Windows-Befehlsdatei (Myftp.cmd) mit fünf Argumenten. Die Argumente 1 bis 4 sind Systemvariablen: ● Benutzer- und Kennwortvariablen betreffen den externen Server. ● Die Variable "Lokales Verzeichnis" betrifft den Speicherort, an dem die übertragenen Dateien in der Software gespeichert werden. ● Die Variable "Dateiname" betrifft die Namen der zu übertragenden Dateien. Durch Argument 5 wird der eigentliche Name des externen Servers bereitgestellt. Hinweis Wenn Sie keine Standardausgabedatei angeben (wie ftp.out im Beispiel unten), wird die Standardausgabe in das Trace-Protokoll des Jobs geschrieben. @echo off set USER=%1 set PASSWORD=%2 set LOCAL_DIR=%3 set FILE_NAME=%4 set LITERAL_HOST_NAME=%5 set INP_FILE=ftp.inp echo %USER%>%INP_FILE% echo %PASSWORD%>>%INP_FILE% echo lcd %LOCAL_DIR%>>%INP_FILE% echo get %FILE_NAME%>>%INP_FILE% echo bye>>%INP_FILE% ftp -s%INPT_FILE% %LITERAL_HOST_NAME%>ftp.out 6.6.1.2 Benutzerdefinierte Übertragungsoptionen für Flatfiles Von den Optionen für das benutzerdefinierte Übertragungsprogramm ist nur die Option Ausführbare Datei obligatorisch. Die Eingabe von Werten für Benutzername, Kennwort und Argumente ist optional. Diese Optionen werden bereitgestellt, damit Sie die Möglichkeit haben, Argumente einzugeben, die das benutzerdefinierte Übertragungsprogramm verarbeiten kann (z.B. Verbindungsdaten). Sie können auch Argumente verwenden, um die integrierten Funktionen des Programms wie Mechanismen für Verschlüsselung/Entschlüsselung und Komprimierung zu aktivieren oder zu deaktivieren. Beispielsweise können Sie das Übertragungsprogramm so einrichten, dass die Sicherheit oder Komprimierung aktiviert wird, wenn Sie sSecureTransportOn oder -CCompressionYES eingeben. Designer-Handbuch Dateiformate PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 131 Hinweis Die verfügbaren Argumente sind von den Funktionen des benutzerdefinierten Übertragungsprogramms abhängig. Eine Liste der gültigen Argumente finden Sie in der Dokumentation zu dem benutzerdefinierten Übertragungsprogramm. Sie können das Feld Argumente verwenden, um einen Benutzernamen und ein Kennwort einzugeben. Die Software stellt jedoch auch die Felder Benutzername und Kennwort bereit. Wenn Sie die Variablen $<AW_USER> und $<AW_PASSWORD> als Argumente eingeben und anschließend die Felder Benutzer und Kennwort verwenden, um Literalzeichenfolgen einzugeben, sind diese zusätzlichen Felder in zweierlei Hinsicht nützlich: ● Sie können Benutzer und Kennwörter in der Software auf einfachere Weise aktualisieren, und zwar sowohl bei der Konfiguration der Software für die Verwendung eines Übertragungsprogramms als auch beim späteren Export des Jobs. Wenn Sie beispielsweise den Job in eine andere Umgebung migrieren, möchten Sie möglicherweise die Anmeldeinformationen ändern, ohne durch die anderen Argumente blättern zu müssen. ● Sie können die Maskierungs- und Verschlüsselungseigenschaften des Felds Kennwort verwenden. Die in das Feld Kennwort eingegebenen Daten werden in Protokolldateien und im Fenster maskiert, im Repository gespeichert und von Data Services verschlüsselt. Hinweis Die Software sendet Kennwortdaten im Klartext an das benutzerdefinierte Übertragungsprogramm. Wenn es in Ihrem Unternehmen nicht zulässig ist, Kennwörter im Klartext in ausführbaren Befehlszeilendateien zu verwenden, müssen Sie das benutzerdefinierte Programm so einrichten, dass es eine der folgenden Aktionen ausführt: ○ Es ruft das zugehörige Kennwort aus einem vertrauenswürdigen Speicherort ab. ○ Es übernimmt die Sicherheitsberechtigungen vom aufrufenden Programm (in diesem Fall von der Software). 6.6.1.3 Festlegen benutzerdefinierter Übertragungsoptionen Die benutzerdefinierte Übertragungsoption ermöglicht es Ihnen, ein Programm eines Drittherstellers für die Übertragung von Flatfile-Quellen und -Zielen zu verwenden. Sie können Ihr benutzerdefiniertes Übertragungsprogramm im Fenster "Dateiformateditor" konfigurieren. Wie andere Dateiformateinstellungen können Sie die Einstellungen des benutzerdefinierten Übertragungsprogramms überschreiben, wenn sie in einem bestimmten Datenfluss für eine Quelle oder ein Ziel geändert werden. Außerdem können Sie die benutzerdefinierte Übertragungsoption beim Exportieren eines Dateiformats bearbeiten. 6.6.1.3.1 Konfigurieren eines benutzerdefinierten Übertragungsprogramms im Dateiformateditor 1. Wählen Sie den Tab Formate in der Objektbibliothek. 132 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Dateiformate 2. Klicken Sie mit der rechten Maustaste auf Flatfiles im Tab und wählen Neu. Der Dateiformateditor wird geöffnet. 3. Wählen Sie den Dateityp Getrennt oder Feste Breite aus. Hinweis Während die Option des benutzerdefinierten Übertragungsprogramms von SAP-Anwendungsdateitypen nicht unterstützt wird, können Sie sie als Datentransportmethode für einen SAP-ABAP-Datenfluss verwenden. 4. Geben Sie einen Formatnamen ein. 5. Wählen Sie Ja für die Option Benutzerdefiniertes Übertragungsprogramm. 6. Klappen Sie Benutzerdefinierte Übertragung auf, und geben Sie den Namen und die Argumente des benutzerdefinierten Übertragungsprogramms ein. 7. Vervollständigen Sie die anderen Felder im Fenster des Dateiformateditors. Geben Sie im Abschnitt "Datendatei(en)" den Speicherort der Datei an. So geben Sie Systemvariablen für das Root-Verzeichnis und Dateien im Feld "Argumente" an: ○ Verknüpfen Sie die Systemvariable $<AW_LOCAL_DIR> mit dem Argument des lokalen Verzeichnisses Ihres benutzerdefinierten Übertragungsprogramms. ○ Verknüpfen Sie die Systemvariable $<AW_FILE_NAME> mit dem Argument des Dateinamens Ihres benutzerdefinierten Übertragungsprogramms. Geben Sie beispielsweise ein: -l$AW_LOCAL_DIR\$AW_FILE_NAME Wenn das Programm ausgeführt wird, werden diese Variablen durch die Einstellungen des RootVerzeichnisses und der Dateien ersetzt und vom benutzerdefinierten Übertragungsprogramm gelesen. Hinweis Das im obigen Beispiel verwendete Kennzeichen -1 ist ein benutzerdefiniertes Programmkennzeichen. Die Argumente, die Sie als benutzerdefinierte Programmargumente verwenden können, sind von den Erwartungen Ihres benutzerdefinierten Übertragungsprogramms abhängig. 8. Klicken Sie auf Speichern. Weitere Informationen Ergänzungsdokument für SAP: Benutzerdefinierte Übertragungsmethode Referenzhandbuch: Dateiformat 6.6.1.4 Tipps für den Entwurf Verwenden Sie folgende Designtipps für benutzerdefinierte Übertragungsoptionen. Designer-Handbuch Dateiformate PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 133 ● Variablen werden in Dateinamen nicht unterstützt, wenn ein benutzerdefiniertes Übertragungsprogramm für die Datei aufgerufen wird. ● Sie können Optionen für die benutzerdefinierte Übertragung nur vor deren Export im Fenster des Dateiformateditors (oder Datastore-Editors bei SAP-Anwendungen) bearbeiten. Nach dem Export lassen sich Aktualisierungen an Dateiquellen und -zielen nicht auf Datenflussebene bearbeiten. Nachdem die Optionen für die benutzerdefinierte Übertragung importiert wurden, können Sie die Einstellungen auf Datenflussebene anpassen. Sie überschreiben Einstellungen auf Dateiformatebene. Wenn Sie für die Zusammenarbeit mit der Software ein benutzerdefiniertes Übertragungsprogramm entwerfen, sollten Sie Folgendes beachten: ● Die Software erwartet, dass das aufgerufene Übertragungsprogramm bei erfolgreicher Ausführung 0 und bei fehlgeschlagener Ausführung einen Wert ungleich 0 zurückgibt. ● Die Software stellt Trace-Informationen vor und nach der Ausführung des benutzerdefinierten Übertragungsprogramms bereit. Das vollständige Übertragungsprogramm und seine Argumente mit maskiertem Kennwort (falls vorhanden) werden in das Trace-Protokoll geschrieben. Wenn „Benutzerdefinierte Übertragung abgeschlossen“ im Trace-Protokoll erscheint, wurde das benutzerdefinierte Übertragungsprogramm beendet. ● Verlief die Ausführung des benutzerdefinierten Übertragungsprogramms erfolgreich (Rückgabecode ist 0), führt die Software folgende Prüfungen durch: ○ Wenn die Transportdatei bei einem ABAP-Datenfluss im lokalen Verzeichnis nicht vorhanden ist, wird ein Fehler ausgelöst und die Software gestoppt. ○ Wenn die von der Software zu lesende(n) Datei(en) bei einer Dateiquelle im lokalen Verzeichnis nicht vorhanden ist/sind, wird eine Warnmeldung in die Trace-Datei geschrieben. ● Falls das benutzerdefinierte Übertragungsprogramm einen Fehler auslöst hat oder dessen Ausführung fehlschlägt (Rückgabecode ist nicht 0), generiert die Software einen Fehler mit Rückgabecode und der Ausgabe stdout/stderr. ● Wenn das benutzerdefinierte Übertragungsprogramm erfolgreich ausgeführt wird, jedoch eine Standardausgabe generiert, gibt die Software eine Warnmeldung aus, protokolliert die ersten 1.000 Byte der generierten Ausgabe und fährt mit der Verarbeitung fort. ● Der Entwickler des benutzerdefinierten Übertragungsprogramms muss gültige Optionsargumente bereitstellen, um sicherzustellen, dass Dateien an das lokale (in der Software angegebene) Verzeichnis und von diesem Verzeichnis übertragen werden. Hierfür müssen unter Umständen die Namen einer Remote-Datei und eines Remote-Verzeichnisses als Argumente angegeben und dann mithilfe von Systemvariablen an die Designer-Schnittstelle gesendet werden. Weitere Informationen Supplement for SAP: Benutzerdefinierte Übertragungsmethode 6.7 Arbeiten mit COBOL-Copybook-Dateiformaten Ein COBOL-Copybook-Dateiformat beschreibt die Struktur, die in einer COBOL-Copybook-Datei (meist durch eine .cpy-Erweiterung gekennzeichnet) definiert ist. 134 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Dateiformate Beim Anlegen eines COBOL-Copybook-Formats haben Sie folgende Möglichkeiten: ● Sie legen nur das Format an und konfigurieren dann die Quelle, nachdem Sie das Format einem Datenfluss hinzugefügt haben, oder ● Sie legen das Format an und ordnen es gleichzeitig einer Datendatei zu. In diesem Abschnitt wird auch beschrieben, wie Sie Folgendes ausführen: ● Regeln anlegen, um mithilfe der Option „Feld-ID“ zu identifizieren, welche Datensätze welche Schemas darstellen. ● Mit einer Feldoption für die Datensatzlänge das Feld ermitteln, das die Länge des Schemadatensatzes enthält. Weitere Informationen Referenzhandbuch: Importieren oder Bearbeiten von COBOL-Copybook-Formatoptionen Referenzhandbuch: COBOL-Copybook-Quelloptionen Referenzhandbuch: Datentypen, Konvertierung in oder von interne(n) Datentypen Dateispeicherorte [Seite 144] 6.7.1 Anlegen eines neuen COBOL-Copybook-Dateiformats 1. Klicken Sie in der lokalen Objektbibliothek auf den Tab Formate, klicken Sie mit der rechten Maustaste auf COBOL Copybooks, und klicken Sie auf Neu. Das Fenster "COBOL Copybook importieren" wird geöffnet. 2. Geben Sie dem Format einen Namen, indem Sie in das Feld Formatname einen Namen eingeben. 3. Legen Sie im Tab Format für Dateiname das zu importierende COBOL-Copybook-Dateiformat fest, das in der Regel die Erweiterung .cpy aufweist. Während des Entwurfs können Sie eine Datei festlegen. Sie haben dazu folgende Möglichkeiten: ○ Für eine Datei, die auf dem Rechner gespeichert ist, auf dem der Designer ausgeführt wird, können Sie die Schaltfläche Durchsuchen verwenden. ○ Für eine Datei, die auf dem Rechner gespeichert ist, auf dem der Jobserver ausgeführt wird, müssen Sie den Pfad zur Datei eingeben. Sie können einen absoluten Pfad oder einen relativen Pfad eingeben, der Jobserver muss jedoch darauf zugreifen können. 4. Klicken Sie auf OK. Die Software fügt der Objektbibliothek das COBOL Copybook hinzu. 5. Das Dialogfenster Schemaname(n) des COBOL Copybooks wird angezeigt. Falls gewünscht, können Sie einen Schemanamen auswählen oder auf diesen doppelklicken, um ihn umzubenennen. 6. Klicken Sie auf OK. Wenn Sie das Format später einem Datenfluss hinzufügen, können Sie die Optionen im Quelleditor verwenden, um die Quelle zu definieren. Designer-Handbuch Dateiformate PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 135 Weitere Informationen Referenzhandbuch: COBOL-Copybook-Quelloptionen 6.7.2 Anlegen eines neuen COBOL-Copybook-Dateiformats und einer Datendatei 1. Klicken Sie in der lokalen Objektbibliothek auf den Tab Formate, klicken Sie mit der rechten Maustaste auf COBOL Copybooks, und klicken Sie auf Neu. Das Fenster "COBOL Copybook importieren" wird geöffnet. 2. Geben Sie dem Format einen Namen, indem Sie in das Feld Formatname einen Namen eingeben. 3. Legen Sie im Tab Format für Dateiname das zu importierende COBOL-Copybook-Dateiformat fest, das in der Regel die Erweiterung .cpy aufweist. Während des Entwurfs können Sie eine Datei festlegen. Sie haben dazu folgende Möglichkeiten: ○ Für eine Datei, die auf dem Rechner gespeichert ist, auf dem der Designer ausgeführt wird, können Sie die Schaltfläche "Durchsuchen" verwenden. ○ Für eine Datei, die auf dem Rechner gespeichert ist, auf dem der Jobserver ausgeführt wird, müssen Sie den Pfad zur Datei eingeben. Sie können einen absoluten Pfad oder einen relativen Pfad eingeben, der Jobserver muss jedoch darauf zugreifen können. 4. Klicken Sie auf den Tab Datendatei. 5. Für Verzeichnis geben Sie das Verzeichnis ein, das die zu importierende COBOL-Copybook-Datendatei enthält, oder navigieren Sie in dieses Verzeichnis. Wenn Sie hier einen Verzeichnispfad einschließen, geben Sie nur den Dateinamen in das Feld "Name" ein. 6. Legen Sie den Namen der COBOL-Copybook-Datendatei fest. Wenn Sie das Verzeichnis leer lassen, geben Sie hier einen vollständigen Pfad und einen Dateinamen ein. Während des Entwurfs können Sie eine Datei festlegen. Sie haben dazu folgende Möglichkeiten: ○ Für eine Datei, die auf dem Rechner gespeichert ist, auf dem der Designer ausgeführt wird, können Sie die Schaltfläche „Durchsuchen“ verwenden. ○ Für eine Datei, die auf dem Rechner gespeichert ist, auf dem der Jobserver ausgeführt wird, müssen Sie den Pfad zur Datei eingeben. Sie können einen absoluten Pfad oder einen relativen Pfad eingeben, der Jobserver muss jedoch darauf zugreifen können. 7. Wenn die Datendatei nicht auf demselben Rechner gespeichert ist wie der Jobserver, klicken Sie auf den Tab Datenzugriff. Wählen Sie FTP oder Benutzerdefiniert, und geben Sie die Kriterien für den Zugriff auf die Datendatei ein. 8. Klicken Sie auf OK. 9. Das Dialogfenster Schemaname(n) des COBOL Copybooks wird angezeigt. Falls gewünscht, können Sie einen Schemanamen auswählen oder auf diesen doppelklicken, um ihn umzubenennen. 10. Klicken Sie auf OK. Über den Tab "Feld-ID" können Sie Regeln anlegen, um zu identifizieren, welche Datensätze welche Schemas darstellen. 136 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Dateiformate Weitere Informationen Referenzhandbuch: Importieren oder Bearbeiten von COBOL-Copybook-Formatoptionen 6.7.3 Anlegen von Regeln, um zu identifizieren, welche Datensätze welche Schemas darstellen 1. Klicken Sie in der lokalen Objektbibliothek auf den Tab Formate, klicken Sie mit der rechten Maustaste auf COBOL-Copybooks, und klicken Sie auf Neu. Das Fenster "COBOL Copybook bearbeiten" wird geöffnet. 2. Wählen Sie im oberen Fensterbereich ein Feld aus, um das Schema darzustellen. 3. Klicken Sie auf den Tab Feld-ID. 4. Aktivieren Sie im Tab "Feld-ID" das Kontrollkästchen Verwenden Sie das Feld <Schemaname.Feldname> als ID. 5. Klicken Sie auf Darunter einfügen, um der Werteliste einen bearbeitbaren Wert hinzuzufügen. 6. Geben Sie einen Wert für das Feld ein. 7. Fahren Sie nach Bedarf fort, Werte (hinzuzufügen) einzufügen. 8. Wählen Sie zusätzliche Felder aus, und fügen Sie nach Bedarf Werte ein. 9. Klicken Sie auf OK. 6.7.4 Identifizieren des Felds, das die Länge des Schemadatensatzes enthält 1. Klicken Sie in der lokalen Objektbibliothek auf den Tab Formate, klicken Sie mit der rechten Maustaste auf COBOL-Copybooks, und klicken Sie auf Neu. Das Fenster "COBOL Copybook bearbeiten" wird geöffnet. 2. Klicken Sie auf den Tab Feld für Datensatzlänge. 3. Klicken Sie für das zu bearbeitende Schema in die Spalte "Feld für Datensatzlänge", um ein Drop-Down-Menü zu aktivieren. 4. Wählen Sie das Feld aus (eines pro Schema), das die Datensatzlänge enthält. Der Versatzwert ändert sich automatisch in den Standard 4; Sie können ihn jedoch in jeden beliebigen anderen numerischen Wert ändern. Der Versatz ist der Wert, der die Gesamt-Datensatzlänge ergibt, wenn er zu dem Wert im Feld "Datensatzlänge" hinzugefügt wird. 5. Klicken Sie auf OK. Designer-Handbuch Dateiformate PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 137 6.8 Anlegen von Microsoft-Excel-ArbeitsmappenDateiformaten auf UNIX-Plattformen Beschreibt die Verwendung einer Microsoft-Excel-Arbeitsmappe als Quelle mit einem Jobserver auf einer UNIXPlattform. Informationen zum Anlegen von Microsoft-Excel-Arbeitsmappen-Dateiformaten unter Windows finden Sie im Referenzhandbuch. Um auf die Arbeitsmappe zuzugreifen, müssen Sie eine Adapterinstanz im Administrator anlegen und konfigurieren. Im Folgenden erhalten Sie einen Überblick über den Konfigurationsprozess. Einzelheiten zum Anlegen von Adaptern finden Sie im Management-Console-Handbuch. Berücksichtigen Sie auch folgende Anforderungen: ● Um eine Arbeitsmappe zu importieren, muss sie in einem Windows-Dateisystem verfügbar sein. Sie können den Speicherort der eigentlichen Datei, die zur Verarbeitung im Quelleditor des Excel-ArbeitsmappenDateiformats verwendet werden soll, später ändern. Weitere Informationen finden Sie im Referenzhandbuch. ● Um Daten erneut in den Designer zu importieren oder anzuzeigen, muss die Datei in Windows zur Verfügung stehen. ● Einträge in der Fehlerprotokolldatei werden für die Datums- und Uhrzeitfelder möglicherweise numerisch angezeigt. Außerdem schreibt Data Services die Datensätze mit Fehlern in die Ausgabe (in Windows werden diese Datensätze ignoriert). Weitere Informationen Referenzhandbuch: Excel-Arbeitsmappenformat Management-Console-Handbuch: Adapter Referenzhandbuch: Excel-Arbeitsmappen-Quelloptionen Dateispeicherorte [Seite 144] 6.8.1 Anlegen eines Microsoft-Excel-ArbeitsmappenDateiformats unter UNIX 1. Überprüfen Sie mit dem Servermanager (<LINK_DIR>/bin/svrcfg), ob der UNIX-Jobserver Adapter unterstützt. Weitere Informationen finden Sie im Installationshandbuch für UNIX. 2. Stellen Sie sicher, dass ein mit dem Jobserver verknüpftes Repository in der Central Management Console (CMC) registriert ist. Informationen zum Registrieren eines Repositorys in der CMC finden Sie im Administratorhandbuch. 3. Fügen Sie im Administrator einen Adapter für den Zugriff auf Excel-Arbeitsmappen hinzu. Weitere Informationen finden Sie im Management-Console-Handbuch. Sie können nur einen Excel-Adapter pro Jobserver konfigurieren. Dafür stehen folgende Optionen zur Verfügung: 138 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Dateiformate ○ Klicken Sie auf dem Tab "Status" rechts auf den zu konfigurierenden Jobserveradapter. ○ Klicken Sie auf der Seite "Adapterkonfiguration" auf der Seite "Adapterinstanzen" auf Hinzufügen. ○ Machen Sie auf dem Tab „Adapterkonfiguration“ unter Name der Adapterinstanz entsprechende Angaben. Geben Sie BOExcelAdapter ein (erforderliche Eingabe; beachten Sie die Groß- und Kleinschreibung). Für die anderen Optionen können die Standardwerte beibehalten werden, mit Ausnahme von Dateien, die größer als 1 MB sind. Ändern Sie in diesem Fall den Wert für „Zusätzliche Java-Launcher-Optionen“ in Xms64m -Xmx512 oder -Xms128m -Xmx1024m (Standardwert ist -Xms64m -Xmx256m). Über die JavaArbeitsspeicherverwaltung kann die Verarbeitung sehr großer Dateien (oder vieler kleinerer Dateien) verhindert werden. Hinweis Ab Data Services 4.2 SP5 verwendet der Excel-Adapter einen SAX-ereignisbasierten Mechanismus zum Parsen der Excel-Dateien. Wenn Sie die Verarbeitung auf die in Version 4.2 SP4 oder früher zurücksetzen möchten, legen Sie das folgende Kennzeichen auf Falsch fest und starten den Jobserver neu. Das Kennzeichen wird in den Java-Launcher-Optionen für die BOExcelAdapterKonfigurationseinstellungen in der Management Console angegeben. DuseSAXEventModelForXlsx=false Wenn das Kennzeichen „DuseSAXEventModelForXlsx“ nicht angegeben wird, gilt standardmäßig Wahr, und das SAX-Ereignismodell wird verwendet. Bei der Verarbeitung großer Excel-Dateien sollte die Java-Heap-Größe in den Java-Launcher-Optionen erhöht werden. Beispiel: -Xms256m –Xmx4096m 4. Wählen Sie Administrator Adapter Adapterinstanzstatus , um den Adapter zu starten. 5. Legen Sie im Designer auf dem Tab Formate der Objektbibliothek das Dateiformat an, indem Sie die ExcelArbeitsmappe importieren. Weitere Informationen finden Sie im Referenzhandbuch. Weitere Informationen Administratorhandbuch: Registrieren eines Repositorys in der CMC Management-Console-Handbuch: Hinzufügen und Konfigurieren von Adapterinstanzen Referenzhandbuch: Excel-Arbeitsmappenformat 6.9 Anlegen von Dateiformaten für Webprotokolle Webprotokolle sind von Web-Services generierte Flatfiles, die für Business Intelligence verwendet werden. Webprotokolle verfolgen üblicherweise Details zu Website-Aufrufen wie: ● Clientdomänennamen oder IP-Adressen Designer-Handbuch Dateiformate PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 139 ● Benutzernamen ● Zeitstempel ● Angeforderte Aktion (kann die Suchzeichenfolge umfassen) ● Übertragene Byte ● Zugehörige Adresse ● Cookie-ID Webprotokolle verwenden ein allgemeines Dateiformat und ein erweitertes allgemeines Dateiformat. Allgemeines Webprotokollformat: 151.99.190.27 - - [01/Jan/1997:13:06:51 -0600] "GET /~bacuslab HTTP/1.0" 301 -4 Erweitertes allgemeines Webprotokollformat: saturn5.cun.com - - [25/JUN/1998:11:19:58 -0500] "GET /wew/js/mouseover.html HTTP/1.0" 200 1936 "http://av.yahoo.com/bin/query?p=mouse+over+javascript+source+code&hc=0" "Mozilla/4.02 [en] (x11; U; SunOS 5.6 sun4m)" In der Software werden allgemeine und erweiterte allgemeine Webprotokollformate als Quellen unterstützt. Der Dateiformateditor unterstützt ferner Folgendes: ● Bindestrich als NULL-Indikator ● Zeitzone in Datum-Uhrzeit, z.B. 01/Jan/1997:13:06:51 –0600 Die Software umfasst verschiedene Funktionen für die Verarbeitung von Webprotokolldaten: ● Word_ext-Funktion ● Concat_data_time-Funktion ● WL_GetKeyValue (Funktion) Weitere Informationen Word_ext-Funktion [Seite 140] Concat_date_time (Funktion) [Seite 141] WL_GetKeyValue (Funktion) [Seite 141] 6.9.1 Word_ext-Funktion word_ext ist eine Zeichenfolgenfunktion, mit der die Wortfunktion erweitert wird, indem ein anhand seiner Position in einer Delimited-Zeichenfolge identifiziertes Wort zurückgegeben wird. Diese Funktion ist für das Parsen von URLs oder Dateinamen hilfreich. 140 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Dateiformate Format word_ext(string, word_number, separator(s)) Eine negative Wortnummer bedeutet, dass von rechts nach links gezählt wird. Beispiele word_ext('www.bodi.com', 2, '.') gibt 'bodi' zurück. word_ext('www.cs.wisc.edu', -2, '.') gibt 'wisc' zurück. word_ext('www.cs.wisc.edu', 5, '.') gibt NULL zurück. word_ext('aaa+=bbb+=ccc+zz=dd', 4, '+=') gibt 'zz' zurück. Wenn zwei Trennzeichen angegeben werden (+=), sucht die Funktion nach beiden. word_ext(',,,,,aaa,,,,bb,,,c ', 2, '.') gibt 'bb' zurück. Diese Funktion überspringt aufeinanderfolgende Trennzeichen. 6.9.2 Concat_date_time (Funktion) Concat_date_time ist eine Datumsfunktion, die einen Datums-/Uhrzeitwert aus separaten Datums- und Uhrzeiteingaben zurückgibt. Format concat_date_time(date, time) Beispiel concat_date_time(MS40."date",MS40."time") 6.9.3 WL_GetKeyValue (Funktion) WL_GetKeyValue ist eine (in der Skriptsprache geschriebene) benutzerdefinierte Funktion, die den Wert eines bestimmten Schlüsselworts zurückgibt. Designer-Handbuch Dateiformate PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 141 Sie ist nützlich für das Parsen von Suchzeichenfolgen. Format WL_GetKeyValue(string, keyword) Beispiel Eine Suche in Google nach bodi B2B wird in einem Webprotokoll wie folgt aufgezeichnet: GET "http://www.google.com/search?hl=en&lr=&safe=off&q=bodi+B2B&btnG=Google+Search" WL_GetKeyValue('http://www.google.com/search?hl=en&lr=&safe=off&q=bodi +B2B&btnG=Google+Search','q') returns 'bodi+B2B'. 6.10 Unstrukturierte Dateiformate Unstrukturierte Dateiformate sind eine Art Flatfile-Format. Um Dateien mit unstrukturiertem Inhalt zu lesen, legen Sie ein Dateiformat als Quelle an, das eine oder mehrere Dateien aus einem Verzeichnis liest. Zur Laufzeit produziert das Quellobjekt im Datenfluss eine Zeile pro Datei und enthält eine Referenz zu jeder Datei, um auf ihren Inhalt zuzugreifen. Im Datenfluss können Sie eine Textdatenverarbeitungs-Transformation, wie z.B. Entity Extraction zum Verarbeiten von unstrukturierem Text oder eine andere Transformation zum Bearbeiten der Daten verwenden. Unstruktierte Dateiformattypen sind: Tabelle 52: Unstrukturierte Dateiformattypen Beschreibung Unstrukturierter Text Verwenden Sie dieses Format, um ein Verzeichnis mit textbasierten Dateien zu ver arbeiten, einschließlich Folgendem: ● Text ● HTML ● XML Data Services speichert den Inhalt der Datei unter Verwendung des Datentyps LONG. 142 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Dateiformate Unstrukturierte Dateiformattypen Beschreibung Unstrukturiert binär Verwenden Sie dieses Format, um Binärdokumente zu lesen. Data Services spei chert den Inhalt der Datei unter Verwendung des Datentyps BLOB. ● ● Sie können eine Vielzahl von Dokumentformaten verarbeiten, indem Sie die Eingabe aus verschiedenen Dateien mit Binärformat abrufen und diesen BLOB-Datentyp dann an die Text-Data-Processing-Transformation übergeben. Auf diese Art und Weise werden die folgenden Formate akzeptiert: ○ Microsoft Word: 2003, 2007 und 2010 (Office Open XML) ○ Microsoft PowerPoint: 2003, 2007 und 2010 ○ Microsoft Excel: 2003, 2007 und 2010 ○ Adobe PDF: 1.3 – 1.7 ○ Microsoft RTF: 1.8 und 1.9.1 ○ Microsoft-Outlook-E-Mail-Nachricht: 2003, 2007, 2010 ○ Generische E-Mail-Nachricht: “.eml-Dateien ○ OpenDocument Text, Spreadsheet und Presentation: 1.0, 1.1, 1.2 ○ Corel WordPerfect: 6.0 (1993) – X5 (2010) Sie können auch das unstrukturierte Binärdateiformat verwenden, um ein Ver zeichnis mit Grafikdateien auf dem Datenträger in eine Datenbanktabelle zu verschieben. Angenommen, Sie möchten Mitarbeiterfotos mit den entsprech enden in einer Datenbank enthaltenen Mitarbeiterdaten verknüpfen. Der Da tenfluss würde die unstrukturierte Binärdateiformat-Quelle, eine Query-Trans formation, die das Mitarbeiterfoto z.B. über die Mitarbeiter-ID mit den Mitar beiterdaten verknüpft sowie die Datenbank-Zieltabelle enthalten. Weitere Informationen Referenzhandbuch: Objekte, Dateiformat Textdatenverarbeitung – Übersicht [Seite 193] Anlegen von Dateiformaten [Seite 115] Designer-Handbuch Dateiformate PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 143 7 Dateispeicherorte Eine Reihe von Eigenschaften, die bestimmte Dateiübertragungsprotokolle mit dem Speicherort von RemoteServer und lokalem Server für die Dateiübertragung beschreibt. Dateispeicherorte sind wiederverwendbare First-Class-Objekte, die bestimmte Dateiübertragungsprotokolle (z.B. FTP, SFTP) zwischen einem Remote-Server und einem lokalen Server definieren, für die Sie (als Benutzer) eine Zugriffsberechtigung haben. Dateispeicherortobjekte werden unter Dateispeicherorte auf dem Tab Format der Data-Services-Designer-Objektbibliothek gespeichert. Sie müssen ein Dateispeicherortobjekt mit einem bestimmten Dateiformat verknüpfen, um es in einem Datenfluss als Quelle oder Ziel zu verwenden. Mit dem Dateiformat wird das Format einer Datendatei definiert. Wenn Sie ein Dateiformat mit einem Dateispeicherortobjekt verknüpfen (Dateiformat-/Dateispeicherort-Objektpaar), werden die Informationen zum Remote-Server und lokalen Server sowie die Dateiübertragungsprotokolle aus dem Dateispeicherortobjekt verwendet, um eine Kopie der Datendatei zwischen einem Remote-Server und einem lokalen Server zu verschieben. Die Dateiübertragungsrichtung vom Remote-Server zum lokalen Server basiert darauf, ob das Dateiformat-/Dateispeicherortobjekt als Quelle oder Ziel in einem Datenfluss verwendet wird: ● Quelle: Die Datendatei wird vom Remote-Server zum lokalen Server kopiert. ● Ziel: Die Ausgabedatendatei wird vom lokalen Server zum Remote-Server kopiert. Anwendbare Dateiformate sind u.a. Flatfiles, verschachtelte Schemadateien (DTD, JSON, XML), COBOL Copybooks und Excel-Arbeitsmappen. Hinweis Excel-Arbeitsmappen und COBOL Copybooks können nur als Quellen in einem Datenfluss verwendet werden. Weitere Informationen Referenzhandbuch: Objekte, Beschreibung von Objekten, Dateispeicherorte Referenzhandbuch: Objekte, Beschreibung von Objekten, Dateiformate 7.1 Anlegen von neuen Dateispeicherortobjekten Schritte zum Anlegen von neuen Dateispeicherortobjekten. 1. Klicken Sie mit der rechten Maustaste auf den Ordner Dateispeicherorte auf dem Tab Formate der Objektbibliothek, und wählen Sie Neu. 2. Geben Sie einen Namen für das neue Objekt im Dialogfenster Neuen Dateispeicherort anlegen an. 3. Wählen Sie im Drop-Down-Menü Protokoll ein Protokoll aus. Der Standardwert ist „Lokal“. 144 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Dateispeicherorte Über die Protokoll-Optionseinstellung werden die restlichen Optionen bestimmt, die Ihnen zum Ausfüllen angezeigt werden. 4. Füllen Sie die restlichen Optionen aus, und klicken Sie auf OK. Beschreibungen für alle Dateispeicherortobjekt-Optionen finden Sie im Referenzhandbuch. Weitere Informationen Referenzhandbuch: Objekte, Beschreibung von Objekten, Dateispeicherorte, Dateispeicherortobjekt-Optionen 7.2 Mehrere Konfigurationen eines Dateispeicherortobjekts anlegen Legen Sie mehrere Dateispeicherortobjekt-Konfigurationen für alle Arten von Dateiübertragungsprotokollen an, die Sie verwenden. Durch die Erstellung mehrerer Dateispeicherortobjekt-Konfigurationen können Sie separate Dateiübertragungsprotokoll-Methoden konsolidieren, sodass Sie auf Basis der Umgebung, in der Sie arbeiten, einfach zwischen den Protokollen wechseln können. Beispielsweise verwenden Sie in Ihrer Testumgebung ein lokales Protokoll, weil die Tests intern durchgeführt werden. Wenn Sie zur Produktion migrieren, wechseln Sie jedoch zu SFTP, sodass Sie Ihre Dateien sicher zwischen einem Remote-Server und einem lokalen Server übertragen können. Sie können die Konfigurationen wechseln, indem Sie die Standardkonfiguration im Dateispeicherortobjekt ändern, ohne das Projekt für Änderungen zu öffnen. Die Erstellung mehrerer Dateispeicherortobjekt-Konfigurationen ähnelt der Erstellung mehrerer DatastoreKonfigurationen. Unter Datastores [Seite 66] finden Sie weitere Informationen zu Datastores. 7.2.1 Anlegen mehrerer DateispeicherortObjektkonfigurationen Schritte zum Anlegen zusätzlicher Konfigurationen in einem vorhandenen Dateispeicherortobjekt. Jedes Dateispeicherortobjekt hat mindestens eine Konfiguration. Falls nur eine Konfiguration vorhanden ist, ist dies die Standardkonfiguration. Wenn Sie mehrere Konfigurationen haben, können Sie die Standardkonfiguration auf eine der anderen Konfigurationen im Objekt ändern, indem Sie Ja für die Option Standardkonfiguration wählen. 1. Klicken Sie mit der rechten Maustaste auf den Namen eines Dateispeicherortobjekts unter Dateispeicherorte auf dem Tab Format in der Objektbibliothek, und wählen Sie Bearbeiten. Das Dialogfenster Dateispeicherort <Dateiname> bearbeiten wird geöffnet. 2. Klicken Sie auf Bearbeiten. Das Dialogfenster Konfigurationen für Dateispeicherort <Dateiname> wird geöffnet. Designer-Handbuch Dateispeicherorte PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 145 3. Klicken Sie auf das Symbol zum Anlegen einer neuen Konfiguration ( ). 4. Geben Sie einen eindeutigen Namen für die Konfiguration ein, und klicken Sie auf OK. Es wird eine neue Spalte „Konfigurationen“ mit dem neuen Namen als Überschrift angezeigt. 5. Wählen Sie im Drop-Down-Menü Protokoll ein Protokoll aus. Die restlichen Optionen, die nach der Option Protokoll angezeigt werden, basieren auf dem von Ihnen ausgewählten Protokolltyp. Wenn Sie jedoch mehrere Konfigurationen (mehrere Spalten mit Einstellungen) haben, sind möglicherweise Optionen aufgelistet, die nicht für das Protokoll gelten, das Sie definieren. Optionen, die nicht für eine Konfiguration gelten, werden in der Spalte als „Nicht verfügbar“ aufgeführt. 6. Füllen Sie die restlichen Optionen aus, und klicken Sie auf OK. Beschreibungen zu den Optionen finden Sie im Referenzhandbuch. Weitere Informationen Referenzhandbuch: Objekte, Beschreibung von Objekten, Dateispeicherorte, Dateispeicherortobjekt-Optionen 7.3 Zuordnen von Dateispeicherortobjekten zu Dateiformaten Um die Dateiübertragungsprotokoll-Informationen zu verwenden, die Sie in einem Dateispeicherortobjekt angelegt haben, ordnen Sie das Dateispeicherortobjekt einem bestimmten Dateiformat zu und schließen dann das Dateiformat-/Dateispeicherort-Paar in einen Datenfluss als Quelle oder Ziel ein. Die folgende Tabelle bietet einen Überblick darüber, wie ein bestimmtes Dateispeicherortobjekt einem Dateiformattyp zugeordnet wird. Umfassende Anweisungen für den jeweiligen Dateiformattyp finden Sie im Abschnitt „Dateispeicherorte“ des Designer-Handbuchs. Tabelle 53: Dateiformattyp Dateispeicherortobjekt zuordnen Flatfile Legen Sie ein neues Flatfile-Format an oder bearbeiten Sie ein Flatfile-Format, und fügen Sie die Informationen des Datei speicherortobjekts im Abschnitt Datendateien des Dateiformateditors hinzu. DTD-, XML- oder JSON-Schemadatei Bearbeiten Sie eine Schemadatei, und fügen Sie die Informati onen des Dateispeicherortobjekts auf dem Tab Format des Formateditors hinzu. COBOL Copybook Bearbeiten Sie ein vorhandenes COBOL Copybook, und geben Sie die Dateispeicherortinformationen auf dem Tab Datendatei des Dialogfensters COBOLCopybook bearbeiten ein. 146 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Dateispeicherorte Dateiformattyp Dateispeicherortobjekt zuordnen Excel-Arbeitsmappe Bearbeiten Sie eine vorhandene Excel-Arbeitsmappe, und ge ben Sie die Dateispeicherortinformationen auf dem Tab Format des Dialogfensters Excel-Arbeitsmappe importieren ein. 7.3.1 Zuordnen von Flatfiles zum Dateispeicherortobjekt Schritte zum Zuordnen einer neuen oder vorhandenen Flatfile-Formatdatei zu einem Dateispeicherortobjekt. 1. Führen Sie einen der nachfolgenden Unterschritte aus, je nachdem, ob Sie ein neues Flatfile-Format anlegen oder ein vorhandenes bearbeiten: a. Klicken Sie mit der rechten Maustaste auf die Gruppe Flatfiles auf dem Tab Formate der Objektbibliothek, und wählen Sie Neu. b. Klicken Sie mit der rechten Maustaste auf das entsprechende vorhandene Flatfile-Format, und wählen Sie Bearbeiten. 2. Füllen Sie die folgenden Optionen im Abschnitt Datendateien aus: ○ Dateispeicherort ○ Datei nach Übertragung löschen ○ Dateiname 3. Bearbeiten oder füllen Sie die restlichen Optionen im Dateiformateditor nach Bedarf aus, und klicken Sie auf Speichern und Schließen. Beschreibungen der Optionen finden Sie im Referenzhandbuch. Weitere Informationen Referenzhandbuch, Objekte, Beschreibung von Objekten, Dateispeicherorte, Dateispeicherortobjekt-Optionen 7.3.2 Zuordnen von DTD-, JSON- und XML-Schemadateien Schritte zum Zuordnen einer neuen oder vorhandenen Schemadatei zu einem Dateispeicherortobjekt. 1. Klicken Sie mit der rechten Maustaste auf die Gruppe Verschachtelte Schemas auf dem Tab Format der Objektbibliothek. 2. Wählen Sie Neu, und wählen Sie nach Bedarf eine der folgenden Optionen: ○ DTD ○ XML-Schema ○ JSON Designer-Handbuch Dateispeicherorte PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 147 3. Füllen Sie für DTD- und XML-Schemas die Optionen im Dialogfenster <Typ>-Format importieren aus, und klicken Sie auf OK. Füllen Sie für JSON-Schemas die Option im Dialogfenster JSON-Format importieren aus, und klicken Sie auf OK. 4. Klicken Sie in der Objektbibliothek unter Verschachtelte Schemas mit der rechten Maustaste auf den Namen der neuen, soeben angelegten Schemadatei, und wählen Sie Bearbeiten. 5. Öffnen Sie den Tab Format, und füllen Sie die folgenden Optionen aus: ○ Dateispeicherort ○ Datei nach Übertragung löschen ○ Dateiname Beschreibungen der Optionen finden Sie im Referenzhandbuch. Weitere Informationen Referenzhandbuch, Objekte, Beschreibung von Objekten, Dateispeicherorte, Dateispeicherortobjekt-Optionen 7.3.3 Zuordnen von COBOL Copybooks zu einem Dateispeicherortobjekt Schritte zum Zuordnen einer COBOL-Copybook-Datei zu einem Dateispeicherortobjekt. 1. Klicken Sie unter COBOL Copybooks auf dem Tab Formate der Objektbibliothek mit der rechten Maustaste auf eine COBOL-Copybook-Datei. 2. Öffnen Sie den Tab Datendatei des Dialogfensters COBOLCopybook bearbeiten. Hinweis Wenn Sie ein neues Dateiformat anlegen, lautet der Dialogfenstername COBOLCopybook importieren. 3. Füllen Sie folgende Optionen aus: ○ Dateispeicherort ○ Datei nach Übertragung löschen ○ Dateiname 4. Füllen Sie die restlichen Optionen aus, je nachdem, ob Sie eine neue COBOL-Copybook-Datei anlegen oder eine vorhandene bearbeiten. Beschreibungen zu den Optionen finden Sie im Referenzhandbuch. Hinweis Ein COBOL-Copybook-Dateiformat kann nur als eine Quelle in einem Datenfluss verwendet werden. 148 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Dateispeicherorte Weitere Informationen Referenzhandbuch, Objekte, Beschreibung von Objekten, Dateispeicherorte, Dateispeicherortobjekt-Optionen 7.3.4 Zuordnen von Excel-Arbeitsmappen zu einem Dateispeicherortobjekt Schritte zum Zuordnen einer Excel-Arbeitsmappe zu einem Dateispeicherortobjekt. 1. Klicken Sie unter Excel-Arbeitsmappen auf dem Tab Formate der Objektbibliothek mit der rechten Maustaste auf eine Excel-Arbeitsmappendatei. 2. Füllen Sie die folgenden Optionen auf dem Tab Format des Dialogfensters Excel-Arbeitsmappe importieren aus: ○ Dateispeicherort ○ Datei nach Übertragung löschen ○ Dateiname 3. Füllen Sie die restlichen Optionen aus, je nachdem, ob Sie eine neue Excel-Arbeitsmappendatei anlegen oder eine vorhandene bearbeiten. Beschreibungen zu den Optionen finden Sie im Referenzhandbuch. Hinweis Excel-Arbeitsmappendatei-Formate können nur als eine Quelle in einem Datenfluss verwendet werden. Weitere Informationen Referenzhandbuch, Objekte, Beschreibung von Objekten, Dateispeicherorte, Dateispeicherortobjekt-Optionen 7.4 Hinzufügen eines Dateiformat-/Dateispeicherortobjekts zu einem Datenfluss Schritte zum Hinzufügen eines Dateiformatobjekts zu einem Datenfluss als Quelle oder Ziel. Sie können diese Schritte mit einem Dateiformatobjekt ausführen, das ein zugeordnetes Dateispeicherortobjekt aufweist oder nicht. Wenn das Dateiformat kein zugeordnetes Dateispeicherortobjekt hat, können Sie die Zuordnung bei der Ausführung der nachfolgenden Schritte hinzufügen. 1. Ziehen Sie das betreffende Dateiformatobjekt in einen Datenfluss. Klappen Sie beispielsweise Verschachtelte Schemas auf dem Tab Format auf, und ziehen Sie eine vorhandene Formatdatei auf das DatenflussArbeitsblatt. Designer-Handbuch Dateispeicherorte PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 149 2. Wählen Sie nach Bedarf im Popup-Dialogfenster Als Quelle verwenden oder Als Ziel verwenden. 3. Fahren Sie nach Bedarf mit der Datenflusseinrichtung fort. Unter Definieren eines neuen Datenflusses mit der Objektbibliothek [Seite 156] finden Sie die Schritte zur Definition des Datenflusses. 4. Wenn Sie dem Dateiformat noch kein Dateispeicherortobjekt zugeordnet haben oder wenn Sie das vorhandene Dateispeicherortobjekt, das dem Dateiformat zugeordnet ist, bearbeiten möchten, öffnen Sie das Quell- oder Zieldateiformat im Datenfluss. Das Fenster Quelldateieditor oder Zieldateieditor wird geöffnet. 5. Wählen Sie im Drop-Down-Menü Speicherort ein Dateispeicherortobjekt aus. 6. Wählen Sie für Datei löschen „Ja“ oder „Nein“. Wenn Sie „Ja“ wählen, wird die Datei auf dem lokalen Server gelöscht, nachdem sie als eine Quelle verarbeitet wurde, oder sie wird auf dem lokalen Server gelöscht, nachdem sie aus dem Datenfluss ausgegeben und an den Remote-Server übertragen wurde. 7. Schließen Sie das Fenster Quelldateieditor oder Zieldateieditor. Weitere Informationen Anlegen und Definieren von Datenflüssen [Seite 156] 7.5 Verwenden von Skripten zum Verschieben von Dateien von oder zu einem Remote-Server Beispiele für die Verwendung integrierter Dateispeicherortobjekt-Funktionen in Skripten in einem Workflow. Verwenden Sie die zwei integrierten Funktionen copy_from_remote_server und copy_to_remote_server in Datenflussskripten, um ein Dateispeicherortobjekt und eine Datendatei zu identifizieren, anstatt eine Dateiformat-/Dateispeicherortobjekt-Kombination zu verwenden. Die Skripte identifizieren das Dateispeicherortobjekt, das Ihre Dateiübertragungsprotokoll-Einstellungen enthält, die Software verwendet also Ihr Protokoll zum Kopieren von Dateien aus und auf den Remote-Server. Sie können auch einen Dateinamen mit Platzhalterzeichen (* und ?) eingeben, um eine Gruppe von Dateien zu verschieben, die den Platzhalterkriterien entsprechen. Beispiel Tabelle 54: Skriptdateibeispiele Funktion Beispielcode Ergebnis Herunterladen von Dateien vom Remote-Server, die den Platzhalterkriterien im Dateinamen entsprechen. copy_from_remote_system('FTP_Datasto re', '*.txt'); 150 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Dateispeicherorte Funktion Beispielcode Ergebnis Herunterladen einer einzelnen Datei vom Remote-Server. copy_from_remote_system('FTP_Datasto re', 'mydata.txt'); Beispielcode Hochladen einer einzelnen Datei auf den Remote-Server. copy_to_remote_system('FTP_Datastore ', 'myremotedata.txt'); Beispielcode Hochladen von Dateien auf den Remote-Server, die den Platzhalterkriterien im Dateinamen entsprechen. copy_to_remote_system('FTP_Datastore ', '*.txt'); Weitere Informationen Referenzhandbuch: Funktionen und Prozeduren, Beschreibungen von integrierten Funktionen Designer-Handbuch Dateispeicherorte PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 151 8 Datenflüsse Beschreibt die Grundlagen von Datenflüssen, die Datenflussobjekte enthalten, anhand von Lookups, Datenflussausführung und Audits. 8.1 Was ist ein Datenfluss? In Datenflüssen werden Daten extrahiert, transformiert und geladen. Alles in Zusammenhang mit Daten, einschließlich das Lesen von Quellen, Transformieren von Daten und Laden von Zielen, findet in einem Datenfluss statt. Die Linien, die Objekte in einem Datenfluss verbinden, stellen den Fluss der Daten durch Datentransformationsschritte dar. Nachdem Sie einen Datenfluss definiert haben, können Sie ihn einem Job oder Workflow hinzufügen. Innerhalb eines Workflows kann ein Datenfluss Informationen an andere Objekte über Eingabe- und Ausgabeparameter senden und von diesen empfangen. 8.1.1 Benennen von Datenflüssen Datenflussnamen können alphanumerische Zeichen und Unterstriche (_) enthalten. Sie dürfen keine Leerzeichen enthalten. 8.1.2 Datenflussbeispiel Angenommen, Sie möchten die Faktentabelle in Ihrem Data-Warehouse mit neuen Daten aus zwei Tabellen in Ihrer Quellvorgangsdatenbank füllen. Ihr Datenfluss besteht aus folgenden Elementen: ● zwei Quelltabellen 152 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenflüsse ● einem Join zwischen diesen Tabellen, definiert in einer Query-Transformation ● einer Zieltabelle, in der die neuen Zeilen abgelegt werden Sie geben den Fluss der Daten durch diese Komponenten an, indem Sie sie in der Reihenfolge miteinander verbinden, in der die Bewegung der Daten erfolgt. Der daraus resultierende Datenfluss sieht folgendermaßen aus: 8.1.3 Schritte in einem Datenfluss Jedes Symbol, das Sie in einem Datenflussdiagramm platzieren, bildet einen Schritt im Datenfluss. Sie können die folgenden Objekte als Schritte in einem Datenfluss verwenden: ● Quelle ● Ziel ● Transformationen Die Verbindungen, die Sie zwischen den Symbolen herstellen, bestimmen die Reihenfolge, in der die Software die Schritte ausführt. Weitere Informationen Quell- und Zielobjekte [Seite 158] Transformationen [Seite 177] 8.1.4 Datenflüsse als Schritte in Workflows Datenflüsse sind geschlossene Operationen, obwohl es sich dabei um Schritte in einem Workflow handelt. Datasets, die in einem Datenfluss angelegt wurden, stehen in anderen Workflowschritten nicht zur Verfügung. Ein Workflow arbeitet nicht mit Datasets und kann einem Datenfluss keine weiteren Daten bereitstellen. Ein Workflow hat vielmehr folgende Funktionen: ● Aufrufen von Datenflüssen zur Durchführung von Datenverschiebungsoperationen Designer-Handbuch Datenflüsse PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 153 ● Definieren der zur Ausführung von Datenflüssen erforderlichen Bedingungen ● Austauschen von Parametern mit Datenflüssen 8.1.5 Zwischen-Datasets in einem Datenfluss Jeder Schritt in einem Datenfluss – bis hin zur Zieldefinition – erzeugt ein Zwischenergebnis (beispielsweise die Ergebnisse einer SLQ-Anweisung, die eine WHERE-Klausel enthalten), das in den nächsten Schritt des Datenflusses einfließt. Das Zwischenergebnis besteht aus einem Satz von Zeilen aus der vorherigen Operation und dem Schema, in dem die Zeilen angeordnet sind. Dieses Ergebnis wird als "Dataset" bezeichnet. Dieses Dataset kann wiederum weiter "gefiltert" und in ein weiteres Dataset angeordnet werden. 8.1.6 Operationscodes Jede Zeile in einem Dataset ist mit einem Operationscode gekennzeichnet, der den Status der Zeile identifiziert. Es gibt folgende Operationscodes: Tabelle 55: Operationscode Beschreibung NORMAL Legt eine neue Zeile im Ziel an. Alle Zeilen in einem Dataset werden als NORMAL gekennzeichnet, wenn sie von einer Quelle extrahiert werden. Wenn eine Zeile beim Laden in ein Ziel als NORMAL gekennzeichnet wird, wird sie als eine neue Zeile in das Ziel eingefügt. 154 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenflüsse Operationscode Beschreibung INSERT Legt eine neue Zeile im Ziel an. Zeilen können von Transformationen im Datenfluss als INSERT gekennzeichnet werden, um anzuzeigen, dass in einem Dataset im Vergleich zu einem früheren Image des gleichen Data sets eine Änderung aufgetreten ist. Die Änderung wird im Ziel getrennt von den vorhandenen Daten aufgezeichnet. DELETE Wird vom Ziel ignoriert. Als DELETE gekennzeichnete Ziele werden nicht geladen. Zeilen können nur von der Map_Operation-Transformation als DELETE gekennzeichnet wer den. UPDATE Überschreibt eine vorhandene Zeile im Ziel. Zeilen können von Transformationen im Datenfluss als UPDATE gekennzeichnet werden, um anzuzeigen, dass in einem Dataset im Vergleich zu einem früheren Image des gleichen Data sets eine Änderung aufgetreten ist. Die Änderung wird im Ziel in der gleichen Zeile wie die vor handenen Daten aufgezeichnet. 8.1.7 Übergeben von Parametern an Datenflüsse Daten fließen nicht außerhalb eines Datenflusses, nicht einmal, wenn Sie einem Workflow einen Datenfluss hinzufügen. Sie können Parameter jedoch zwischen Datenflüssen übergeben. Parameter werten einzelne Werte aus und keine Wertesätze. Wenn ein Datenfluss Parameter erhält, können die Schritte im Datenfluss diese Parameter als eine Variable referenzieren. Durch die Verwendung von Parametern werden Datenflussdefinitionen flexibler gestaltet. Ein Parameter kann beispielsweise angeben, wann eine Faktentabelle zum letzten Mal aktualisiert wurde. Sie können diesen Wert in einem Datenfluss verwenden, um nur die seit der letzten Aktualisierung geänderten Zeilen zu extrahieren. Die folgende Abbildung zeigt den Parameter last_update, der in einer Abfrage verwendet wird, um das zum Laden der Faktentabelle verwendete Dataset zu bestimmen. Weitere Informationen Variablen und Parameter [Seite 287] Designer-Handbuch Datenflüsse PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 155 8.2 Anlegen und Definieren von Datenflüssen Sie können Datenflüsse mithilfe von Objekten aus der Objektbibliothek oder mithilfe der Toolpalette anlegen. Nach dem Anlegen eines Datenflusses können seine Eigenschaften geändert werden. Weitere Informationen Ändern der Eigenschaften eines Datenflusses [Seite 156] 8.2.1 Definieren eines neuen Datenflusses mit der Objektbibliothek 1. Wechseln Sie in der Objektbibliothek zum Tab Datenflüsse. 2. Wählen Sie die Datenflusskategorie aus, klicken Sie mit der rechten Maustaste, und wählen Sie Neu aus. 3. Wählen Sie den neuen Datenfluss aus. 4. Ziehen Sie den Datenfluss in den Arbeitsbereich für einen Job oder Workflow. 5. Fügen Sie die benötigten Quellen, Transformationen und Ziele hinzu. 8.2.2 Definieren eines neuen Datenflusses mit der Symbolleiste 1. Klicken Sie auf das Datenflusssymbol in der Symbolleiste. 2. Klicken Sie auf den Arbeitsbereich für einen Job oder Workflow, um den Datenfluss zu platzieren. Sie können Datenflüsse für Batch- und Echtzeitjobs hinzufügen. Wenn Sie ein Datenflusssymbol auf einen Job ziehen, weisen Sie die Software an, diese Objekte gemäß den Anforderungen des Jobtyps (Batch- oder Echtzeitjob) zu validieren. 3. Fügen Sie die benötigten Quellen, Transformationen und Ziele hinzu. 8.2.3 Ändern der Eigenschaften eines Datenflusses Nach dem Anlegen eines Datenflusses können seine Eigenschaften geändert werden. 1. Klicken Sie mit der rechten Maustaste auf den Datenfluss, und wählen Sie Eigenschaften aus. Das Fenster Eigenschaften für den Datenfluss wird geöffnet. 2. Ändern Sie die gewünschten Eigenschaften für den Datenfluss. 156 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenflüsse 3. Klicken Sie auf OK. In dieser Tabelle werden die verschiedenen Eigenschaften beschrieben, die für den Datenfluss festgelegt werden können. Tabelle 56: Option Beschreibung Nur einmal ausführen Wenn Sie angeben, dass ein Datenfluss nur einmal ausgeführt werden soll, führt ein Batch-Job diesen Datenfluss nach erfolgreicher Fertigstellung nicht nochmals aus, es sei denn, der Datenfluss ist in einem Workflow enthalten, bei dem es sich um eine Wiederherstellungseinheit handelt, die erneut ausgeführt wird und die noch nicht an anderer Stelle außerhalb der Wiederherstellungseinheit erfolgreich abgeschlossen wurde. Es wird empfohlen, einen Datenfluss nicht mit "Nur einmal ausführen" zu kennzeichnen, wenn es sich bei einem übergeordneten Workflow um eine Wieder herstellungseinheit handelt. Datenbankverknüpfungen verwenden Datenbankverknüpfungen sind Kommunikationswege zwischen Datenbankservern. Mit Datenbankverknüpfungen können lokale Benutzer auf Daten in einer RemoteDatenbank zugreifen, die sich auf dem lokalen oder auf einem Remote-Rechner des selben oder eines anderen Datenbanktyps befinden kann. Parallelitätsgrad Der Parallelitätsgrad ist eine Eigenschaft eines Datenflusses, der definiert, wie oft jede Transformation innerhalb eines Datenflusses repliziert wird, um einen paralle len Datenteilsatz zu verarbeiten. Cachetyp Sie können Daten zwischenspeichern, um die Leistung von Operationen wie Ver knüpfungen, Gruppierungen, Sortierungen, Filterungen, Lookups und Tabellenver gleichen zu verbessern. Im Fenster "Eigenschaften" des Datenflusses können Sie ei nen der folgenden Werte für die Option "Cachetyp" auswählen: Überspringen ○ Speicherresident: Wählen Sie diesen Wert aus, wenn Ihr Datenfluss eine kleine Menge an Daten verarbeitet, die in den verfügbaren Speicher passt. ○ Auslagerbar: Dies ist der Standardwert. Sie können die Ausführung eines Datenflusses während der Entwurfszeit übersprin gen. Diese Option ist nur auf Ebene des Datenflussaufrufs verfügbar (beispiels weise, wenn sich der Datenfluss im Designer-Arbeitsbereich befindet). Einschränkung Sie müssen Überspringen-Ersatzparameter zur Verwendung mit der Option Überspringen anlegen. Beispiel: Sie können im Fenster Editor für Ersetzungsparameter $$BYPASSEnable mit dem Wert "Ja" und $$BYPASSDi sable mit dem Wert "Nein" anlegen (oder mit jedem anderen Wert außer "Ja"). Sobald Sie den Job entworfen haben, können Sie das Überspringen deaktivieren, bevor Sie in den Produktionsmodus wechseln. Ausführlichere Informationen finden Sie unter Überspringen bestimmter Workflows und Datenflüsse [Seite 647] Weitere Informationen Hinzufügen und Definieren von Ersatzparametern [Seite 306] Performance Optimization Guide: Maximizing Push-Down Operations, Database link and linked remote server support for push-down operations across datastores Designer-Handbuch Datenflüsse PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 157 Performance Optimization Guide: Using parallel Execution, Degree of parallelism Performance Optimization Guide: Using Caches Referenzhandbuch: Objekte, Datenfluss 8.3 Quell- und Zielobjekte Ein Datenfluss liest und lädt Daten direkt mithilfe von Quell- und Zielobjekten. Quellobjekte definieren Quellen, aus denen Sie Daten lesen. Zielobjekte definieren Ziele, in die Sie Daten schreiben (oder laden). Weitere Informationen Quellobjekte [Seite 158] Zielobjekte [Seite 159] 8.3.1 Quellobjekte Quellobjekte enthalten die Daten, die vom Datenfluss zur Bearbeitung gelesen werden sollen. Tabelle 57: Quellobjekt Beschreibung Softwarezugriff Tabelle Eine mit Spalten und Zeilen formatierte Datei, wie sie in relationalen Daten banken verwendet wird. Direkt oder über Adap ter Vorlagentabelle Eine Vorlagentabelle, die in einem anderen Datenfluss angelegt und gespei Direkt chert wurde (wird in Entwicklung verwendet). Datei Ein Flatfile mit Trennzeichen oder fester Breite. Direkt Dokument Eine Datei mit einem anwendungsspezifischen Format (kann vom SQLoder XML-Parser nicht gelesen werden). Über Adapter JSON-Datei Eine mit JSON-Daten formatierte Datei. Direkt JSON-Meldung Wird als Quelle in Echtzeitjobs verwendet. Direkt XML-Datei Eine mit XML-Tags formatierte Datei. Direkt XML-Meldung Wird als Quelle in Echtzeitjobs verwendet. Direkt Sie können auch IDoc-Meldungen als Echtzeitquellen für SAP-Anwendungen verwenden. 158 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenflüsse Weitere Informationen Vorlagentabellen [Seite 161] Echtzeitquell- und -zielobjekte [Seite 267] Supplement for SAP: IDoc sources in real-time jobs 8.3.2 Zielobjekte Zielobjekte empfangen die verarbeiteten Daten, die aus dem Datenfluss geladen werden. Tabelle 58: Zielobjekt Beschreibung Softwarezugriff Dokument Eine Datei mit einem anwendungsspezifischen Format (kann vom SQLoder XML-Parser nicht gelesen werden). Über Adapter Datei Ein Flatfile mit Trennzeichen oder fester Breite. Direkt JSON-Datei Eine im JSON-Format formatierte Datei. Direkt JSON-Meldung Siehe Echtzeitquell- und -zielobjekte [Seite 267]. Verschachtelte Vorla gendatei Eine JSON- oder XML-Datei, deren Format auf der Ausgabe der vorherigen Transformation basiert (wird bei der Entwicklung hauptsächlich zum De buggen von Datenflüssen verwendet). Ausgehende Meldung Siehe Echtzeitquell- und -zielobjekte [Seite 267]. Tabelle Eine mit Spalten und Zeilen formatierte Datei, wie sie in relationalen Daten banken verwendet wird. Direkt oder über Adap ter Vorlagentabelle Eine Tabelle, deren Format auf der Ausgabe der vorherigen Transforma tion basiert (wird in der Entwicklung verwendet). Direkt XML-Datei Eine mit XML-Tags formatierte Datei. Direkt XML-Meldung Siehe Echtzeitquell- und -zielobjekte [Seite 267]. Direkt Sie können auch IDoc-Meldungen als Echtzeitquellen für SAP-Anwendungen verwenden. Weitere Informationen Ergänzungsdokument für SAP: IDoc-Ziele in Echtzeitjobs 8.3.3 Hinzufügen von Quell- oder Zielobjekten zu Datenflüssen Vor der Verwendung eines Quell- oder Zielobjekts in einem Datenfluss müssen die folgenden Voraussetzungen erfüllt sein: Designer-Handbuch Datenflüsse PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 159 Tabelle 59: Objekt Voraussetzung Tabellen, auf die direkt von einer Datenbank zugegriffen wird Definieren Sie einen Datenbank-Datastore, und importieren Sie die Metadaten der Tabelle. Vorlagentabellen Definieren Sie einen Datenbank-Datastore. Dateien Definieren Sie ein Dateiformat, und importieren Sie die Datei. XML-Dateien und -Meldungen Importieren Sie ein XML-Dateiformat. Objekte, auf die über einen Adapter zugegriffen wird Definieren Sie einen Adapter-Datastore, und importieren Sie Objektmetadaten. 1. Öffnen Sie den Datenfluss, in den Sie das Objekt setzen möchten. 2. Wenn die Objektbibliothek noch nicht geöffnet ist, wählen Sie Extras Objektbibliothek , um sie zu öffnen. 3. Wählen Sie den entsprechenden Tab der Objektbibliothek aus: Wählen Sie den Tab „Formate“ für Flatfiles, DTDs, JSNs oder XML-Schemas bzw. den Tab „Datastores“ für Datenbank- und Adapterobjekte. 4. Wählen Sie das Objekt, das Sie als Quelle oder Ziel hinzufügen möchten. (Klappen Sie zugeklappte Listen auf, indem Sie auf das Pluszeichen neben einem Containersymbol klicken.) Wählen Sie für eine neue Vorlagentabelle das Symbol „Vorlagentabelle“ in der Symbolleiste. Wählen Sie für eine neue JSON- oder XML-Vorlagendatei das Symbol „Vorlage für verschachtelte Schemas" in der Symbolleiste. 5. Legen Sie das Objekt im Arbeitsbereich ab. 6. Bei Objekten, bei denen es sich nach dem Loslassen der Maustaste entweder um Quellen oder Ziele handeln kann, wird ein Popup-Menü eingeblendet. Wählen Sie die anzulegende Objektart aus. Wenn Sie bei neuen Vorlagentabellen und XML-Vorlagendateien die Maustaste loslassen, wird ein zweites Fenster angezeigt. Geben Sie die angeforderten Informationen für das neue Vorlagenobjekt ein. Namen dürfen alphanumerische Zeichen und Unterstriche (_) enthalten. Vorlagentabellen dürfen nicht denselben Namen wie eine im Datastore vorhandene Tabelle haben. 7. Das Quell- oder Zielobjekt wird im Arbeitsbereich angezeigt. 8. Klicken Sie im Arbeitsbereich auf den Objektnamen Daraufhin wird der Editor für das Objekt geöffnet. Legen Sie die für das Objekt erforderlichen Optionen fest. Hinweis Achten Sie darauf, dass der Zugriff auf alle Dateien, die auf Flatfile-, DTD-, JSON- oder XML-Schemaformate Bezug nehmen, von dem Jobserver aus möglich ist, auf dem der Job ausgeführt wird. Geben Sie den Speicherort der Datei in Bezug auf diesen Rechner an. Weitere Informationen Datenbank-Datastores [Seite 67] 160 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenflüsse Vorlagentabellen [Seite 161] Dateiformate [Seite 112] Importieren eines DTD- oder XML-Schemaformats [Seite 235] Adapter-Datastores [Seite 90] Hinzufügen eines Dateiformat-/Dateispeicherortobjekts zu einem Datenfluss [Seite 149] 8.3.4 Vorlagentabellen Im Rahmen des anfänglichen Entwerfens einer Anwendung kann es praktisch sein, Datenbanktabellen mit Vorlagentabellen darzustellen. Mit Vorlagentabellen müssen Sie im Datenbankmanagementsystem nicht zuerst eine neue Tabelle anlegen und die Metadaten in die Software importieren. Stattdessen legt die Software die Tabelle automatisch in der Datenbank mit dem Schema an, das bei der Ausführung eines Jobs vom Datenfluss definiert wird. Nach der Anlage einer Vorlagentabelle als Ziel in einem Datenfluss können Sie diese als Quelle in anderen Datenflüssen verwenden. Eine Vorlagentabelle kann zwar als Quelltabelle in mehreren Datenflüssen verwendet werden, sie kann jedoch als Ziel nur in einem Datenfluss verwendet werden. Vorlagentabellen sind insbesondere während der frühen Entwicklung von Anwendungen hilfreich, wenn Sie ein Projekt entwerfen und testen. Wenn Sie die Datentransformationsoperation in dem Datenfluss ändern und speichern, in dem die Vorlagentabelle ein Ziel ist, ändert sich das Schema der Vorlagentabelle automatisch. Aktualisierungen am Schema werden automatisch auch an allen anderen Instanzen der Vorlagentabelle durchgeführt. Während des Validierungsprozesses weist Sie die Software auf alle Fehler hin, z.B. Fehler infolge der Änderung des Schemas. 8.3.4.1 Anlegen von Zielvorlagentabellen 1. Öffnen Sie das Fenster Vorlage anlegen mit einer der folgenden Methoden: ○ Über die Symbolleiste: ○ Klicken Sie auf das Vorlagentabellensymbol. ○ Klicken Sie innerhalb eines Datenflusses, um die Vorlagentabelle im Arbeitsbereich zu platzieren. ○ Wählen Sie im Fenster Vorlage anlegen einen Datastore. ○ Über die Objektbibliothek: ○ Klappen Sie einen Datastore auf. ○ Klicken Sie auf das Vorlagentabellensymbol, und ziehen Sie es in den Arbeitsbereich. ○ Über die Objektbibliothek: ○ Klappen Sie einen Datastore auf. ○ Klicken Sie auf das Vorlagentabellensymbol, und ziehen Sie es in den Arbeitsbereich. 2. Geben Sie im Fenster Vorlage anlegen einen Tabellennamen ein. 3. Klicken Sie auf OK. Daraufhin wird die Tabelle im Arbeitsbereich als Vorlagentabellensymbol angezeigt. Designer-Handbuch Datenflüsse PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 161 4. Verbinden Sie die Vorlagentabelle mit dem Datenfluss als Ziel (normalerweise eine Query-Transformation). 5. Ordnen Sie die Spalten "Eingabeschema", die Sie in die Zieltabelle aufnehmen möchten, in der QueryTransformation zu. 6. Wählen Sie aus dem Menü Projekt die Option Speichern aus. Im Arbeitsbereich ändert sich das Vorlagentabellensymbol in ein Zieltabellensymbol, und die Tabelle wird in der Objektbibliothek unter der Tabellenliste des Datastores angezeigt. Wenn Sie mit dem Entwurf des Datenflusses zufrieden sind, speichern Sie ihn. Bei der Ausführung des Jobs verwendet die Software die Vorlagentabelle zum Anlegen einer neuen Tabelle in der Datenbank, die Sie bei der Anlage der Vorlagentabelle angegeben haben. Wenn eine Vorlagentabelle in der Datenbank angelegt wird, können Sie die Vorlagentabelle im Repository in eine normale Tabelle konvertieren. 8.3.5 Konvertieren von Vorlagentabellen in reguläre Tabellen Um einige Funktionen wie etwa das Massenladen nutzen zu können, müssen die Vorlagentabellen in reguläre Tabellen konvertiert werden. Andere Funktionen wie etwa das Exportieren von Objekten stehen für Vorlagentabellen zur Verfügung. Hinweis Nachdem eine Vorlagentabelle konvertiert wurde, können Sie das Schema nicht mehr ändern. 8.3.5.1 Konvertieren der Vorlagentabellen in reguläre Tabellen in der Objektbibliothek 1. Öffnen Sie die Objektbibliothek, und navigieren Sie zum Tab Datastores. 2. Klicken Sie auf das Pluszeichen (+) neben dem Datastore, der die zu konvertierende Vorlagentabelle enthält. Es wird eine Liste der Objekte angezeigt. 3. Klicken Sie auf das Pluszeichen (+) neben Vorlagentabellen. Die Liste der Vorlagentabellen wird angezeigt. 4. Klicken Sie mit der rechten Maustaste auf die Vorlagentabelle, die Sie konvertieren möchten, und wählen Sie Tabelle importieren. Die Vorlagentabelle wird im Repository in eine reguläre Tabelle konvertiert, indem sie aus der Datenbank importiert wird. Um das Symbol in allen Datenflüssen zu aktualisieren, wählen Sie Sicht Aktualisieren . In der Datastore-Objektbibliothek wird die Tabelle nun unter "Tabellen" anstatt unter "Vorlagentabellen" aufgeführt. 162 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenflüsse 8.3.5.2 Konvertieren der Vorlagentabellen in reguläre Tabellen in einem Datenfluss 1. Öffnen Sie den Datenfluss, der die Vorlagentabelle enthält. 2. Klicken Sie mit der rechten Maustaste auf die Vorlagentabelle, die Sie konvertieren möchten, und wählen Sie Tabelle importieren. Nachdem die Vorlagentabelle in eine reguläre Tabelle konvertiert wurde, können Sie das Tabellenschema nicht mehr ändern. 8.4 Informationen über die Spaltenweitergabe Innerhalb eines Datenflusses können Sie mit dem Befehl Spalte weitergeben von eine vorhandene Spalte von einer vorgelagerten Quelle oder Transformation durch Zwischenobjekte zu einem ausgewählten Endpunkt hinzufügen. Spalten werden in jedem Objekt ohne Änderung des Datentyps oder anderer Attribute hinzugefügt. Wenn es zwischen dem Anfangs- und dem Endpunkt mehrere mögliche Pfade gibt, können Sie den Weg für die hinzugefügten Spalten angeben. Die Weitergabe von Spalten ist eine Pull-Through-Operation. Der Befehl Spalte weitergeben von wird von dem Objekt ausgegeben, das die Spalte benötigt. Die Spalte wird von der ausgewählten vorgelagerten Quelle oder Transformation abgerufen und jedem Zwischenobjekt sowie dem ausgewählten Endpunktobjekt hinzugefügt. Im Datenfluss unten enthält die Quelltabelle Employee beispielsweise Informationen über den Mitarbeiternamen sowie die Mitarbeiterkennung, Arbeitsplatzinformationen und Einstellungsdaten. Die Name_CleanseTransformation dient zum Standardisieren der Mitarbeiternamen. Schließlich werden die Daten in eine XML-Datei mit dem Namen Employee_Names ausgegeben. Nach der Anzeige der Ausgabe in der Tabelle Employee_Names stellen Sie fest, dass der Anfangsbuchstabe des zweiten Vornamens (Spalte minit) in der Ausgabe enthalten sein sollte. Sie klicken mit der rechten Maustaste auf das Schema der obersten Ebene in der Tabelle Employee_Names und wählen die Option Spalte weitergeben von. Daraufhin wird das Fenster Spalte an Employee_Names weitergeben angezeigt. Wählen Sie im linken Bereich des Fensters Spalte an Employee_Names weitergeben aus der Liste der Objekte die Quelltabelle Employee. Die Liste der im rechten Fensterbereich angezeigten Ausgabespalten ändert sich und enthält nun die Spalten im Schema des ausgewählten Objekts. Wählen Sie die Spalte MINIT als die Spalte aus, die Sie aus der Quelle abrufen möchten, und klicken Sie dann auf Weitergeben. Das Schema der Spalte minit wird durch die Query- und Name_Cleanse-Transformation bis zur Tabelle Employee_Names fortgesetzt. Weitergegebene Spalten weisen folgende Eigenschaften auf: Designer-Handbuch Datenflüsse PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 163 ● Der Befehl Spalte weitergeben von kann vom Schema der obersten Ebene einer Transformation oder eines Ziels ausgegeben werden. ● Spalten werden in jedem Objekt ohne Änderung des Datentyps oder anderer Attribute hinzugefügt. Wenn eine Spalte zum Schema eines Objekts hinzugefügt wird, funktioniert die Spalte genau so, als wäre sie manuell angelegt worden. ● Die weitergegebene Spalte wird am Ende der Schemaliste in jedem Objekt hinzugefügt. ● Der Name der Ausgabespalte wird automatisch generiert, um Namenskonflikte mit bestehenden Spalten zu vermeiden. Sie können den Spaltennamen ändern. ● Nur Spalten im Schema der obersten Ebene können weitergegeben werden. Spalten in verschachtelten Schemas können nicht weitergegeben werden. ● Eine Spalte kann mehrmals weitergegeben werden. Vorhandene Spalten werden im rechten Bereich des Fensters Spalte weitergeben an im Feld Ist bereits vorhanden in angezeigt. Jede weitere Spalte hat einen eindeutigen Namen. ● Mehrere Spalten können in derselben Operation ausgewählt und weitergegeben werden. Hinweis Sie können eine Spalte nicht über eine Hierarchy_Flattening- oder eine Table_Comparison-Transformation weitergeben. 8.4.1 Hinzufügen von Spalten in einem Datenfluss Sie können mithilfe des Weitergeben-Befehls eine Spalte aus einer vorgelagerten Quelle oder Transformation über Zwischenobjekte einem ausgewählten Endpunkt hinzufügen. Spalten werden in jedem Objekt ohne Änderung des Datentyps oder anderer Attribute hinzugefügt. So fügen Sie Spalten in einem Datenfluss hinzu: 1. Klicken Sie im nachgelagerten Objekt, wo Sie die Spalte (den Endpunkt) hinzufügen möchten, mit der rechten Maustaste auf das Schema der obersten Ebene, und klicken Sie dann auf Spalte weitergeben von. Der Befehl Spalte weitergeben von kann vom Schema der obersten Ebene einer Transformation oder eines Ziels ausgegeben werden. 2. Wählen Sie im linken Bereich des Fensters Spalte weitergeben an das vorgelagerte Objekt, das die zuzuordnende Spalte enthält. Die in diesem Objekt zur Verfügung stehenden Spalten werden im rechten Fensterbereich zusammen mit einer Liste vorhandener Zuordnungen von dieser Spalte angezeigt. 3. Wählen Sie im rechten Fensterbereich die Spalte aus, die Sie hinzufügen möchten, und klicken Sie entweder auf Weitergeben oder auf Weitergeben und schließen. Dann gibt es zwei Möglichkeiten: ○ Wenn es nur einen möglichen Weg gibt, wird die ausgewählte Spalte über die Zwischentransformationen zum nachgelagerten Objekt hinzugefügt. ○ Wenn es mehrere mögliche Wege durch die Zwischenobjekte gibt, wird das Dialogfenster Route wählen zu angezeigt. Dies kann geschehen, wenn der Datenfluss eine Query-Transformation mit mehreren Eingabeobjekten enthält. Wählen Sie den bevorzugten Pfad, und klicken Sie auf OK. 164 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenflüsse 8.4.2 Weitergeben von Spalten in einem Datenfluss, der eine Merge-Transformation enthält Die Weitergabe sendet Spaltenänderungen auf die nachgelagerte Seite. In gültigen Datenflüssen, die zwei oder mehr Quellen enthalten, die mit einer Merge-Transformation zusammengeführt wurden, muss das Schema der Eingaben in die Merge-Transformation identisch sein. Alle Quellen müssen dasselbe Schema aufweisen, einschließlich: ● derselben Anzahl an Spalten ● denselben Spaltennamen ● ähnliche Spalten müssen denselben Datentyp aufweisen Um beim Weitergeben einer Spalte über eine Merge-Transformation einen gültigen Datenfluss beizubehalten, muss diese Beschränkung erfüllt sein. Wenn Sie eine Spalte weitergeben und eine Merge-Transformation zwischen dem Start- und dem Endpunkt liegt, werden Sie über eine Meldung gewarnt, dass der Datenfluss nach Abschluss der Weitergabe ungültig sein wird, da die Eingabeschemas in der Merge-Transformation nicht identisch sind. Wenn Sie mit der Spaltenweitergabe fortfahren, müssen Sie später Spalten zu den Eingabeschemas in der Merge-Transformation hinzufügen, damit der Datenfluss gültig ist. Beispielsweise werden im unten dargestellten Datenfluss die Daten aus allen Quelltabellen gefiltert, und anschließend werden die Ergebnisse in der Merge-Transformation zusammengeführt. Wenn Sie eine Spalte aus der Quelle SALES(Pubs.DBO) an das Ziel CountrySales weitergeben, wird die Spalte zum Schema TableFilter hinzugefügt, jedoch nicht zum Schema FileFilter, was zu unterschiedlichen Eingabeschemas in der Merge-Transformation und einem ungültigen Datenfluss führt. Um einen gültigen Datenfluss zu erhalten, sollte bei der Weitergabe einer Spalte über eine Merge-Transformation der folgende mehrstufige Prozess befolgt werden: 1. Stellen Sie sicher, dass die weiterzugebende Spalte in den Schemas aller Objekte verfügbar ist, die auf der vorgelagerten Seite in die Merge-Transformation führen. So wird gewährleistet, dass alle Eingaben in die Merge-Transformation identisch sind und der Datenfluss gültig ist. 2. Geben Sie die Spalte auf der nachgelagerten Seite der Merge-Transformation zum gewünschten Endpunkt weiter. Designer-Handbuch Datenflüsse PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 165 8.5 Lookup-Tabellen und die Funktion lookup_ext Lookup-Tabellen enthalten Daten, die andere Tabellen referenzieren. In der Regel weisen Lookup-Tabellen folgende Spalten auf: ● Lookup-Spalte – Zum Abgleichen von Zeilen auf Basis der Eingabewerte. Sie wenden Operatoren wie =, >, < und ~ an, um eine Übereinstimmung in einer Zeile zu identifizieren. Eine Lookup-Tabelle kann über mehrere Lookup-Spalten verfügen. ● Ausgabespalte – Die Spalte, die von der Zeile zurückgegeben wurde und der Lookup-Bedingung entspricht, die für die Lookup-Spalte definiert wurde. Eine Lookup-Tabelle kann über mehrere Ausgabespalten verfügen. ● Rückgaberichtlinien-Spalte – Zur Angabe der zurückzugebenden Daten für den Fall, dass mehrere Zeilen die Lookup-Bedingung(en) erfüllen. Die Funktion lookup_ext ermöglicht den Abruf von Daten auf Basis benutzerdefinierter Lookup-Bedingungen, die Eingabedaten mit den Daten der Lookup-Tabelle abgleichen. Mit der Funktion lookup_ext können Sie nicht nur Werte aus Tabellen oder Dateien auf Basis von Werten aus anderen Quelltabellen oder -dateien abrufen, sondern auch erweiterte Funktionen wie die folgenden verwenden: ● Rückgabe mehrerer Spalten mit einem einzigen Lookup-Vorgang ● Auswahl mehrerer Operatoren, darunter Musterabgleich, um eine Lookup-Bedingung anzugeben ● Angabe einer Rückgaberichtlinie für den Lookup-Vorgang ● Aufrufen von lookup_ext in Skripten und benutzerdefinierten Funktionen (außerdem Wiederverwendung von Lookup-Vorgängen, die in Skripten verpackt sind) ● Definieren von benutzerdefiniertem SQL-Code mithilfe des Parameters SQL_override zum Füllen des LookupCaches, um große Mengen von Daten auf die für Lookup-Vorgänge relevanten Bereiche zu beschränken ● Aufrufen von lookup_ext mithilfe des Funktionsassistenten in der Abfrageausgabezuordnung, um mehrere Spalten in einer Query-Transformation zurückzugeben ● Auswahl einer Caching-Strategie, zum Beispiel Zwischenspeichern der gesamten Lookup-Tabelle im Arbeitsspeicher oder dynamisches Generieren von SQL für jeden Eingabedatensatz ● Verwenden von "lookup_ext" mit In-Memory-Datastore-Tabellen oder persistenten Cachetabellen. Bei Verwendung von persistenten Cachetabellen im Gegensatz zu Arbeitsspeichertabellen als Lookup-Tabellen ergeben sich folgende Vorteile: ○ Mehrere Datenflüsse können dieselbe, im persistenten Cache angesiedelte Lookup-Tabelle verwenden. ○ Die Software muss die Lookup-Tabelle nicht jedes Mal anlegen, wenn ein Datenfluss sie verwendet. ○ Für persistenen Cache gelten keine Arbeitsspeicherbeschränkungen, da er auf Datenträger gespeichert ist und die Seiten schnell in den Arbeitsspeicher eingespielt werden. ● Verwenden von auslagerbarem Cache (der für die Funktionen lookup und lookup_seq nicht zur Verfügung steht) ● Verwenden von Ausdrücken in Lookup-Tabellen und Rückgabe der resultierenden Werte Eine Beschreibung der zugehörigen Funktionen lookup und lookup_seq finden Sie im Referenzhandbuch. Weitere Informationen Referenzhandbuch: Funktionen und Prozeduren, lookup_ext Performance Optimization Guide: Using Caches, Caching data 166 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenflüsse 8.5.1 Aufrufen des lookup_ext-Editors Lookup_ext verfügt über einen eigenen grafischen Editor. Der Funktion kann auf zwei Arten aufgerufen werden: ● Fügen Sie einen neuen Funktionsaufruf innerhalb einer Query-Transformation hinzu – Verwenden Sie diese Option, wenn die Lookup-Tabelle mehrere Spalten zurückgeben soll. ● Auf dem Tab „Zuordnung“ in einer Abruf- oder Skriptfunktion. 8.5.1.1 Hinzufügen neuer Funktionsaufrufe 1. Klicken Sie in der Query-Transformation mit der rechten Maustaste auf den Bereich Ausgabeschema, ohne eine bestimmte Ausgabespalte zu wählen, und wählen Sie Neuer Funktionsaufruf. 2. Wählen Sie die Funktionskategorie Lookup-Funktionen und den Funktionsnamen lookup_ext. 3. Klicken Sie auf Weiter, um den Editor aufzurufen. Im Abschnitt "Ausgabe" können Sie mehrere Spalten zum Ausgabeschema hinzufügen. Ein Vorteil bei der Verwendung des neuen Funktionsaufrufs besteht darin, dass Sie, nachdem Sie die lookup_extFunktion geschlossen haben, den grafischen Editor erneut öffnen können, um Änderungen vorzunehmen (klicken Sie mit der rechten Maustaste auf den Funktionsnamen im Schema und wählen Funktionsaufruf ändern). 8.5.1.2 Aufrufen des lookup_ext-Editors vom Tab „Zuordnung“ 1. Wählen Sie den Namen der Ausgabespalte. 2. Klicken Sie im Tab Zuordnung auf Funktionen. 3. Wählen Sie die FunktionskategorieLookup-Funktionen und den Funktionsnamenlookup_ext. 4. Klicken Sie auf Weiter, um den Editor aufzurufen. Im Bereich "Ausgabe" wird Name der Ausgabespalte durch Variable ersetzt. Sie können eine Ausgabespalte definieren, deren Inhalt in der ausgewählten Spalte im Ausgabeschema eingesetzt wird. Wenn lookup_ext mehrere Ausgabespalten ausgibt, speichern Sie die Ausgabewerte mit Hilfe von Variablen, oder verwenden Sie lookup_ext als neuen Funktionsaufruf, wie weiter oben in diesem Abschnitt beschrieben. Der Grafikeditor steht für Funktionen, die in Zuordnungen verwendet werden, nicht zur Verfügung. Sie können den Text jedoch manuell im Tab Zuordnung bearbeiten. Designer-Handbuch Datenflüsse PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 167 8.5.2 Beispiel: Definieren einer einfachen lookup_extFunktion Dieses Verfahren beschreibt den Prozess des Definierens einer einfachen lookup_ext-Funktion mithilfe eines neuen Funktionsaufrufs. Das zugehörige Beispiel veranschaulicht, wie Sie mithilfe einer Lookup-Tabelle Abteilungsnamen für Mitarbeiter abrufen. Einzelheiten zu sämtlichen verfügbaren Optionen für die lookup_ext-Funktion finden Sie im Referenzhandbuch. 1. Öffnen Sie in einem Datenfluss den Abfrageeditor. 2. Ziehen Sie vom Fensterbereich Eingabeschema die ID-Spalte in den Fensterbereich Ausgabeschema. 3. Wählen Sie die ID-Spalte im Fensterbereich Ausgabeschema, klicken Sie mit der rechten Maustaste, und klicken Sie auf Neuer Funktionsaufruf. Klicken Sie auf Darunter einfügen. 4. Wählen Sie die FunktionskategorieLookup-Funktionen und für Funktionsname den Namen lookup_ext und klicken auf Weiter. Der lookup_ext-Editor wird geöffnet. 5. Wählen Sie im Fenster Lookup_ext – Parameter wählen eine Lookup-Tabelle aus: a. Klicken Sie neben dem Textfeld Lookup-Tabelle auf den Pfeil des Drop-Down-Felds, und doppelklicken Sie auf den Datastore, das Dateiformat oder auf das aktuelle Schema, das die Tabelle einschließt. b. Wählen Sie die Lookup-Tabelle aus, und klicken Sie auf OK. In dem Beispiel handelt es sich bei der Lookup-Tabelle um ein Dateiformat namens ID_lookup.txt im Verzeichnis D:\Data. 6. Für die Cache-Spez. ist der VORAB_GELADENER_CACHE-Standardwert nützlich, wenn die Tabelle nur wenige Zeilen enthält oder wenn Sie voraussichtlich auf einen hohen Prozentsatz der Tabellenwerte zugreifen. KEIN_CACHE liest Werte aus der Lookup-Tabelle für jede Zeile, ohne Werte zwischenzuspeichern. Wählen Sie DEMAND_LOAD_CACHE, wenn die Tabelle viele Zeilen enthält und Sie voraussichtlich häufig auf einen geringen Prozentsatz der Tabellenwerte zugreifen oder wenn Sie die Tabelle in mehreren Lookups verwenden und die Vergleichsbedingungen sehr selektiv sind, sodass sich eine kleine Datenteilmenge ergibt. 7. Um mehr Ressourcen für die Ausführung der lookup_ext-Funktion zu bieten, wählen Sie Als separaten Prozess ausführen aus. Diese Option legt einen separaten untergeordneten Datenflussprozess für die lookup_ext-Funktion an, wenn der Datenfluss ausgeführt wird. 8. Definieren Sie mindestens eine Bedingung. Fügen Sie für jede Bedingung einen Spaltennamen für die LookupTabelle hinzu (wählen Sie aus der Drop-Down-Liste aus, oder ziehen Sie ihn aus dem Fensterbereich Parameter), wählen Sie den richtigen Operator aus, und geben Sie einen Ausdruck ein, indem Sie diesen über die Tastatur eingeben, ziehen, einfügen, oder mithilfe des Smart Editors (klicken Sie auf das Symbol in der rechten Spalte). In dem Beispiel lautet die Bedingung ID_DEPT = Employees.ID_DEPT. 9. Definieren Sie die Ausgabe. Gehen Sie für jede Ausgabespalte wie folgt vor: a. Fügen Sie einen Spaltennamen für die Lookup-Tabelle hinzu. b. Ändern Sie optional den Standardwert von NULL. c. Geben Sie den Ausgabespaltennamen an, indem Sie diesen über die Tastatur eingeben, ziehen, einfügen, oder mithilfe des Smart Editors (klicken Sie auf das Symbol in der rechten Spalte). Im Beispiel lautet die Ausgabespalte ID_DEPT_NAME. 10. Wenn mehrere Übereinstimmungen möglich sind, geben Sie die Reihenfolge an, und legen Sie eine Rückgaberichtlinie fest (Standard ist MAX), um eine Übereinstimmung auszuwählen. Um die Ausgabe zu sortieren, geben Sie den oder die Spaltennamen in die Liste Sortieren nach ein. 168 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenflüsse Beispiel Das folgende Beispiel veranschaulicht, wie Sie mithilfe einer Lookup-Tabelle ID_lookup.txt Abteilungsnamen für Mitarbeiter abrufen. Die Tabelle "Employees" sieht folgendermaßen aus: Tabelle 60: ID NAME ID_DEPT SSN111111111 Employee1 10 SSN222222222 Employee2 10 TAXID333333333 Employee3 20 Die Lookup-Tabelle ID_lookup.txt sieht folgendermaßen aus: Tabelle 61: ID_DEPT ID_PATTERN ID_RETURN ID_DEPT_NAME 10 ms(SSN*) =substr(ID_Pattern,4,20) Payroll 20 ms(TAXID*) =substr(ID_Pattern,6,30) Accounting Der lookup_ext-Editor würde wie folgt konfiguriert. Designer-Handbuch Datenflüsse PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 169 Weitere Informationen Beispiel: Definieren einer komplexen lookup_ext-Funktion [Seite 170] 8.5.3 Beispiel: Definieren einer komplexen lookup_extFunktion Im Folgenden wird die Vorgehensweise beim Definieren einer komplexen lookup_ext-Funktion mithilfe eines neuen Funktionsaufrufs beschrieben. Im zugehörigen Beispiel werden dieselben Lookup- und Eingabetabellen wie unter Beispiel: Definieren einer einfachen lookup_ext-Funktion [Seite 168] verwendet. Dieses Beispiel veranschaulicht, wie IDs von Mitarbeitern extrahiert und normalisiert werden. Einzelheiten zu sämtlichen verfügbaren Optionen für die lookup_ext-Funktion finden Sie im Referenzhandbuch. 1. Öffnen Sie in einem Datenfluss den Abfrageeditor. 2. Ziehen Sie vom Fensterbereich Eingabeschema die ID-Spalte in den Fensterbereich Ausgabeschema. Gehen Sie genauso für die Spalte "Name" vor. 3. Klicken Sie im Bereich Ausgabeschema mit der rechten Maustaste auf die Spalte "Name", und klicken Sie auf Neuer Funktionsaufruf. Klicken Sie auf Darunter einfügen. 4. Wählen Sie die FunktionskategorieLookup-Funktionen und für Funktionsname den Namen lookup_ext und klicken auf Weiter. 5. Wählen Sie im Fenster Lookup_ext – Parameter wählen eine Lookup-Tabelle aus: Im Beispiel weist die Lookup-Tabelle das Dateiformat "ID_lookup.txt" auf und befindet sich in "D:\Data". 6. Definieren Sie mindestens eine Bedingung. Im Beispiel lautet die Bedingung ID_PATTERN ~ Employees.ID. 7. Definieren Sie die Ausgabe. Gehen Sie für jede Ausgabespalte wie folgt vor: a. Fügen Sie einen Spaltennamen für die Lookup-Tabelle hinzu. b. Wenn Sie möchten, dass die Spalten in der Lookup-Tabelle als Ausdruck interpretiert und der berechnete Wert zurückgegeben wird, aktivieren Sie das Kontrollkästchen Ausdruck. c. Ändern Sie optional den Standardwert von NULL. d. Geben Sie unter Name der Ausgabespalte durch Eingabe, Ziehen, Einfügen oder mithilfe des Smart Editors einen oder mehrere Namen an (klicken Sie auf das Symbol in der rechten Spalte). Im Beispiel lauten die Ausgabespaltennamen ID-RETURN und ID_DEPT_NAME. Beispiel Extrahieren und Normalisieren der IDs von Mitarbeitern In diesem Beispiel sollen Sozialversicherungsnummern und Steueridentifikationsnummern von Mitarbeitern extrahiert und normalisiert werden. Diese Nummern weisen unterschiedliche Präfixe auf. Sie möchten die Präfixe entfernen und damit die Nummern normalisieren. Außerdem sollen die Abteilungen identifiziert werden, aus denen die Nummern stammen. Im Datenfluss sind eine Quelltabelle mit den Mitarbeitern, eine mit der Funktion lookup_ext konfigurierte Abfrage und eine Zieltabelle enthalten. 170 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenflüsse Konfigurieren Sie den lookup_ext-Editor wie in der folgenden Abbildung gezeigt. Die Lookup-Bedingung lautet ID_PATTERN ~ Employees.ID. Die Software liest jede Zeile aus der Mitarbeiter-Quelltabelle und prüft dann die Lookup-Tabelle "ID_lookup.txt" auf alle Zeilen, die die Lookup-Bedingung erfüllen. Der Operator ~ bedeutet, dass auf „Employees.ID“ ein Mustervergleich angewendet wird. Wenn die Software auf ein Muster in ID_lookup.ID_PATTERN stößt, das „Employees.ID“ entspricht, wendet sie den Ausdruck in ID_lookup.ID_RETURN an. In diesem Beispiel weisen sowohl „Employee1“ als auch „Employee2“ IDs auf, die dem Muster „ms(SSN*)“ in der Lookup-Tabelle entsprechen. Die Software wendet dann den Ausdruck =substr(ID_PATTERN,4,20) auf die Daten an, der aus der übereinstimmenden Zeichenfolge (Employees.ID) eine Teilzeichenfolge von bis zu 20 Zeichen aus der 4. Position extrahiert. Die Ergebnisse für "Employee1" und "Employee2" lauten jeweils 111111111 und 222222222. Was die Ausgabe der Lookup-Spalte ID_RETURN anbelangt, so wird ID_RETURN als Ausdruck ausgewertet, da das Kontrollkästchen Ausdruck aktiviert ist. In der Lookup-Tabelle enthält die Spalte ID_RETURN den Ausdruck =substr(ID_PATTERN,4,20). ID_PATTERN bezieht sich in diesem Ausdruck auf die Spalte ID_PATTERN der Lookup-Tabelle. Wenn die Lookup-Bedingung ID_PATTERN ~ Employees.ID erfüllt ist, wird der Ausdruck ausgewertet. In diesem Fall wird der Platzhalter ID_PATTERN durch den tatsächlichen Wert von "Employees.ID" ersetzt. Designer-Handbuch Datenflüsse PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 171 Die Ausgabe enthält auch die Spalte ID_DEPT_NAME, die als Literalwert zurückgegeben wird (da das Kontrollkästchen "Ausdruck" nicht aktiviert ist). Die resultierende Zieltabelle sieht wie folgt aus: Tabelle 62: ID NAME ID_RETURN ID_DEPT_NAME SSN111111111 Employee1 111111111 Payroll SSN222222222 Employee2 222222222 Payroll TAXID333333333 Employee3 333333333 Accounting Weitere Informationen Beispiel: Definieren einer einfachen lookup_ext-Funktion [Seite 168] Aufrufen des lookup_ext-Editors [Seite 167] Referenzhandbuch: Funktionen und Prozeduren, lookup_ext Referenzhandbuch: Funktionen und Prozeduren, match_simple 8.6 Datenflussausführung Ein Datenfluss ist eine deklarative Spezifikation, anhand derer die richtigen Daten für die Verarbeitung bestimmt werden. Bei Datenflüssen in Batch-Jobs lautet die Transaktionsreihenfolge beispielsweise Extrahieren, Transformieren und dann Laden von Daten in ein Ziel. Datenflüsse sind SQL-Anweisungen ähnlich. Die Spezifikation deklariert die gewünschte Ausgabe. Ein Datenfluss wird immer dann ausgeführt, wenn er in einem Job vorkommt. Sie können jedoch festlegen, dass ein Batch-Job einen bestimmten Datenfluss nur einmal ausführt. In diesem Fall wird nur das erste Vorkommen des Datenflusses ausgeführt; weitere Vorkommen im Job werden übersprungen. Sie können diese Funktion verwenden, wenn komplexe Batch-Jobs mit mehreren Pfaden entwickelt werden, beispielsweise Jobs mit Try/Catch-Blöcken oder bedingten Verzweigungen. Auf Wunsch können Sie auch sicherstellen, dass nur jeweils ein bestimmter Datenfluss gleichzeitig ausgeführt wird. Weitere Informationen Anlegen und Definieren von Datenflüssen [Seite 156] 172 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenflüsse 8.6.1 Weitergeben von Operationen an den Datenbankserver Mit den Informationen in den Datenflussspezifikationen generiert die Software Ausgabe und optimiert gleichzeitig die Leistung. Beispielsweise legt die Software für SQL-Quellen und -Ziele datenbankspezifische SQL-Anweisungen auf der Basis der Datenflussdiagramme eines Jobs an. Zum Optimieren der Leistung gibt die Software so viele Transformationsoperationen wie möglich an die Quell- oder Zieldatenbank weiter und kombiniert so viele Operationen wie möglich in einer einzigen Anforderung an die Datenbank. Die Software versucht z.B., Joins und Funktionsauswertungen weiterzugeben. Durch Weitergabe von Operationen an die Datenbank reduziert die Software die Anzahl der Zeilen und Operationen, die die Engine verarbeiten muss. Der Datenflussentwurf wirkt sich auf die Anzahl der Operationen aus, die die Software an die Quell- oder Zieldatenbank weitergeben kann. Vor der Ausführung eines Jobs können Sie die SQL untersuchen, die die Software generiert, und den Entwurf für mehr Effizienz ändern. Sie können die Data_Transfer-Transformation verwenden, um ressourcenintensive Operationen an beliebigen Positionen in einem Datenfluss an die Datenbank weiterzugeben. Ressourcenintensive Operationen sind Joins, GROUP BY, ORDER BY und DISTINCT. Weitere Informationen Performance Optimization Guide: Maximizing push-down operations Referenzhandbuch: Data_Transfer 8.6.2 Verteilte Datenflussausführung Die Software bietet Funktionen, mit denen CPU- und speicherintensive Datenverarbeitungsoperationen (wie Joins, Gruppierung, Tabellenvergleich und Lockups) auf mehrere Prozessoren und Rechner verteilt werden können. Diese Verteilung der Arbeit bietet die folgenden potenziellen Vorteile: ● Bessere Speicherverwaltung durch Nutzung von mehr CPU-Ressourcen und physischem Arbeitsspeicher ● Bessere Jobleistung und Skalierbarkeit durch gleichzeitige Ausführung von Teildatenflüssen zur Nutzung von Grid-Computing Sie können Teildatenflüsse anlegen, damit die Software nicht den gesamten Datenfluss gleichzeitig im Arbeitsspeicher verarbeiten muss. Außerdem können Sie die Teildatenflüsse auf verschiedene Jobserver innerhalb einer Servergruppe verteilen, um weitere Arbeitsspeicher- und CPU-Ressourcen zu verwenden. Verwenden Sie die folgenden Funktionen, um einen Datenfluss in mehrere Teildatenflüsse aufzuteilen: ● Option Als separaten Prozess ausführen für ressourcenintensive Operationen, die Folgendes enthalten: ○ Hierarchy_Flattening-Transformation ○ Associate-Transformation ○ Country ID-Transformation Designer-Handbuch Datenflüsse PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 173 ○ Global Address Cleanse-Transformation ○ Global Suggestion Lists-Transformation ○ Match Transform ○ United States Regulatory Address Cleanse-Transformation ○ User-Defined-Transformation ○ Abfrageoperationen, die CPU- und speicherintensiv sind: ○ Join ○ GROUP BY ○ ORDER BY ○ DISTINCT ○ Table_Comparison-Transformation ○ Lookup_ext-Funktion ○ Count_distinct-Funktion ○ Search_replace-Funktion Wenn Sie die Option "Als separaten Prozess ausführen" für mehrere Operationen in einem Datenfluss auswählen, teilt die Software den Datenfluss in kleinere Teildatenflüsse auf, die jeweils verschiedene Ressourcen (Arbeitsspeicher und Rechner) verwenden. Wenn Sie mehrere Optionen "Als separaten Prozess ausführen" angeben, werden die Prozesse für die Teildatenflüsse parallel ausgeführt. ● Data_Transfer-Transformation Mit dieser Transformation muss die Software nicht den gesamten Datenfluss auf dem Jobserver-Rechner verarbeiten. Stattdessen kann die Data_Transfer-Transformation die Verarbeitung einer ressourcenintensiven Operation an den Datenbankserver weitergeben. Diese Transformation teilt den Datenfluss in zwei Teildatenflüsse auf und überträgt die Daten an eine Tabelle auf dem Datenbankserver, damit die Software die Operation weitergeben kann. Weitere Informationen Performance Optimization Guide: Splitting a data flow into sub data flows Performance Optimization Guide: Data_Transfer-Transformation für Push-down-Operationen 8.6.3 Lastausgleich Sie können die Ausführung eines Jobs oder eines Teils eines Jobs auf mehrere Jobserver innerhalb einer Servergruppe verteilen, um ressourcenintensive Operationen besser auszugleichen. Bei der Ausführung eines Jobs können Sie folgende Werte für die Option Verteilungsebene angeben: ● Job – Ein Job kann auf einem verfügbaren Jobserver ausgeführt werden. ● Datenfluss – Jeder Datenfluss innerhalb eines Jobs kann auf einem verfügbaren Jobserver ausgeführt werden. ● Teildatenfluss – Ein ressourcenintensiver Vorgang (z.B. eine Sortierung, ein Tabellenvergleich oder ein Tabellen-Lookup) innerhalb eines Datenflusses kann auf einem verfügbaren Jobserver ausgeführt werden. 174 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenflüsse Weitere Informationen Performance Optimization Guide: Using grid computing to distribute data flows execution 8.6.4 Caches Die Software bietet die Möglichkeit, Daten im Arbeitsspeicher zwischenzuspeichern, um Operationen wie die folgenden in Datenflüssen zu verbessern. Tabelle 63: Operation Beschreibung Joins Da eine innere Quelle eines Joins für jede Zeile einer äußeren Quelle gelesen werden muss, empfiehlt sich die Zwischenspeicherung einer Quelle, die als innere Quelle in einem Join verwendet wird. Tabellenvergleiche Da für jede Zeile einer Quelle eine Vergleichstabelle gelesen werden muss, kann sich die Zwischenspeicherung der Vergleichstabelle vorteilhaft auswirken. Lookups Da für eine Remote-Datenbank eine Lookup-Tabelle vorliegen kann, können Sie durch deren Zwischenspeicherung im Arbeitsspeicher die Zugriffszeiten beschleu nigen. Die Software bietet die folgenden Cachetypen für Datenflüsse, die für sämtliche enthaltenen Operationen verwendet werden können: Tabelle 64: Cache Beschreibung Speicherresident Verwenden Sie speicherresidenten Cache, wenn der Datenfluss eine kleine Daten menge verarbeitet, die in den Arbeitsspeicher passt. Auslagerbarer Cache Verwenden Sie auslagerbaren Cache, wenn der Datenfluss eine sehr große Daten menge verarbeitet, die nicht in den Arbeitsspeicher passt. Wenn Sie den Datenfluss in Teildatenflüsse aufspalten, die alle auf einem anderen Jobserver ausgeführt werden, kann für jeden Teildatenfluss ein eigener Cachetyp verwendet werden. Weitere Informationen Performance Optimization Guide: Using Caches 8.7 Auditieren von Datenflüssen – Übersicht Sie können Objekte innerhalb eines Datenflusses auditieren, um Laufzeit-Auditstatistiken zu erfassen. Designer-Handbuch Datenflüsse PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 175 Mit dieser Auditfunktion können Sie die folgenden Aufgaben ausführen: ● Auditstatistiken zu Daten erfassen, die in einen Job eingelesen, von verschiedenen Transformationen verarbeitet und in Ziele geladen werden. ● Regeln zu den Auditstatistiken definieren, um festzustellen, ob die korrekten Daten verarbeitet werden. ● Benachrichtigungen zu fehlgeschlagenen Audits generieren. ● Die Auditstatistiken abfragen, die im Repository gespeichert sind. Weitere Informationen Verwenden von Audits [Seite 348] 176 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenflüsse 9 Transformationen Transformationen verarbeiten Datasets, indem sie Eingabesätze bearbeiten und einen oder mehrere Ausgabesätze generieren. Im Gegensatz dazu verarbeiten Funktionen einzelne Werte in bestimmten Spalten eines Datasets. Auf dem Tab Transformationen der Objektbibliothek stehen viele integrierte Transformationen zur Verfügung. Welche Transformationen Sie tatsächlich verwenden können, hängt von dem von Ihnen erworbenen Softwarepaket ab. (Wenn eine Transformation zu einem Paket gehört, das Sie nicht besitzen, ist diese deaktiviert und kann nicht in einem Job verwendet werden.) Transformationen werden in die folgenden Kategorien eingeteilt: ● Data Integrator: Transformationen, mit denen Sie Daten extrahieren, transformieren und laden können. Diese Transformationen gewährleisten Datenintegrität und maximieren die Entwicklerproduktivität beim Laden und Aktualisieren der Data-Warehouse-Umgebung. ● Data Quality: Transformationen, die die Datenqualität verbessern. Mit diesen Transformationen können Sie die Kunden- und operativen Datenbestände parsen, standardisieren, korrigieren, anreichern, abgleichen und konsolidieren. ● Plattform: Transformationen, die für allgemeine Datenverschiebungsoperationen benötigt werden. Mit diesen Transformationen können Sie Zeilen generieren, zuordnen und aus zwei oder mehr Quellen zusammenführen, SQL-Abfrageoperationen anlegen (Ausdrücke, Lookups, Joins und Filter), eine bedingte Aufteilung ausführen und persönliche Daten maskieren, damit sensible Daten relevant, anonym und sicher bleiben. ● Text Data Processing: Transformationen, mit denen bestimmte Informationen aus dem Text extrahiert werden. Mithilfe dieser Transformationen können Sie große Textmengen parsen und damit Einheiten und Fakten wie Kunden, Produkte, Standorte und finanzielle Informationen, die für Ihr Unternehmen relevant sind, identifizieren und extrahieren. Tabelle 65: Transformati onskategorie Transformation Beschreibung Data Integrator Data_Transfer Ermöglicht einem Datenfluss, die Verarbeitung auf zwei Teildatenflüsse aufzu teilen und ressourcenintensive Operationen an den Datenbankserver zu über geben. Date_Generation Generiert eine Spalte mit Datenwerten, die auf den Start- und Enddatumswer ten und der Inkrementierung basieren, die Sie bereitstellen. Effective_Date Generiert eine zusätzliche Gültig-bis-Spalte, die auf dem Gültigkeitsdatum des Primärschlüssels basiert. Hierarchy_Flattening Flacht die Struktur hierarchischer Daten zur Einfügung in relationale Tabellen ab, sodass die Einbindung in ein Sternschema möglich ist. Es kann sowohl die vertikale als auch die horizontale Struktur abgeflacht werden. History_Preserving Konvertiert Zeilen, die als UPDATE gekennzeichnet sind, in UPDATE plus IN SERT, sodass die ursprünglichen Werte im Ziel bebehalten werden. Sie geben an, in welcher Spalte nach den aktualisierten Daten gesucht werden soll. Designer-Handbuch Transformationen PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 177 Transformati onskategorie Data Quality 178 Transformation Beschreibung Key_Generation Generiert neue Schlüssel für Quelldaten, beginnend bei einem Wert, der auf vorhandenen Schlüsseln in der angegebenen Tabelle basiert. Map_CDC_Operation Sortiert Eingabedaten, ordnet Ausgabedaten zu und löst Before- und AfterImages für UPDATE-Zeilen auf. Während diese Transformation häufig zur Un terstützung der Oracle-Datenänderungserfassung verwendet wird, kann sie mit jedem beliebigen Datenstream eingesetzt werden, solange deren Eingabean forderungen erfüllt werden. Pivot (Columns to Rows) Rotiert die Werte in angegebenen Spalten in Zeilen. (Siehe auch Reverse Pivot.) Reverse Pivot (Zeilen in Spalten) Rotiert die Werte in angegebenen Zeilen in Spalten. Table_Comparison Vergleicht zwei Datasets und gibt deren Differenz als Dataset aus, in dem die Zeilen als INSERT und UPDATE gekennzeichnet sind. XML_Pipeline Verarbeitet große XML-Eingaben in kleinen Mengen. Associate Kombiniert die Ergebnisse von zwei oder mehr Match-Transformationen oder zwei oder mehr Associate-Transformationen bzw. jeder beliebigen Kombina tion dieser zwei Transformationen, um nach Übereinstimmungen in Übereins timmungssätzen zu suchen. Country ID Analysiert Eingabedaten und identifiziert dann das Zielland für jeden Daten satz. Data Cleanse Identifiziert und parst Namens-, Titel- und Unternehmensdaten, Telefonnum mern, Sozialversicherungsnummern, Datumsangaben und E-Mail-Adressen. Die Transformation kann das Geschlecht zuweisen, Namenspräfixe hinzufügen, Match-Standards generieren und Eingabequellen in ein Standardformat kon vertieren. Außerdem kann Sie verschiedene Formen internationaler Daten so wie Betriebs- und Produktdaten parsen und bearbeiten. DSF2 Walk Sequencer Fügt den Daten Zustellsequenzinformationen hinzu, die Sie mit Vorsortierungs software verwenden können, um Anspruch auf Wegsequenzrabatte zu haben. Geocoder Verwendet geografische Koordinaten, Adressen und Point-of-Interest-Daten (POI-Daten), um Informationen z.B. zu Adressen, Breiten- und Längengraden sowie zu Zensusdaten an die Datensätze anzuhängen. Global Address Cleanse Identifiziert, parst, validiert und korrigiert globale Adressdaten wie primäre Nummer, primärer Name, primärer Typ, Himmelsrichtung, sekundäre ID und sekundäre Nummer. Global Suggestion Lists Vervollständigt und füllt Adressen, die nur wenig Daten enthalten, und kann Vorschläge für mögliche Übereinstimmungen präsentieren. Match Identifiziert übereinstimmende Datensätze auf Basis Ihrer Business-Regeln. Führt außerdem Operationen zur Kandidatenauswahl, für eindeutige IDs, opti male Datensätze und andere Operationen aus. USA Regulatory Address Cleanse Identifiziert, parst, validiert und korrigiert US-Adressdaten gemäß dem U.S. Coding Accuracy Support System (CASS). User-Defined Führt nahezu alles aus, was Sie mit Python-Code schreiben können. Mit der User-Defined-Transformation können Sie neue Datensätze und Datasets anle gen oder ein Feld mit einem bestimmten Wert füllen. Dies sind nur einige aus einer Fülle von Möglichkeiten. PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Transformationen Transformati onskategorie Transformation Beschreibung Plattform Case Vereinfacht Verzweigungslogik in Datenflüssen, indem Fall- oder Entschei dungsfindungslogik in einer Transformation konsolidiert werden. Pfade werden in einer Ausdruckstabelle definiert. Data_Mask Verwendet Datenmaskierungsverfahren, z.B. Zeichenersetzung, Zahlenvari anz, Datumsvarianz und Mustervarianz, um in Ihren Datenbanken enthaltene persönliche Informationen zu maskieren oder zu verbergen (Beispiele: Bank kontonummern, Kreditkartennummern und Einkommen). Die Datenmaskie rung erhält die Datenrelevanz und Relationen aufrecht, sorgt dafür, dass Kun deninformationen vertraulich und anonym behandelt werden und unterstützt die Datenschutzrichtlinien Ihres Unternehmens. Map_Operation Ändert Daten abhängig von aktuellen Operationscodes und Zuordnungsaus drücken. Die Operationscodes können dann zwischen Datenmanipulationsope rationen konvertiert werden. Merge Führt Zeilen aus zwei oder mehr Quellen in einem einzigen Ziel zusammen. Query Ruft ein Dataset ab, das die angegebenen Bedingungen erfüllt. Eine QueryTransformation ähnelt einer SQL-SELECT-Anweisung. Row_Generation Generiert eine Spalte mit Ganzzahlwerten, die bei 0 beginnen und sich um den Wert 1 inkrementell bis zum angegebenen Endwert erhöhen. SQL Führt die angegebene SQL-Abfrageoperation aus. Validation Stellt sicher, dass die Daten in jeder Phase des Datenflusses den Kriterien ent sprechen. Sie können die Daten, die die Kriterien nicht erfüllen, herausfiltern oder ersetzen. Entity_Extraction Extrahiert Informationen (Einheiten und Fakten) aus Inhalt im Text-, HTML, XML- oder Binärformat wie PDF. Textdatenverar beitung Weitere Informationen Referenzhandbuch: Transformationen 9.1 Hinzufügen von Transformationen zu Datenflüssen Mit dem Designer können Sie Datenflüssen Transformationen hinzufügen. 1. Öffnen Sie ein Datenflussobjekt. 2. Öffnen Sie die Objektbibliothek, wenn sie nicht bereits geöffnet ist, und klicken Sie auf den Tab Transformationen. 3. Wählen Sie die Transformation oder die Transformationskonfiguration aus, die Sie dem Datenfluss hinzufügen möchten. 4. Ziehen Sie das Symbol für die Transformation oder die Transformationskonfiguration in den DatenflussArbeitsbereich. Wenn Sie eine Transformation ausgewählt haben, für die Transformationskonfigurationen zur Designer-Handbuch Transformationen PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 179 Verfügung stehen, werden Sie in einem Dialogfenster aufgefordert, eine Transformationskonfiguration auszuwählen. 5. Zeichnen Sie die Datenflussverbindungen ein. Um eine Quelle mit einer Transformation zu verbinden, klicken Sie auf das Quadrat in der rechten Ecke der Quelle, und ziehen Sie den Cursor zum Pfeil auf der linken Ecke der Transformation. Fahren Sie nach Bedarf mit dem Verbinden der Eingaben und Ausgaben für die Transformation fort. ○ Die Eingabe für die Transformation könnte die Ausgabe von einer anderen Transformation oder die Ausgabe von einer Quelle sein; oder die Transformation erfordert eventuell keine Quelldaten. ○ Sie können die Ausgabe der Transformation mit der Eingabe einer anderen Transformation oder eines Ziels verbinden. 6. Doppelklicken Sie auf den Namen der Transformation. Dadurch wird der Transformationseditor geöffnet, in dem Sie die Definition der Transformation abschließen können. 7. Geben Sie die Optionswerte ein. Um eine Datenspalte als Transformationsoption festzulegen, geben Sie den Spaltennamen so wie er angezeigt wird in das Eingabeschema ein, oder ziehen Sie den Spaltennamen vom Eingabeschema in das Optionsfeld. Weitere Informationen Hinzufügen von Query-Transformationen zu Datenflüssen [Seite 184] Hinzufügen von Data-Quality-Transformationen zu Datenflüssen [Seite 187] Hinzufügen einer Textverarbeitungs-Transformation zu einem Datenfluss [Seite 200] 9.2 Transformationseditoren Nachdem Sie einem Datenfluss eine Transformation hinzugefügt haben, konfigurieren Sie sie mit dem Transformationseditor. Das Layout der Transformationseditoren ist unterschiedlich. Die am häufigsten verwendete Transformation ist die Query-Transformation, die aus zwei Bereichen besteht: ● Einem Eingabeschemabereich und/oder einem Ausgabeschemabereich ● Einem Optionsbereich (oder Parameterbereich), in dem Sie alle von der Transformation benötigten Werte festlegen können Data-Quality-Transformationen, wie z.B. Match und Data Cleanse, verwenden einen Transformationseditor, mit dem Sie Optionen festlegen können und Eingabe- und Ausgabefelder zuordnen können. 180 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Transformationen Mit dem Entity-Extraktion-Transformationseditor können Sie Extraktionsoptionen festlegen und Eingabe- und Ausgabefelder zuordnen. Weitere Informationen Abfrageeditor [Seite 185] Data-Quality-Transformationseditoren [Seite 189] Editor für die Entity-Extraction-Transformation [Seite 201] 9.3 Transformationskonfigurationen Eine Transformationskonfiguration ist eine Transformation mit vorkonfigurierten Eingabefeldern und Ausgabefeldern für optimale Vorgehensweise sowie Optionen, die in mehreren Datenflüssen verwendet werden können. Diese sind nützlich, wenn Sie eine Transformation mit bestimmten Optionen sowie Eingabe- und Ausgabefeldern wiederholt verwenden. Einige Transformationen, wie die Data-QualityTransformationen, besitzen schreibgeschützte Transformationskonfigurationen, die bei der Installation von Data Services bereitgestellt werden. Sie können auch eine eigene Transformationskonfiguration anlegen, entweder indem Sie eine vorhandene Transformationskonfiguration replizieren, oder indem Sie eine neue anlegen. Sie können keine Export- oder Mehrbenutzervorgänge bei schreibgeschützten Transformationskonfigurationen ausführen. Im Fenster des Editors zum Konfigurieren von Transformationen richten Sie die Standardoptionen sowie die Eingabefelder und Ausgabefelder für optimale Vorgehensweise für Ihre Transformationskonfiguration ein. Nachdem Sie eine Instanz der Transformationskonfiguration in einen Datenfluss gesetzt haben, können Sie diese voreingestellten Standardwerte überschreiben. Wenn Sie eine Transformationskonfiguration bearbeiten, wird diese Änderung von jeder Instanz der in den Datenflüssen verwendeten Transformationskonfiguration übernommen, sofern ein Benutzer nicht ausdrücklich diesen Optionswert in einer Instanz überschrieben hat. Weitere Informationen Anlegen einer Transformationskonfiguration [Seite 182] Hinzufügen von benutzerdefinierten Feldern [Seite 183] Designer-Handbuch Transformationen PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 181 9.3.1 Anlegen einer Transformationskonfiguration Sie können vorkonfigurierte Best-Practice-Eingabefelder, Best-Practice-Ausgabefelder und Optionen anlegen, die Sie in mehreren Datenflüssen verwenden möchten. 1. Klicken Sie auf dem Tab Transformationen von Lokale Objektbibliothek mit der rechten Maustaste auf eine Transformation, und wählen Sie Neu aus, um eine neue Transformationskonfiguration anzulegen, oder klicken Sie mit der rechten Maustaste auf eine vorhandene Transformationskonfiguration, und wählen Sie Replizieren aus. Wenn "Neu" und "Replizieren" im Menü nicht zur Verfügung stehen, sind Transformationskonfigurationen für den ausgewählten Transformationstyp nicht zulässig. Das Fenster Editor zum Konfigurieren von Transformationen wird geöffnet. 2. Geben Sie unter Name der Transformationskonfiguration den Namen für die Transformationskonfiguration ein. 3. Legen Sie auf dem Tab Optionen die entsprechenden Optionswerte fest, um anzugeben, wie die Transformation die Daten verarbeitet. Die verfügbaren Optionen richten sich nach dem Transformationstyp, für den Sie eine Konfiguration anlegen. Für die Associate-, Match- und User-Defined-Transformation können die Optionen auf dem Tab „Optionen“ nicht bearbeitet werden. Sie müssen die Optionen im Associate-, Match- oder User-Defined-Editor festlegen, auf den Sie über die Schaltfläche Optionen bearbeiten zugreifen können. Wenn Sie bei einem Optionswert einen anderen Wert als den standardmäßig festgelegten wählen, wird neben dem Optionsnamen ein grünes Dreieck angezeigt, das die von Ihnen vorgenommene Überschreibung angibt. 4. Um eine Option als "optimale Vorgehensweise" zu kennzeichnen, aktivieren Sie das Kontrollkästchen Optimale Vorgehensweise neben dem Wert der Option. Durch die Kennzeichnung einer Option als optimale Vorgehensweise weisen Sie andere Benutzer, die die Transformationskonfiguration verwenden, auf die Optionen hin, die normalerweise für den jeweiligen Typ von Transformation festgelegt werden. Mit dem Filter können Sie alle Optionen oder nur diejenigen Optionen anzeigen, die als optimale Vorgehensweise gekennzeichnet sind. 5. Klicken Sie auf die Schaltfläche Verifizieren, um zu prüfen, ob die ausgewählten Optionswerte gültig sind. Wenn Fehler vorliegen, werden diese unten im Fenster angezeigt. 6. Wählen Sie auf dem Tab Optimale Vorgehensweisen für Eingabe die Eingabefelder aus, die Sie als Eingabefelder der optimalen Vorgehensweise für die Transformationskonfiguration kennzeichnen möchten. In den mit Data Services bereitgestellten Transformationskonfigurationen sind keine Eingabefelder der optimalen Vorgehensweise angegeben, sodass nicht der Eindruck entsteht, dass ein Eingabeschema anderen Eingabeschemas vorzuziehen ist. Sie könnten beispielsweise die Felder mit Adressdaten im Datenfluss zuordnen, unabhängig davon, ob die Adressdaten in diskreten Feldern, mehrzeiligen Feldern oder einer Kombination von diskreten und mehrzeiligen Feldern vorliegen. Diese Eingabefelder sind dann die einzigen angezeigten Felder, wenn der Filter "Optimale Vorgehensweise" auf dem Tab "Eingabe" des Transformationseditors ausgewählt ist und die Transformationskonfiguration in einem Datenfluss verwendet wird. 7. Bei Associate-, Match- und User-Defined-Transformationskonfigurationen können Sie benutzerdefinierte Eingabefelder anlegen. Klicken Sie auf die Schaltfläche Anlegen, und geben Sie den Namen des Eingabefelds ein. 8. Wählen Sie auf dem Tab Optimale Vorgehensweisen für Ausgabe die Ausgabefelder aus, die Sie als Ausgabefelder der optimalen Vorgehensweise für die Transformationskonfiguration kennzeichnen möchten. 182 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Transformationen Diese Ausgabefelder sind dann die einzigen angezeigten Felder, wenn der Filter "Optimale Vorgehensweise" auf dem Tab "Ausgabe" des Transformationseditors ausgewählt ist und die Transformationskonfiguration in einem Datenfluss verwendet wird. 9. Klicken Sie auf OK, um die Transformationskonfiguration zu speichern. Die Transformationskonfiguration wird im Bereich Lokale Objektbibliothek unter der Basistransformation desselben Typs angezeigt. Sie können die Transformationskonfiguration jetzt in Datenflüssen verwenden. Weitere Informationen Referenzhandbuch: Transformationen, Transformationskonfigurationen 9.3.2 Hinzufügen von benutzerdefinierten Feldern Für einige Transformationen, wie etwa die Associate-, Match- und User-Defined-Transformation, können Sie benutzerdefinierte Eingabefelder anlegen, anstatt Felder, die von der Transformation erkannt werden. Diese Transformationen verwenden benutzerdefinierte Felder, da sie nicht über einen vordefinierten Satz an Eingabefeldern verfügen. Sie können ein benutzerdefiniertes Feld entweder zu einer einzelnen Instanz einer Transformation in einem Datenfluss, zu einer Transformation in einem Datenfluss oder zu einer Transformationskonfiguration hinzufügen, so dass es in allen Instanzen verwendet werden kann. In der User-Defined-Transformation können Sie außerdem benutzerdefinierte Ausgabefelder hinzufügen. 1. Klicken Sie auf dem Tab Transformationen der Lokalen Objektbibliothek mit der rechten Maustaste auf eine vorhandene Associate-, Match- oder User-Defined-Transformationskonfiguration, und wählen Sie Bearbeiten. Das Fenster Editor zum Konfigurieren von Transformationen wird geöffnet. 2. Klicken Sie auf dem Tab Optimale Vorgehensweisen für Eingabe auf die Schaltfläche Anlegen, und geben Sie den Namen des Eingabefelds ein. 3. Klicken Sie auf OK, um die Transformationskonfiguration zu speichern. Wenn Sie ein benutzerdefiniertes Feld in der Transformationskonfiguration anlegen, wird es in jeder Instanz der in einem Datenfluss verwendeten Transformation als verfügbares Feld angezeigt. Sie können außerdem benutzerdefinierte Felder innerhalb jeder Transformationsinstanz anlegen. Weitere Informationen Data-Quality-Transformationseditoren [Seite 189] Designer-Handbuch Transformationen PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 183 9.4 Query-Transformationen Ruft ein Dataset ab, das die angegebenen Bedingungen erfüllt. Diese Transformation ähnelt der SQL-SELECTAnweisung. Die Query-Transformation ist die mit Abstand am häufigsten verwendete Transformation. Mit der Query-Transformation können folgende Operationen ausgeführt werden: ● Auswählen (Filtern) der aus Quellen zu extrahierenden Daten ● Verknüpfen von Daten aus mehreren Quellen ● Zuordnen von Spalten von Eingabe- zu Ausgabeschemas ● Durchführen von Transaktionen und Funktionen mit den Daten ● Durchführen von Datenverschachtelungen und -entschachtelungen ● Hinzufügen neuer Spalten, verschalteter Schemas und Funktionsergebnisse zum Ausgabeschema ● Zuweisen von Primärschlüsseln zu Ausgabespalten Weitere Informationen Verschachtelte Daten [Seite 222] Referenzhandbuch: Transformationen 9.4.1 Hinzufügen von Query-Transformationen zu Datenflüssen Verwenden Sie das Symbol der Query-Transformation, um eine Query-Transformation einem Datenfluss hinzuzufügen. 1. Klicken Sie auf das Query-Symbol in der Symbolleiste. 2. Klicken Sie an einer beliebigen Stelle in einem Datenfluss-Arbeitsbereich. 3. Verbinden Sie die Query-Transformation mit Eingaben und Ausgaben. Hinweis ○ Die Eingaben für eine Query-Transformation können die Ausgabe von anderen Transformationen oder die Ausgabe von einer Quelle umfassen. ○ Die Ausgaben einer Query-Transformation können zur Eingabe für andere Transformationen oder zur Eingabe für ein Ziel werden. ○ Sie können den Inhaltstyp für die Spalten in den Daten ändern, indem Sie einen anderen Typ aus der Liste mit den Ausgabeinhaltstypen auswählen. ○ Wenn Sie eine Zieltabelle mit einer Query-Transformation mit einem leeren Ausgabeschema verbinden, füllt die Software das Ausgabeschema der Query-Transformation automatisch mit den Spalten der Zieltabelle ohne Zuordnungen. 184 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Transformationen 9.4.2 Abfrageeditor Der Abfrageeditor ist eine grafische Oberfläche zum Durchführen von Abfrageoperationen. Er enthält die folgenden Bereiche: Bereich Eingabeschema (links oben), Bereich Ausgabeschema (rechts unten) Bereich Parameter (unterer Tabbereich). Das Symbol zeigt an, dass den Tab benutzerdefinierte Einträge enthält oder dass es mindestens ein Join-Paar gibt (nur Tab FROM). Die Eingabe- und Ausgabeschemabereiche können Folgendes enthalten: Verschachtelte Schemas und Funktionen (nur Ausgabe). In der Eingabeschema- und Ausgabeschema-Liste wird das aktuell ausgewählte Schema in jedem Bereich angezeigt. Das aktuell ausgewählte Ausgabeschema wird als aktuelles Schema bezeichnet und bestimmt folgende Elemente: ● Die Ausgabeelemente, die geändert werden können (hinzugefügt, zugeordnet oder gelöscht) ● Den Umfang der Tabs Auswählen bis Sortieren nach im Parameterbereich Das aktuelle Schema wird hervorgehoben, während alle anderen (nicht aktuellen) Ausgabeschemas ausgegraut sind. 9.4.2.1 Ändern des aktuellen Ausgabeschemas Sie können ein Schema, eine Spalte oder Funktionen im Bereich „Ausgabeschema“ als aktuell festlegen. Sie können folgende Aufgaben ausführen: ● Wählen Sie ein Schema aus der Ausgabeliste aus, sodass es hervorgehoben ist. ● Klicken Sie mit der rechten Maustaste auf ein Schema, eine Spalte oder eine Funktion im Ausgabeschemabereich, und wählen Sie Als aktuell festlegen aus. ● Doppelklicken Sie auf eines der nicht als aktuell festgelegten (ausgegrauten) Elemente im Ausgabeschemabereich. 9.4.2.2 Ändern des Inhalts von Ausgabeschemas Im Ausgabeschemabereich werden die Felder angezeigt, die von der Transformation ausgegeben werden und zu den Eingabefeldern für die nachgelagerte Transformation im Datenfluss werden. Sie können das Ausgabeschema auf verschiedene Weise ändern: ● Ziehen Sie per Drag-und-Drop (oder mit Kopieren und Einfügen) Spalten oder verschachtelte Schemas vom Eingabeschemabereich in den Ausgabeschemabereich, um einfache Zuordnungen anzulegen. ● Führen Sie mithilfe der Optionen im Kontextmenü für Ausgabeelemente Folgendes aus: ○ Fügen Sie neue Ausgabespalten und -schemas hinzu. ○ Generieren Sie neue Ausgabespalten mithilfe von Funktionsaufrufen. ○ Weisen Sie Ausgabespalten Primärschlüsseleinstellungen zu, oder machen Sie sie rückgängig. Primärschlüsselspalten werden durch ein Schlüsselsymbol gekennzeichnet. Designer-Handbuch Transformationen PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 185 ○ Heben Sie die Verschachtelung von Schemas auf, oder verschachteln Sie diese. ● Verwenden Sie den Tab Zuordnung, um komplexe Spaltenzuordnungen auszuführen. Ziehen Sie per Dragund-Drop Eingabeschemas und -spalten in das Ausgabeschema, um den Editor zu aktivieren. Legen Sie mit dem Funktionsassistenten und Smart Editor Ausdrücke an. Wenn der Texteditor aktiviert ist, können Sie über die Schaltflächen oberhalb des Editors auf diese Funktionen zugreifen. ● Mit den Tabs Auswählen bis Sortieren nach können Sie dem aktuellen Schema weitere Parameter hinzuzufügen (ähnlich wie SQL-SELECT-Anweisungsklauseln). Sie können Schemas und Spalten per Dragund-Drop in diese Bereiche ziehen. Tabelle 66: Tabname Beschreibung Auswählen Gibt an, ob nur eindeutige Zeile ausgegeben (und Dublettenzeilen verworfen) werden sollen. Von Listet alle Eingabeschemas auf. Sie können hier Join-Paare und -Bedingungen angeben und für jedes Eingabeschema den Join-Rang und Cache eingeben. Die resultierende SQL-FROM-Klausel wird ange zeigt. Wobei Gibt Bedingungen an, die bestimmen, welche Zeilen ausgegeben werden. Geben Sie die Bedingungen unter Verwendung der SQL-Syntax ein (wie eine WHERE-Klausel in einer SQL-SELECT-Anweisung). Beispiel: <TABLE1.EMPNO> = <TABLE2.EMPNO> AND <TABLE1.EMPNO> > 1000 OR <TABLE2.EMPNO> < 9000 Hilfe zum Anlegen von Ausdrücken erhalten Sie über die Schaltflächen Funktionen, Domänen und Smart Editor. Gruppieren nach Gibt an, wie die Ausgabezeilen gegebenenfalls zu gruppieren sind. Sortieren nach Gibt an, wie die Ausgabezeilen gegebenenfalls anzuordnen sind. ● Verwenden Sie den Tab Suchen, um nach Eingabe- und Ausgabeelementen zu suchen, die einen bestimmten Begriff enthalten. 9.5 Data-Quality-Transformationen Bei den Data-Quality-Transformationen handelt es sich um eine Gruppe von Transformationen, die zur Verbesserung der Datenqualität beitragen. Mit den Transformationen können Sie Ihre Kunden- und Betriebsdaten parsen, standardisieren, korrigieren und mit zusätzlichen Informationen versehen. Zu den Data-Quality-Transformationen gehören die folgenden Transformationen: ● Associate ● Country ID 186 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Transformationen ● Data Cleanse ● DSF2 Walk Sequencer ● Global Address Cleanse ● Global Suggestion Lists ● Match ● USA Regulatory Address Cleanse ● User-Defined Weitere Informationen Referenzhandbuch: Transformationen 9.5.1 Hinzufügen von Data-Quality-Transformationen zu Datenflüssen Data-Quality-Transformationen können nicht direkt mit vorgelagerten Transformationen verbunden werden, die verschachtelte Tabellen enthalten oder generieren. Dies kommt häufig in Echtzeit-Datenflüssen vor, insbesondere in solchen, die Abgleichvorgänge ausführen. Um diese Transformationen zu verbinden, müssen Sie entweder eine Query-Transformation oder eine XML-Pipeline-Transformation zwischen der Transformation mit der verschachtelten Tabelle und der Data-Quality-Transformation einfügen. 1. Öffnen Sie ein Datenflussobjekt. 2. Öffnen Sie die Objektbibliothek, sofern nicht bereits geöffnet. 3. Navigieren Sie zum Tab Transformationen. 4. Klappen Sie den Data-Quality-Transformationsordner auf, und wählen Sie die Transformation oder die Transofrmationskonfiguration aus, die Sie dem Datenfluss hinzufügen möchten. 5. Ziehen Sie das Symbol für die Transformation oder die Transformationskonfiguration in den DatenflussArbeitsbereich. Wenn Sie eine Transformation ausgewählt haben, für die Transformationskonfigurationen zur Verfügung stehen, werden Sie in einem Dialogfenster aufgefordert, eine Transformationskonfiguration auszuwählen. 6. Zeichnen Sie die Datenflussverbindungen ein. Um eine Quelle oder Transformation mit einer anderen Transformation zu verbinden, klicken Sie auf das Quadrat am rechten Rand der Quelle oder der vorgelagerten Transformation und ziehen den Cursor zum Pfeil am linken Rand der Data-Quality-Transformation. ○ Die Eingabe für die Transformation könnte die Ausgabe von einer anderen Transformation oder die Ausgabe von einer Quelle sein; oder die Transformation erfordert eventuell keine Quelldaten. ○ Sie können die Ausgabe der Transformation mit der Eingabe einer anderen Transformation oder eines Ziels verbinden. 7. Doppelklicken Sie auf den Namen der Transformation. Dadurch wird der Transformationseditor geöffnet, in dem Sie die Definition der Transformation abschließen können. Designer-Handbuch Transformationen PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 187 8. Wählen Sie im Eingabeschema die Eingabefelder aus, die Sie zuordnen möchten, und ziehen Sie sie zum entsprechenden Feld auf dem Tab Eingabe. Auf diese Weise wird das Eingabefeld einem Feldnamen zugeordnet, der von der Transformation erkannt wird, so dass die Transformation ihn korrekt verarbeiten kann. Ein Eingabefeld namens "Unternehmen" würde beispielsweise dem Feld "Unternehmen" zugeordnet werden. Wenn Sie Inhaltstypen für die Eingabe definieren, werden diese Spalten automatisch den entsprechenden Eingabefeldern zugeordnet. Sie können den Inhaltstyp für die Spalten in den Daten ändern, indem Sie einen anderen Typ aus der Liste mit den Ausgabeinhaltstypen auswählen. 9. Für die Associate-, Match- und User-Defined-Transformationen können auf dem Tab Eingabe benutzerdefinierte Felder hinzufügt werden. Hierfür haben Sie zwei Möglichkeiten: ○ Klicken Sie auf die erste leere Zeile unten in der Tabelle, und drücken Sie F2 auf der Tastatur. Geben Sie den Namen des Felds ein. Wählen Sie das entsprechende Eingabefeld aus der Drop-Down-Liste aus, um das Feld zuzuordnen. ○ Ziehen Sie das entsprechende Eingabefeld zur ersten leeren Zeile unten in der Tabelle. Um das benutzerdefinierte Feld umzubenennen, klicken Sie auf den Namen, drücken F2 auf der Tastatur und geben den neuen Namen ein. 10. Wählen Sie auf dem Tab Optionen die entsprechenden Optionswerte aus, um festzulegen, wie die Transformation Ihre Daten verarbeitet. ○ Stellen Sie sicher, dass Sie vor dem Festlegen von Optionswerten Eingabefelder zuordnen, da bei manchen Transformationen die verfügbaren Optionen und Optionswerte von den zugeordneten Eingabefeldern abhängen. ○ Für die Associate-, Match- und User-Defined-Transformationen können die Optionen nicht auf dem Tab "Optionen" bearbeitet werden. Sie müssen die Optionen im Associate-, Match- und User-Defined -Editor festlegen. Sie greifen auf diese Editoren zu, indem Sie entweder auf die Schaltfläche "Optionen bearbeiten" auf dem Tab "Optionen" klicken oder mit der rechten Maustaste auf die Transformation im Datenfluss klicken. Wenn Sie bei einem Optionswert einen anderen Wert als den standardmäßig festgelegten wählen, wird neben dem Optionsnamen ein grünes Dreieck angezeigt, das die von Ihnen vorgenommene Überschreibung angibt. 11. Doppelklicken Sie auf dem Tab Ausgabe auf die Felder, die auf der Transformation ausgegeben werden sollen. Data-Quality-Transformationen können neben den Eingabefeldern, die die Transformation verarbeitet, andere Felder generieren, sodass Sie viele Felder ausgeben können. Stellen Sie sicher, dass Sie die Optionen festlegen, bevor Sie die Ausgabefelder zuordnen. Die ausgewählten Felder werden im Ausgabeschema angezeigt. Das Ausgabeschema dieser Transformation wird zum Eingabeschema der nächsten Transformation im Datenfluss. 12. Wenn Sie Daten durch die Transformation leiten möchten, ohne diese zu verarbeiten, ziehen Sie Felder direkt vom Eingabeschema zum Ausgabeschema. 13. Um ein Ausgabefeld umzubenennen oder die Größe zu ändern, doppelklicken Sie auf das Ausgabefeld, und bearbeiten Sie die Eigenschaften im Fenster Spalteneigenschaften. Weitere Informationen Referenzhandbuch: Data-Quality-Felder Data-Quality-Transformationseditoren [Seite 189] 188 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Transformationen 9.5.2 Data-Quality-Transformationseditoren Die Data-Quality-Editoren bieten grafische Benutzeroberflächen zum Festlegen von Feldern und Optionen für die Ein- und Ausgabe. Die Benutzeroberflächen enthalten folgende Bereiche: Eingabeschemabereich (oben links), Ausgabeschemabereich (oben rechts) und Parameterbereich (unterer Tabbereich). Der Parameterbereich enthält drei Tabs: "Eingabe", "Optionen" und "Ausgabe". Generell empfiehlt es sich, die Tabs in dieser Reihenfolge auszufüllen, da die verfügbaren Parameter in einem Tab von den ausgewählten Parametern auf des vorherigen Tabs abhängen können. Eingabeschemabereich Im Eingabeschemabereich werden die Eingabefelder angezeigt, die die Ausgabe der vorgelagerten Transformation im Datenfluss sind. Ausgabeschemabereich Im Ausgabeschemabereich werden die Felder angezeigt, die von der Transformation ausgegeben werden und zu den Eingabefeldern für die nachgelagerte Transformation im Datenfluss werden. Eingabe (Tab) Auf dem Tab "Eingabe" werden die verfügbaren Feldnamen angezeigt, die von der Transformation erkannt werden. Sie ordnen diese Felder den Eingabefeldern im Eingabeschemabereich zu. Durch die Zuordnung von Eingabefeldern zu Feldnamen, die von der Transformation erkannt werden, erhält die Transformation die Anweisung, wie das jeweilige Feld zu verarbeiten ist. Tab „Optionen“ Der Tab "Optionen" enthält Business-Regeln, die vorgeben, wie die Transformation die Daten verarbeitet. Jede Transformation verfügt über eine andere Gruppe von verfügbaren Optionen. Wenn Sie bei einem Optionswert einen anderen Wert als den standardmäßig festgelegten wählen, wird neben dem Optionsnamen ein grünes Dreieck angezeigt, das die von Ihnen vorgenommene Überschreibung angibt. Bei den Associate-, Match- und User-Defined-Transformationen können die Optionen nicht direkt auf dem Tab „Optionen“ bearbeitet werden. Stattdessen müssen Sie die Associate-, Match- und User-Defined-Editoren verwenden, auf die Sie über die Schaltfläche „Optionen bearbeiten“ zugreifen können. Designer-Handbuch Transformationen PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 189 Ausgabe (Tab) Auf dem Tab "Ausgabe" werden die Feldnamen angezeigt, die die Transformation ausgeben kann. Data-QualityTransformationen können neben den Eingabefeldern, die die Transformation verarbeitet, andere Felder generieren, sodass Sie viele Felder ausgeben können. Diese zugeordneten Ausgabefelder werden im Ausgabeschemabereich angezeigt. Filter und Sortierungen Die Tabs "Eingabe", "Optionen" und "Ausgabe" bieten Filter, mit denen Sie festlegen können, welche Felder in den Tabs angezeigt werden. Tabelle 67: Filter Beschreibung Optimale Vorgehensweise Zeigt die Felder oder Optionen an, die als optimale Vorgehensweise für den jeweiligen Transfor mationstyp angegeben wurden. Hierbei handelt es sich allerdings nur um Vorschläge. Unter Um ständen erfüllen sie nicht die Verarbeitungs- oder Ausgabeanforderungen an Ihre Daten. In den mit der Software bereitgestellten Transformationskonfigurationen sind keine Eingabefel der der optimalen Vorgehensweise angegeben. In Verwendung Zeigt die Felder an, die einem Ein- oder Ausgabefeld zugeordnet wurden. Alle Zeigt alle verfügbaren Felder an. Der Tab "Ausgabe" bietet zusätzliche Filter- und Sortierungsmöglichkeiten, wenn Sie auf die Spaltenköpfe klicken. Sie können jede Datenspalte so filtern, dass ein oder mehrere Werte angezeigt werden, und außerdem die Felder in auf- und absteigender Reihenfolge sortieren. Symbole im Spaltenkopf weisen darauf hin, ob auf die Spalte ein Filter oder eine Sortierung angewendet wurde. Da Sie für mehrere Spalten Filterungen und Sortierungen ausführen können, werden diese von links nach rechts angewendet. Das Filter- und Sortierungsmenü steht nicht zur Verfügung, wenn nur ein Elementtyp in der Spalte vorliegt. Eingebettete Hilfe Die eingebettete Hilfe unterstützt Sie, wenn Sie mehr Informationen zu Data-Services-Transformationen und Optionen benötigen. Die Themen passen sich jeweils dem Kontext an, in dem Sie gerade arbeiten. Wenn Sie eine neue Transformation oder eine neue Optionsgruppe auswählen, wird das Thema gemäß dieser Auswahl entsprechend aktualisiert. Sie können auch mithilfe von Hyperlinks innerhalb eines geöffneten Themas zu anderen Themen navigieren. 190 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Transformationen Editoren für die Associate-, Match- und User-Defined-Transformation Um Optionsinformationen für die Associate-, Match- und User-Defined-Transformationen einzusehen, müssen Sie deren jeweiligen Editor öffnen, indem Sie die Transformation im Datenfluss auswählen und dann <Transformation> Editor Extras wählen. Hinweis Sie können nicht auf die Match-Editoroptionen zugreifen, während Sie im Datenbereinigungsassistenten von Information Steward angelegte Datenflüsse überprüfen. Match-Transformationsoptionen können nicht bearbeitet werden. Daher sind die Steuerelemente zum Zugriff auf den Match-Editor inaktiv. Weitere Informationen Editoren für die Associate-, Match- und User-Defined-Transformation [Seite 191] 9.5.2.1 Editoren für die Associate-, Match- und User-DefinedTransformation Die Associate, Match und User-Defined-Transformationen haben jeweils ihren eigenen Editor, in dem Sie Optionsgruppen und Bearbeitungsoptionen hinzufügen können. Die Editoren für diese Transformationen haben eine ähnliche Optik und Funktion und in einigen Fällen sogar dieselben Optionsgruppen. Designer-Handbuch Transformationen PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 191 Das Editorfenster ist in vier Bereiche unterteilt: 1. Optionsübersicht – In diesem Bereich wählen Sie die Optionsgruppen oder Operationen aus, die für die Transformation zur Verfügung stehen. Um eine verborgene Optionsgruppe einzublenden, klicken Sie mit der rechten Maustaste auf die zugehörige Optionsgruppe. Wählen Sie dann den Namen der Optionsgruppe aus dem Menü aus. 2. Optionseditor – In diesem Bereich geben Sie den Wert der Option an. 3. Schaltflächen – Hiermit können Sie Optionsgruppen hinzufügen, entfernen und sortieren. 4. Eingebettete Hilfe – Hier werden zusätzliche Informationen über die Verwendung des aktuellen Editorbildschirms angezeigt. Weitere Informationen Referenzhandbuch: Transformationen, Associate Referenzhandbuch: Transformationen, Match Referenzhandbuch: Transformationen, User-Defined 9.5.2.2 Editor für sortierte Optionen Bei einigen Transformationen können Sie die Reihenfolge mehrerer Werte für eine einzige Option wählen und festlegen. 192 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Transformationen Ein Beispiel ist die Parser-Sequenz-Option der Data Cleanse-Transformation. So konfigurieren Sie eine sortierte Option: 1. Klicken Sie auf die Schaltflächen Hinzufügen und Entfernen, um Optionswerte zwischen den Wertelisten "Verfügbar" und "Ausgewählt" zu verschieben. Hinweis Entfernen Sie alle Werte. Um die Werteliste "Aausgewählt" zu löschen und alle Optionswerte in die Werteliste "Verfügbar" zu verschieben, klicken Sie auf Alle entfernen. 2. Wählen Sie in der Werteliste "Verfügbar" einen Wert aus, und klicken Sie auf die Schaltflächen "Pfeil nach oben" und "Pfeil nach unten", um die Position der Werte in der Liste zu ändern. 3. Klicken Sie auf OK, um die Änderungen an der Optionskonfiguration zu speichern. Die Werte sind im Designer aufgeführt und durch Pipe-Zeichen getrennt. 9.6 Text-Data-Processing-Transformationen Text-Data-Processing-Transformationen helfen Ihnen bei der Extraktion spezifischer Informationen aus dem Text. Mithilfe dieser Transformationen können Sie große Textmengen parsen, Einheiten und Fakten wie Kunden,Produkte, Standorte und finanzielle Informationen, die für Ihr Unternehmen relevant sind, identifizieren und extrahieren. Die folgenden Abschnitte enthalten einen Überblick über diese Funktionen sowie über die EntityExtraction-Transformation. 9.6.1 Textdatenverarbeitung – Übersicht Die Textdatenverarbeitung kann automatisch die Sprache des eingegebenen Textes ermitteln und sprachspezifische Wörterbücher und Regeln für die Analyse auswählen, um Einheiten, einschließlich Personen, Datumsangaben, Orte, Unternehmen und so weiter, in den entsprechenden Sprachen zu extrahieren. Zudem wird nach Mustern, Aktivitäten, Ereignissen und Beziehungen zwischen Einheiten gesucht und ihre Extraktion ermöglicht. Durch die Extraktion solcher Informationen aus Text erfahren Sie, worum es in dem Text geht. – Diese Informationen können in Anwendungen für Informationsverwaltung, Datenintegration und Datenqualität; Business Intelligence; Abfrage, Analyse und Berichtserstellung; Suche, Navigation, Dokument- und Inhaltsverwaltung; sowie in weiteren Anwendungsszenarien verwendet werden. Die Textdatenverarbeitung geht über herkömmliche Zeichenabgleichstools für den Informationsabruf hinaus, die nur nach genauen Übereinstimmungen für bestimmte Zeichenfolgen suchen können. Bei der Textdatenverarbeitung wird die Bedeutung von Wörtern berücksichtigt. Neben dem Abgleich mit bekannten Einheiten werden durch eine ergänzende Funktion neue Einheiten erkannt. Zur Anpassung der Einheitenextraktion können Sie in der Software eine eigene Liste von Einheiten in einem benutzerdefinierten Wörterbuch angeben. In diesen Wörterbüchern können Sie Einheiten speichern und Namensvariationen verwalten. Namen von bekannten Einheiten können mithilfe eines Wörterbuchs standardisiert werden. Designer-Handbuch Transformationen PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 193 Bei der Textdatenverarbeitung werden automatisch wichtige Informationen aus Textquellen extrahiert, um den manuellen Aufwand für Überprüfung und Tagging zu reduzieren. Dadurch können wiederum die Kosten gesenkt werden, die mit dem Identifizieren wichtiger Informationen in Text verbunden sind. Der Zugriff auf relevante Informationen in unstrukturiertem Text kann dazu beitragen, die Abläufe zu rationalisieren und nicht notwendige Kosten zu reduzieren. In Data Services bezieht Textdatenverarbeitung sich auf eine Gruppe von Transformationen, die Informationen aus unstrukturierten Daten extrahieren und strukturierte Daten anlegen, welche von verschiedenen BusinessIntelligence-Tools verwendet werden können. 9.6.2 Entity-Extraction-Transformation – Übersicht Die Textdatenverarbeitung erfolgt in der Software mithilfe der Entity-Extraction-Transformation. Die Entity-Extraction-Transformation extrahiert Einheiten und Fakten aus unstrukturiertem Text. Die Extraktion beinhaltet das Verarbeiten und Analysieren von Text, das Ermitteln von Sprachen, das Suchen von Zieleinheiten, das Zuweisen dieser Zieleinheiten zum entsprechenden Typ sowie das Präsentieren dieser Metadaten in einem Standardformat. Mithilfe von Wörterbüchern und Regeln können Sie die Extraktionsausgabe so anpassen, dass sie die darin definierten Einheiten einschließt. Es gibt für Ihren Informationsbedarf verschiedenste Extraktionsanwendungen. Einige Beispiele für Informationen, die mithilfe dieser Transformation extrahiert werden können, finden Sie hier: ● Gemeinsames Auftreten und Assoziationen von Markennamen, Unternehmensnamen, Menschen, Betriebsstoffen und vieles mehr. ● Wettbewerbs- und Marketinginformationen wie die Aktivitäten des Wettbewerbs, Fusions- und Übernahmeereignisse, Pressemitteilungen, Kontaktdaten usw. ● Die Assoziationen, Aktivitäten oder die Rolle einer Person bei einem bestimmten Ereignis. ● Informationen zu Kundenbeanstandungen, Fehlerberichte oder Patienteninformationen wie Nebenwirkungen von Medikamenten. ● Verschiedene alphanumerische Muster wie IDs, Vertragsdatumsangaben, Gewinne usw. 9.6.2.1 Einheiten und Fakten – Überblick Einheiten stehen für Namen von Personen, Orten und Elementen, die extrahiert werden können. Einheiten werden als ein aus Name und Typ bestehendes Paar definiert. Typ bezeichnet die Hauptkategorie einer Einheit. Nachfolgend einige Beispiele für Einheiten: ● Paris ist eine Einheit mit dem Namen "Paris" und dem Typ ORTSCHAFT. ● Mr. Joe Smith ist eine Einheit mit dem Namen „Mr. Joe Smith“ und dem Typ PERSON. Einheiten können Untertypen haben. Ein Untertyp ist eine weitere Klassifizierung einer Einheit. Er ist eine hierarchische Spezifikation eines Einheitstyps, der eine Unterscheidung zwischen unterschiedlichen semantischen Varianten desselben Einheitstyps ermöglicht. Ein Untertyp kann als Unterkategorie einer Einheit beschrieben werden. Nachfolgend einige Beispiele für Einheiten und Untertypen: 194 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Transformationen ● Boeing 747 ist eine Einheit des Typs FAHRZEUG mit dem Untertyp LUFT. ● Mercedes-Benz SL500 ist eine Einheit des Typs FAHRZEUG mit dem Untertyp LAND. ● SAP ist eine Einheit des Typs ORGANISATION mit dem Untertyp GEWERBLICH. Fakten bezeichnen ein Muster, das einen Ausdruck anlegt, um Informationen wie Stimmungen, Ereignisse oder Beziehungen zu extrahieren. Fakten werden anhand benutzerdefinierter Extraktionsregeln extrahiert. Fakt ist ein Oberbegriff für Extraktionen komplexerer Muster, die eine oder mehrere Einheiten, eine Beziehung zwischen einer oder mehreren Einheiten oder ein Prädikat einer Einheit beinhalten. Fakten enthalten Kontext über die Art und Weise, wie verschiedene Einheiten im Text miteinander verbunden sind. Einheiten zeigen an sich nur an, dass sie in einem Dokument vorhanden sind, während Fakten informationen über die Beziehung dieser Einheiten untereinander enthalten. Faktentypen bezeichnen die Kategorie eines Fakts, beispielsweise Stimmungen und Forderungen. Ein Teilfakt ist eine wichtige Information, die in einen Fakt eingebettet ist. Ein Teilfakttyp kann als eine mit einem Teilfakt verbundene Kategorie beschrieben werden. Nachfolgend einige Beispiele für Fakten und Teilfakttypen: ● SAP hat Business Objects im Rahmen einer freundlichen Übernahme erworben. Dies ist ein Ereignis des Typs Mergers & Acquisitions (M&A). ● Mr. Joe Smith ist sehr verärgert wegen seinen Flugbuchungen. Dies ist ein Fakt des Typs STIMMUNG. Funktionsweise von Extraktionen Beim Extraktionsprozess wird das inhärente Wissen über die Semantik von Wörtern und den linguistischen Kontext, in dem diese Wörter auftreten, verwendet, um Einheiten und Fakten zu suchen. Beim Extraktionsprozess werden basierend auf Systemregeln spezifische Muster zum Extrahieren von Einheiten und Fakten angelegt. Sie können einem Wörterbuch Einheiten hinzufügen und benutzerdefinierte Regeln zum Anpassen der Extraktionsausgabe schreiben. Der Text und die Beispielausgabe veranschaulicht, wie unstrukturierter Inhalt zur weiteren Verarbeitung und Analyse in eine strukturierte Information transformiert werden kann. Beispiel Beispieltext und Extraktionsinformationen „Mr. Jones ist sehr verärgert über die Green Insurance Corp. Das Angebot für sein Fahrzeug mit Totalschaden ist zu niedrig. Er sagt, Green habe ihm 1250,00 € angeboten, aber sein Wagen sei zwischen 2500 € und 4500 € wert. Mr. Jones möchte, dass die umfassende Abdeckung von Green der Abdeckung anderer Wettbewerber entspricht.“ Wird dieser Beispieltext mit der Extraction-Transformation verarbeitet, mit den benutzerdefinierten Regeln für die Stimmung und die Forderung konfiguriert, werden die Informationen auf eine logische Art und Weise identifiziert und gruppiert (wobei Einheiten, Untertypen, Fakten, Faktentypen, Teilfakten und Teilfaktentypen identifiziert werden), dass sie weiterverarbeitet werden können. Die folgende Tabelle enthält Teilergebnisse mit als Einheiten, Einheitstypen, Untertypen, Fakten, Faktentypen, Teilfakten und Teilfaktentypen gekennzeichneten Informationen aus dem Beispieltext: Tabelle 68: Einheiten Einheitstyp Mr. Jones PERSON Designer-Handbuch Transformationen Untertyp PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 195 Einheiten Einheitstyp Untertyp Green Insurance ORGANISATION GEWERBLICH Green EIG_VERSCH $1250.00 WÄHRUNG Tabelle 69: Fakten Faktentyp Mr. Jones ist sehr verär STIMMUNG Teilfakt Teilfaktentyp sehr verärgert StarkesNegativesGefühl gert über die Green In surance Corp. Mr. Jones möchte, dass FORDERUNG die umfassende Abde ckung von Green der Abdeckung anderer Wettbewerber ent spricht. 9.6.2.2 Überblick über das Wörterbuch Ein Extraktionswörterbuch ist ein benutzerdefiniertes Repository, das Einheiten enthält. Dieses benutzerfreundliche Anpassungstool gibt eine Liste der Einheiten an, die die Entity-ExtractionTransformation bei der Verarbeitung von Text stets extrahieren sollte. Die Informationen werden unter der Standardform und der Variante einer Einheit klassifiziert. Unter einer Standardform können eine oder mehrere Varianten eingebettet sein. Varianten sind andere gängige Bezeichnungen einer Einheit. United Parcel Service of America ist beispielsweise die Standardform dieses Unternehmens, und United Parcel Service sowie UPS sind beides Varianten des Unternehmens. Während jede Standardform einen Typ aufweisen muss, können Varianten optional über einen eigenen Typ verfügen. Wenn United Parcel Service of America beispielsweise mit dem Standardformtyp ORGANISATION verknüpft ist, könnten Sie den Variantentyp ABKÜRZ definieren, um Abkürzungen einzubeziehen. Eine Wörterbuchstruktur kann die Standardisierung von Verweisen auf Einheiten erleichtern. Weitere Informationen finden Sie unter „Using Dictionaries“ im Text Data Processing Extraction Customization Guide. 9.6.2.3 Regelübersicht In einer Extraktionsregel werden benutzerdefinierte Muster zur Extraktion von Einheiten, Beziehungen, Ereignissen und anderen größeren Extraktionen definiert, die zusammen als "Fakten" bezeichnet werden. Sie schreiben benutzerdefinierte Extraktionsregeln, um eine Extraktion durchzuführen, die an Ihre spezifischen Anforderungen angepasst ist. 196 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Transformationen Weitere Informationen finden Sie unter „Using Extraction Rules“ im Text Data Processing Extraction Customization Guide. 9.6.3 Verwenden der Entity-Extraction-Transformation Verwenden Sie die Entity-Extraction-Transformation, um Informationen aus Inhalt im Text-, HTML-, XML-Format oder bestimmten Binärformaten (wie PDF) zu extrahieren und eine strukturierte Ausgabe zu generieren. Die Ausgabe können Sie abhängig vom Workflow auf verschiedene Weise verwenden. Sie können sie als Eingabe für eine weitere Transformation verwenden oder in mehrere Ausgabequellen wie Datenbanktabellen oder Flatfiles schreiben. Die Ausgabe wird in der Codierung UTF-16 generiert. In der folgenden Liste sind einige Szenarien für die Verwendung der Transformation alleine oder in Kombination mit anderen Data-Services-Transformationen aufgeführt. ● Suche nach bestimmten Informationen und Beziehungen in einer großen Textmenge über einen umfassenden Themenbereich. Beispiel: Ein Unternehmen interessiert sich für die Analyse des Kundenfeedbacks, das als Text in Freiform nach der Einführung eines neuen Produkts empfangen wurde. ● Verknüpfung von strukturierten Informationen, die aus unstrukturiertem Text angelegt wurden, mit vorhandenen strukturierten Informationen, um neue Verbindungen herzustellen. Beispiel: Eine Polizeiabteilung versucht, Verbindungen zwischen verschiedenen Verbrechen und Personen herzustellen, und verwendet dafür eigene Datenbanken sowie Informationen, die in verschiedenen Berichten im Textformat zur Verfügung stehen. ● Analyse und Berichtserstellung zu Problemen bei der Produktqualität, z.B. zu viele Reparaturen und Retouren für bestimmte Produkte. Beispiel: Sie verfügen über strukturierte Informationen zu Produkten, Teilen, Kunden und Lieferanten in einer Datenbank. Wichtige Informationen zu Problemen sind jedoch in Notizen enthalten: in Feldern in Wartungsdatensätzen, Reparaturprotokollen, Produkteskalationen und Protokollen des Supports. Zur Identifikation der Probleme müssen Sie Verbindungen zwischen verschiedenen Formen von Daten herstellen. 9.6.4 Unterschiede zwischen Textdatenverarbeitungs- und Data-Cleanse-Transformationen Die Entity-Extraction-Transformation bietet in bestimmten Fällen eine ähnliche Funktionalität wie die DataCleanse-Transformation, insbesondere in Bezug auf die Anpassungsfunktionen. In der Dokumentation werden die Unterschiede zwischen den beiden Transformationen beschrieben. Außerdem wird erläutert, welche Transformation Sie verwenden sollten, um Ihre Ziele zu erreichen. Die Entity-ExtractionTransformation zur Textdatenverarbeitung dient zur sinnvollen Anordnung unstrukturierter Inhalte. Mit der DataCleanse-Transformation können Sie strukturierte Daten standardisieren und bereinigen. In der folgenden Tabelle werden einige Hauptunterschiede erklärt. In vielen Fällen werden durch eine Kombination aus Entity-Extractionund Data-Cleanse-Transformationen die Daten generiert, die für Ihre Business-Intelligence-Analysen und Berichte am besten geeignet sind. Designer-Handbuch Transformationen PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 197 Tabelle 70: Kriterien Textdatenverarbeitung Data Cleanse Eingabetyp Unstrukturierter Text, für den ein linguisti sches Parsing zur Generierung relevanter Informationen erforderlich ist. Strukturierte Daten, die als Felder in Datensätzen dargestellt werden. Eingabegröße Mehr als 5 KB an Text. Weniger als 5 KB an Text. Eingabeumfang Üblicherweise breite Domäne mit vielen Variationen. Spezifische Datendomäne mit eingeschränkten Variationen. Zugehörige Auf gabe Inhaltsermittlung, Reduzierung von Stö rungen, Musterabgleich und Beziehung zwischen verschiedenen Einheiten. Wörterbuchsuche, Musterabgleich. Potenzielle Ver wendung Identifikation potenziell wichtiger Informa tionen in unstrukturiertem Inhalt und Ex traktion in ein Format, das in einem Repo sitory gespeichert werden kann. Gewährleistung der Qualität von Daten für den Abgleich und das Speichern in einem Repository wie etwa Meta Data Management. Ausgabe Legt geparste und standardisierte Felder an. Bei Bedarf wird Anlegen von Annotationen zum Quelltext in Form von Einheiten, Einheitstypen, Fak die Eingabe geändert. ten, deren Versatz, Länge usw. Die Eingabe wird nicht geändert. 9.6.5 Verwenden mehrerer Transformationen Beziehen Sie mehrere Transformationen in denselben Datenfluss ein, um verschiedene Analysen für unstrukturierte Informationen auszuführen. Um beispielsweise die in einem Text eingebetteten Namen und Adressen zu extrahieren und die extrahierten Informationen zu validieren, bevor Sie dafür Analysen ausführen, könnten Sie wie folgt vorgehen: ● Verwenden Sie die Entity-Extraction-Transformation, um den Text mit den Namen und Adressen zu verarbeiten und verschiedene Einheiten zu extrahieren. ● Übergeben Sie die Extraktionsausgabe an die Case-Transformation, um festzustellen, welche Zeilen Namen und welche Zeilen Adressen darstellen. ● Verwenden Sie die Data-Cleanse-Transformation, um die extrahierten Namen zu standardisieren, und die Global-Address-Cleanse-Transformation, um die extrahierten Adressdaten zu validieren und zu korrigieren. Hinweis Um die richtigen Daten zu generieren, berücksichtigen Sie die Felder standard_form und type im Ausgabeschema der Entity-Extraction-Transformation, und ordnen Sie das Feld type in der CaseTransformation basierend auf dem Einheitstyp, wie z.B. PERSON oder ADRESSE1, zu. Danach ordnen Sie alle Einheiten vom Typ PERSON der Case-Transformation der Data-Cleanse-Transformation und alle Einheiten vom Typ ADRESSE1 der Global-Address-Cleanse-Transformation zu. 198 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Transformationen 9.6.6 Beispiele für die Verwendung der Entity-ExtractionTransformation Beschreibt einige Beispiele für die Verwendung der Entity Extraction-Transformation. Das Szenario: Eine Personalabteilung möchte Lebensläufe analysieren, die in verschiedenen Formaten vorliegen. Diese Formate umfassen Folgendes: ● Textdatei als Anlage einer E-Mail ● Lebenslauf in Textform, der in ein Feld auf der Website des Unternehmens eingefügt wurde ● Aktualisierungen für den Inhalt von Lebensläufen, die die Abteilung in Echtzeit verarbeiten möchte Beispiel Textdatei als Anlage zu E-Mails Die Personalabteilung empfängt häufig Lebensläufe von Bewerbern, die E-Mails als Anlagen hinzugefügt wurden. Diese Anlagen werden in einem separaten Verzeichnis auf einem Server gespeichert. Gehen Sie wie folgt vor, um diese Textdateien zu analysieren und die Daten aus diesen Dateien zu verarbeiten: 1. Konfigurieren Sie ein Dateiformat Unstrukturierter Text, das auf das Verzeichnis mit den Lebensläufen verweist. 2. Legen Sie einen Datenfluss an, der das Dateiformat "Unstrukturierter Text" als Quelle, eine Entity Extraction-Transformation und ein Ziel enthält. 3. Konfigurieren Sie die Transformation für die Verarbeitung und Analyse des Textes. Beispiel Lebenslauf in Textform, der in ein Feld auf einer Website eingefügt wurde Das Online-Bewerbungsformular der Personalabteilung enthält ein Feld, in das Bewerber ihren Lebenslauf einfügen können. Dieses Feld wird in einer Spalte einer Datenbanktabelle erfasst. Gehen Sie wie folgt vor, um die Datenbank zu analysieren und die Daten aus dieser Datenbank zu verarbeiten: 1. Konfigurieren Sie über einen Datastore eine Verbindung zu der Datenbank. 2. Legen Sie einen Datenfluss an, der die Datenbanktabelle als Quelle, eine Entity Extraction-Transformation und ein Ziel enthält. 3. Konfigurieren Sie die Transformation für die Verarbeitung und Analyse des Textes. Beispiel Aktualisierter Inhalt, der in Echtzeit verarbeitet werden soll Angenommen, die Personalabteilung sucht einen Bewerber mit einer bestimmten Qualifikation. Wenn der Bewerber seinen Lebenslauf in dem webbasierten Formular des Unternehmens mit der gewünschten Qualifikation aktualisiert, möchte der Manager in der Personalabteilung sofort benachrichtigt werden. Verwenden Sie einen Echtzeitjob, um diese Funktionalität zu aktivieren. Gehen Sie wie folgt vor, um die Daten in Echtzeit zu analysieren und zu verarbeiten: 1. Fügen Sie einen Echtzeitjob hinzu, der eine Markierung für den Anfang und das Ende sowie einen Datenfluss enthält. Verbinden Sie die Objekte. Designer-Handbuch Transformationen PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 199 2. Legen Sie den Datenfluss aus einer Meldungsquelle, einer Entity Extraction-Transformation und einem Meldungsziel an. 3. Konfigurieren Sie die Transformation für die Verarbeitung und Analyse des Textes. Weitere Informationen Unstrukturierte Dateiformate [Seite 142] Datenbank-Datastores [Seite 67] Echtzeitjobs [Seite 257] 9.6.7 Hinzufügen einer Textverarbeitungs-Transformation zu einem Datenfluss Durch Hinzufügen dieser Transformation zu Ihrem Datenfluss können Sie Informationen (Einheiten und Fakten) aus Inhalt im Text-, HTML, XML- oder Binärformat wie PDF extrahieren. 1. Öffnen Sie ein Datenflussobjekt. 2. Öffnen Sie die lokale Objektbibliothek, wenn Sie nicht bereits offen ist. 3. Navigieren Sie zum Tab Transformationen. 4. Klappen Sie den Transformationsordner Textdatenverarbeitung auf, und wählen Sie die Transformation oder Transformationskonfiguration, die Sie zum Datenfluss hinzufügen möchten. 5. Ziehen Sie das Symbol für die Transformation oder die Transformationskonfiguration in den DatenflussArbeitsbereich. Wenn Sie eine Transformation ausgewählt haben, für die Transformationskonfigurationen zur Verfügung stehen, werden Sie in einem Dialogfenster aufgefordert, eine Transformationskonfiguration auszuwählen. 6. Zeichnen Sie die Datenflussverbindungen ein. Um eine Verbindung zwischen einer Quelle oder einer Transformation und einer anderen Transformation herzustellen, klicken Sie auf das Quadrat auf der rechten Seite der Quelle oder vorgelagerten Transformation, und ziehen Sie den Cursor zu dem Pfeil auf der linken Seite der Textverarbeitungs-Transformation. ○ Die Eingabe für die Transformation kann ggf. die Ausgabe einer anderen Transformation oder einer Datenquelle sein. ○ Sie können die Ausgabe der Transformation mit der Eingabe einer anderen Transformation oder eines Ziels verbinden. 7. Doppelklicken Sie auf den Namen der Transformation. Dadurch wird der Transformationseditor geöffnet, in dem Sie die Definition der Transformation abschließen können. 8. Wählen Sie im Eingabeschema das Eingabefeld aus, das Sie zuordnen möchten, und ziehen Sie es zum entsprechenden Feld auf dem Tab Eingabe. Auf diese Weise wird das Eingabefeld einem Feldnamen zugeordnet, der von der Transformation erkannt wird, so dass die Transformation ihn korrekt verarbeiten kann. Beispiel: ○ würde ein Eingabefeld mit der Bezeichnung Inhalt dem Eingabefeld TEXT zugeordnet. 200 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Transformationen ○ ein Eingabefeld, das den Inhalt eindeutig identifiziert, würde dem Eingabefeld TEXT_ID zugeordnet. 9. Wählen Sie auf dem Tab Optionen die entsprechenden Optionswerte aus, um festzulegen, wie die Transformation Ihre Daten verarbeitet. Stellen Sie sicher, dass Sie die Eingabefelder zuordnen, bevor Sie die Optionswerte festlegen. Wenn Sie bei einem Optionswert einen anderen Wert als den standardmäßig festgelegten wählen, wird neben dem Optionsnamen ein grünes Dreieck angezeigt, das die von Ihnen vorgenommene Überschreibung angibt. 10. Doppelklicken Sie auf dem Tab Ausgabe auf die Felder, die auf der Transformation ausgegeben werden sollen. Transformationen können zusätzlich zu den Eingabefeldern, die die Transformation verarbeitet, Felder generieren, deshalb können Sie viele Felder ausgeben. Stellen Sie sicher, dass Sie die Optionen festlegen, bevor Sie die Ausgabefelder zuordnen. Die ausgewählten Felder werden im Ausgabeschema angezeigt. Das Ausgabeschema dieser Transformation wird zum Eingabeschema der nächsten Transformation im Datenfluss. 11. Wenn Sie Daten durch die Transformation leiten möchten, ohne diese zu verarbeiten, ziehen Sie Felder direkt vom Eingabeschema zum Ausgabeschema. 12. Um ein Ausgabefeld umzubenennen oder die Größe zu ändern, doppelklicken Sie auf das Ausgabefeld, und bearbeiten Sie die Eigenschaften im Fenster Spalteneigenschaften. Weitere Informationen Editor für die Entity-Extraction-Transformation [Seite 201] Referenzhandbuch: Entity-Extraction-Transformation, Eingabefelder Referenzhandbuch: Entity-Extraction-Transformation, Ausgabefelder Referenzhandbuch: Entity-Extraction-Transformation, Extraktionsoptionen 9.6.8 Editor für die Entity-Extraction-Transformation Die Optionen der Entity-Extraction-Transformation geben verschiedene Parameter zum Verarbeiten von Inhalt mithilfe der Transformation an. Mithilfe von Filteroptionen, unter verschiedenen Extraktionsoptionen, können Sie die extrahierten Einheiten und Fakten auf bestimmte Einheiten aus einem Wörterbuch, den Systemdateien, Einheiten/Fakten aus Regeln oder einer Kombination davon begrenzen. Extraktionsoptionen werden in folgende Kategorien unterteilt: ● Allgemein Diese Option wird gewählt, um festzulegen, dass die Entity-Extraction-Transformation als ein separater Prozess ausgeführt werden muss. ● Sprachen Verwenden Sie diese Option, um die Sprache für den Extraktionsprozess festzulegen. ○ Sprache – Der Standard ist „Automatisch“. Dadurch wird die Transformation zum Versuch aufgefordert, die Sprache zu ermitteln. Sie können eine andere Sprache aus einer Liste auswählen. ○ Standardsprache – Sie können die Sprache auswählen, die angenommen werden soll, wenn die Transformation die Sprache nicht ermitteln konnte. Designer-Handbuch Transformationen PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 201 ○ Nach Einheitstypen filtern ist optional. Sie können diese Option auswählen, wenn Sie die Sprache auswählen, um die Extraktionsausgabe zu begrenzen. ● Verarbeitungsoptionen Verwenden Sie diese Optionen, um die beim Verarbeiten des Inhalts zu verwendenden Parameter festzulegen. ● Wörterbücher Verwenden Sie diese Option, um verschiedene Wörterbücher festzulegen, die für die Verarbeitung des Inhalts verwendet werden sollen. Um die Filteroption Einheitstypen verwenden zu können, müssen Sie die Wörterbuchdatei angeben. Hinweis Textdatenverarbeitung schließt die Wörterbuchschemadatei extraction-dictionary.xsd ein. Diese Datei ist standardmäßig im Ordner VERKNÜPFUNGSVERZ/bin installiert, wobei VERKNÜPFUNGSVERZ Ihr Data-Services-Installationsverzeichnis ist. Wenn Sie eigene Wörterbuchdateien anlegen möchten, beziehen Sie sich auf dieses Schema. ● Regeln Verwenden Sie diese Option, um verschiedene Regeldateien festzulegen, die für die Verarbeitung des Inhalts verwendet werden sollen. Um die Filteroption Regelnamen verwenden zu können, müssen Sie die Regeldatei angeben. Wenn Sie keine Filteroptionen angeben, enthält die Extraktionsausgabe alle Einheiten, die mit den in der ausgewählten Sprache, den ausgewählten Wörterbuchdateien und Regelnamen in den ausgewählten Regeldateien definierten Einheitstypen extrahiert wurden. Hinweis Die Auswahl einer Wörterbuchdatei oder einer Regeldatei im Extraktionsprozess ist optional. Die Extraktionsausgabe schließt deren Einheiten ein, wenn sie angegeben sind. Viele der Optionen können durch Ersatzparameter angegeben werden. Weitere Informationen finden Sie unter „Using Dictionaries“ im Text Data Processing Extraction Customization Guide. Weitere Informationen XML-Schema-Spezifikation [Seite 226] Referenzhandbuch: Entity-Extraction-Transformation, Extraktionsoptionen Verwenden des Editors für Ersatzparameter [Seite 305] 9.6.9 Verwenden von Filteroptionen Mit diesen Optionen können Sie die extrahierten Einheiten auf bestimmte Einheiten von einem Wörterbuch, die Systemdateien, Einheiten/Tatsachen von Regeln oder eine Kombination daraus begrenzen. 202 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Transformationen Mit den Filteroptionen unter verschiedenen Extraktionsoptionen wird die von der Entity-ExtractionTransformation generierte Ausgabe gesteuert. Nehmen Sie beispielsweise an, Sie verarbeiten Kundenfeedbackfelder für ein Automobilunternehmen und möchten die Kommentare zu einem bestimmten Modell ansehen. Mit den Filteroptionen können Sie die Ausgabe so steuern, dass nur Daten in Zusammenhang mit diesem Modell extrahiert werden. Filteroptionen werden in drei Kategorien unterteilt: Tabelle 71: Option Optionsgruppe Beschreibung Nach Einheitstypen filtern Sprachen Begrenzt die Ausgabe der Extraktion so, dass nur ausgewählte Einheiten für diese Sprache berücksichtigt werden. Nach Einheitstypen filtern Wörterbuch Begrenzt die Ausgabe der Extraktion so, dass nur in einem Wörterbuch definierte Einheiten berücksichtigt werden. Nach Regelnamen filtern Regeln Begrenzt die Ausgabe der Extraktion so, dass nur von bestimmten Regeln zurückgegebene Einheiten und Fakten berücksichtigt werden. In der folgenden Tabelle werden die Informationen beschrieben, die in der Extraktionsausgabe auf der Grundlage der Kombination dieser Optionen enthalten sind: Tabelle 72: Spra chen Wörterbü Regeln cher Einheits typen Einheitsty Regel pen namen Ja Nein Nein Im Filter ausgewählte Einheiten (mit den Ein heitstypen extrahiert). Nein Ja Nein In der ausgewählten Sprache definierte Einhei ten (mit den Einheitstypen extrahiert) und aus dem Wörterbuchfilter ausgewählte Einheitsty pen. Ja Ja Nein In den Filtern für die ausgewählte Sprache und angegebene Wörterbücher definierte Einheiten (mit den Einheitstypen extrahiert). Nein Nein Ja In der ausgewählten Sprache definierte Einhei ten (mit den Einheitstypen extrahiert) und im Filter von angegebenen Regeldateien ausge wählte Regelnamen. Designer-Handbuch Transformationen Inhalt der Extraktionsausgabe Hinweis Wenn mehrere Wörterbücher angegeben werden, die denselben Einheitstyp enthal ten, dieser Einheitstyp aber nur für ein Wörterbuch als Filter ausgewählt ist, wer den Einheiten dieses Typs auch vom ande ren Wörterbuch zurückgegeben. Wenn mehrere Regeldateien angegeben werden, die denselben Regelnamen ent halten, er aber nur als Filter für einen da von ausgewählt ist, werden Einheiten und Tatsachen dieses Typs von der anderen Regeldatei ebenfalls ausgegeben. PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 203 Spra chen Wörterbü Regeln cher Inhalt der Extraktionsausgabe Nein Ja Ja In der ausgewählten Sprache definierte Einhei ten (mit den Einheitstypen extrahiert), aus dem Wörterbuchfilter ausgewählte Einheitstypen und im Filter von angegebenen Regeldateien ausgewählte Regelnamen. Ja Nein Ja In den Filtern für die ausgewählte Sprache defi nierte Einheiten (mit den Einheitstypen extra hiert) und im Filter von angegebenen Regelda teien ausgewählte Regelnamen. Ja Ja Ja In den Filtern für die ausgewählte Sprache defi nierte Einheiten (mit den Einheitstypen extra hiert), aus dem Wörterbuchfilter ausgewählte Einheitstypen und im Filter von angegebenen Regeldateien ausgewählte Regelnamen. Hinweis Beim Extrahieren wird die Ausgabe auf der Grundlage der Kombination der extrahier ten Einheiten oder Tatsachen für die aus gewählte Sprache, die Wörterbücher und die Regeldateien gefiltert. Wenn Sie Ihre Auswahl für die Sprache, die Wörterbücher oder die Regeln ändern, werden Filter in Zusammenhang mit der betreffenden Option nur gelöscht, indem Sie auf die Option Filtern nach klicken. Sie müssen neue Filteroptionen auf der Grundlage der geänderten Auswahl festlegen. Hinweis Wenn Sie mehrere Wörterbücher (oder Regeln) verwenden und Filteroptionen für einige der ausgewählten Wörterbücher (oder Regeln) festgelegt haben, werden beim Extrahieren die Wörterbücher intern miteinander kombiniert, und die Ausgabe wird anhand der Kombination der für jedes Wörterbuch ausgewählten Einheitstypen und der für jede Regeldatei ausgewählten Regelnamen gefiltert. In der Ausgabe wird die Quelle als Wörterbuch-(bzw. Regel-)datei identifiziert und nicht der konkrete Name einer Wörterbuch-(bzw. Regel-)datei angegeben. Hinweis Wenn Sie in der Gruppe Verarbeitungsoptionen die Option Nur Wörterbuch mit einer gültigen Wörterbuchdatei auswählen, werden die für die Sprache definierten Einheitstypen in der Extraktionsausgabe nicht aufgenommen, aber extrahierte Regeldateieinheiten und Tatsachen werden aufgenommen. Weitere Informationen Editor für die Entity-Extraction-Transformation [Seite 201] 204 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Transformationen 10 Workflows Ein Workflow definiert den Entscheidungsfindungsprozess für die Ausführung von Datenflüssen. Elemente in einem Workflow können beispielsweise den Ausführungspfad basierend auf einem Wert bestimmen, der von einem vorherigen Job festgelegt wurde, oder sie können einen alternativen Pfad angeben, wenn im primären Pfad etwas schief geht. Letztendlich hat ein Workflow den Zweck, die Ausführung von Datenflüssen vorzubereiten und den Systemstatus nach dem Abschluss der Datenflüsse festzulegen. Jobs sind spezielle Workflows. Jobs sind besonders, da Sie diese ausführen können. Fast alle der für Workflows dokumentierten Funktionen finden auch bei Jobs Anwendung, mit einer Ausnahme: Jobs weisen keine Parameter auf. Weitere Informationen Projekte [Seite 61] 10.1 Schritte in einem Workflow Workflowschritte werden in Form von Symbolen dargestellt, die Sie in den Arbeitsbereich einfügen, um ein Workflowdiagramm anzulegen. Folgende Objekte können Elemente in Workflows sein: ● Workflows ● Datenflüsse ● Skripte ● Bedingte Verzweigungen ● While-Schleifen ● Try-/Catch-Blöcke Workflows können andere Workflows aufrufen, und Sie können Aufrufe bis auf eine beliebig tiefe Ebene verschachteln. Ein Workflow kann auch von sich selbst aufgerufen werden. Designer-Handbuch Workflows PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 205 Anhand der Verbindungen, die Sie zwischen den Symbolen im Arbeitsbereich herstellen, wird die Reihenfolge festgelegt, in der die Workflows ausgeführt werden, sofern die diese Workflows enthaltenden Jobs nicht parallel ausgeführt werden. 10.2 Ausführungsreihenfolge in Workflows Schritte in einem Workflow werden von links nach rechts ausgeführt, was durch die Linien angezeigt wird, die die Schritte miteinander verbinden. Das folgende Diagramm zeigt einen Workflows, der drei Datenflüsse aufruft: Beachten Sie, dass Datenfluss1 keine Verbindung nach links hat, aber nach rechts mit dem linken Rand von Datenfluss2 verbunden ist, während Datenfluss2 wiederum mit Datenfluss3 verbunden ist. Ein einzelner Steuerungsthread verbindet alle drei Schritte. Die Ausführung beginnt mit Datenfluss1 und setzt sich durch die drei Datenflüsse fort. Verbinden Sie die Schritte in einem Workflow, wenn eine Abhängigkeit zwischen den Schritten besteht. Wenn keine Abhängigkeit besteht, müssen die Schritte nicht miteinander verbunden werden. In diesem Fall können die unabhängigen Schritte im Workflow als separate Prozesse ausgeführt werden. Im folgenden Workflow werden die Datenflüsse 1 bis 3 parallel ausgeführt: Um komplexere Workflows parallel auszuführen, definieren Sie jede Sequenz als separaten Workflow und rufen dann jeden der Workflows wie im Beispiel unten gezeigt aus einem anderen Workflow auf: 206 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Workflows Sie können angeben, dass ein Job einen bestimmten Workflow oder Datenfluss nur einmal ausführen soll. In diesem Fall wird nur die erste Instanz des Workflows bzw. Datenflusses ausgeführt; nachfolgende Instanzen im Job werden übersprungen. Sie können diese Funktion beispielsweise verwenden, wenn Sie komplexe Jobs mit mehreren Pfaden entwickeln, wie Jobs mit Try/Catch- oder Bedingungsblöcken, und Sie sicherstellen wollen, dass ein bestimmter Workflow oder Datenfluss lediglich einmal ausgeführt wird. 10.3 Beispiel für einen Workflow Angenommen, Sie möchten eine Faktentabellen aktualisieren. Sie definieren einen Datenfluss, in dem die eigentliche Datentransformation stattfindet. Bevor Sie jedoch die Daten aus der Quelle verschieben, möchten Sie ermitteln, wann die Faktentabelle zuletzt aktualisiert wurde, so dass Sie nur Zeilen extrahieren, die seit dem letzten Datum hinzugefügt oder geändert wurden. Sie müssen ein Skript schreiben, um zu ermitteln, wann die letzte Aktualisierung vorgenommen wurde. Anschließend können Sie dieses Datum als Parameter an den Datenfluss übergeben. Außerdem möchten Sie überprüfen, ob die zum Anlegen der Faktentabelle erforderlichen Verbindungen aktiv sind, wenn die Daten aus Ihnen gelesen werden. Zu diesem Zweck definieren Sie einen Try/Catch-Block. Sind die Verbindungen nicht aktiv, führt der Catch ein von Ihnen geschriebenes Skript aus, das automatisch eine E-Mail an den Administrator sendet, um ihm das Problem zu melden. Skripte und Fehlersuchen können nicht in einem Datenfluss ausgeführt werden. Sie werden vielmehr als Schritte innerhalb eines Entscheidungsfindungsprozesses ausgeführt, der den Datenfluss beeinflusst. Dieser Entscheidungsfindungsprozess wird als Workflow definiert, der wie folgt aussieht: Diese Schritte werden in der Reihenfolge ausgeführt, in der sie von Ihnen verbunden werden. Designer-Handbuch Workflows PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 207 10.4 Anlegen von Workflows Sie können Workflows über die Objektbibliothek oder die Toolpalette anlegen. Nachdem Sie einen Workflow angelegt haben, können Sie angeben, dass ein Job den Workflow nur ein einziges Mal ausführt, als einzelnen Prozess oder als fortlaufenden Prozess, auch wenn der Workflow im Job mehrere Male vorkommt. 10.4.1 Anlegen neuer Workflows mit der Objektbibliothek 1. Öffnen Sie die Objektbibliothek. 2. Gehen Sie zum Tab Workflows. 3. Klicken Sie mit der rechten Maustaste, und wählen Sie Neu aus. 4. Ziehen Sie den Workflow in das Diagramm. 5. Fügen Sie die benötigten Datenflüsse, Workflows, Bedingungen, Try-/Catch-Blöcke und Skripte hinzu. 10.4.2 Anlegen neuer Workflows über die Symbolleiste 1. Wählen Sie das Workflowsymbol in der Symbolleiste aus. 2. Klicken Sie auf die Stelle, an der Sie den Workflow im Diagramm platzieren möchten. Wenn mehrere Instanzen eines Workflows in einem Job vorkommen, können Sie die Ausführungsleistung verbessern, indem Sie den Workflow nur einmal ausführen. 10.4.3 Angabe, dass ein Job den Workflow einmalig ausführt Wenn Sie angeben, dass ein Workflow nur einmal ausgeführt werden soll, führt ein Job diesen Workflow nach dessen erfolgreicher Ausführung nicht erneut aus. Eine Ausnahme ist gegeben, wenn der Workflow in einem anderen enthalten ist, der eine Wiederherstellungseinheit ist, die erneut ausführt, und außerhalb der Wiederherstellungseinheit nicht erfolgreich ausgeführt wurde. Es empfiehlt sich, einen Workflow nicht als Nur einmal ausführen zu kennzeichnen, wenn es sich bei diesem Workflow oder dem übergeordneten Workflow um eine Wiederherstellungseinheit handelt. 1. Klicken Sie mit der rechten Maustaste auf den Workflow, und wählen Sie Eigenschaften aus. Das Fenster "Eigenschaften" wird für den Workflow geöffnet. 2. Wählen Sie aus der Drop-Down-Liste Ausführungstyp die Option Standard aus. 3. Aktivieren Sie das Kontrollkästchen Nur einmal ausführen. 4. Klicken Sie auf OK. 208 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Workflows Weitere Informationen Referenzhandbuch: Workflow 10.4.4 Was ist ein Einzel-Workflow? Ein Einzel-Workflow führt alle seine untergeordneten Datenflüsse in einem Betriebssystemprozess aus. Wenn die Datenflüsse für eine parallele Ausführung ausgelegt sind, werden sie in verschiedenen Threads statt in verschiedenen Prozessen ausgeführt. Der Vorteil eines einzelnen Prozesses ist, dass Ressourcen wie Datenbankverbindungen von mehreren Datenflüssen gleichzeitig benutzt werden können. Hinweis Einzel-Workflows unterliegen folgenden Beschränkungen: ● Ein Einzel-Workflow kann keinen fortlaufenden Workflow aufrufen oder enthalten. ● Ein Einzel-Workflow kann keine Teildatenflüsse verwenden. Daher sind die Data-Transfer-Transformation und die Optionen „Als separaten Prozess ausführen“ ungültig. Die Software generiert einen Laufzeitvalidierungsfehler. ● Ein Einzel-Workflow kann nur von einem fortlaufenden Workflow ausgeführt werden. Ein Einzel-Workflow kann keinen weiteren Einzel-Workflow aufrufen. 10.4.4.1 Angabe, dass ein Job als Einzel-Workflow ausgeführt wird 1. Klicken Sie mit der rechten Maustaste auf einen Workflow und wählen Sie Eigenschaften aus. 2. Wählen Sie aus der Drop-Down-Liste „Ausführungstyp“ Einzeln aus. 3. Klicken Sie auf OK. 10.4.5 Was ist ein fortlaufender Workflow? Ein fortlaufender Workflow führt alle Datenflüsse in einer Schleife aus, behält Sie jedoch für die nächste Iteration im Speicher. Dadurch müssen einige der gemeinsamen Ausführungsschritte nicht mehr wiederholt werden (zum Beispiel: Herstellen der Verbindung zum Repository, Parsen/Optimieren/Kompilieren von ATL, Öffnen von Datenbankverbindungen). Hinweis Fortlaufende Workflows unterliegen folgenden Beschränkungen: Designer-Handbuch Workflows PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 209 ● Ein fortlaufender Workflow kann keinen weiteren fortlaufenden Workflow aufrufen oder enthalten. Wenn ein fortlaufender Workflow einen anderen fortlaufenden Workflow aufruft, der niemals endet, kann der Workflow die untergeordneten Prozesse niemals starten. ● Ein fortlaufender Workflow kann keine Teildatenflüsse verwenden. Daher sind die Data-TransferTransformation und die Optionen „Als separaten Prozess ausführen“ ungültig. Die Software generiert einen Laufzeitvalidierungsfehler. ● Ein regulärer oder Einzel-Workflow kann keinen fortlaufenden Workflow aufrufen oder enthalten. ● Ein Echtzeitjob kann keinen fortlaufenden Workflow aufrufen. ● Die Plattform-Transformation XML_Map kann nicht in einem fortlaufenden Workflow verwendet werden. ● Die Data-Integrator-Transformationen Data_Transfer und XML_Pipeline können nicht in einem fortlaufenden Workflow verwendet werden. 10.4.5.1 Angabe, dass ein Job einen fortlaufenden Workflow ausführt 1. Klicken Sie mit der rechten Maustaste auf einen Workflow und wählen Sie Eigenschaften aus. 2. Wählen Sie aus der Drop-Down-Liste „Ausführungstyp“ Fortlaufend aus. 3. Öffnen Sie den Tab Fortlaufende Optionen. 4. Geben Sie an, wann der Workflow Ressourcen freigeben soll: ○ Um Ressourcen nach einer bestimmten Anzahl von Ausführungen freizugeben, wählen Sie Ausführungsanzahl und geben Sie die Anzahl der Ausführungen ein. Der Standardwert ist 100. ○ Um Ressourcen nach einer bestimmten Anzahl von Stunden freizugeben, wählen Sie das Kontrollkästchen Nach und dann Stundenanzahl aus und geben die Stundenanzahl ein. ○ Um Ressourcen nach einer bestimmten Anzahl von Tagen freizugeben, wählen Sie das Kontrollkästchen Nach und dann Anzahl Tage aus und geben die Tagesanzahl ein. ○ Um Ressourcen freizugeben, wenn das Ergebnis einer Funktion nicht gleich null ist, wählen Sie das Kontrollkästchen Nach und dann Funktionsergebnis ist nicht gleich Null aus und geben die Funktion ein, die Sie verwenden möchten. 5. Um den Workflow zu beenden, wenn das Ergebnis einer benutzerdefinierten Funktion gleich null ist, wählen Sie When result of the function is equal to zero aus und geben die benutzerdefinierte Funktion ein, die Sie verwenden möchten. 6. Klicken Sie auf OK. 10.5 Bedingte Verzweigungen Bedingte Verzweigungen sind Objekte, die nur einmal verwendet werden und dazu dienen, If-/Then-/Else-Logik in einen Workflow zu implementieren. Bedingte Verzweigungen und ihre Komponenten (If-Ausdrücke, Then- und Else-Diagramme) sind in den Variablen und Parametern des übergeordneten Kontrollflusses eingeschlossen. Um eine bedingte Verzweigung zu definieren, geben Sie eine Bedingung und zwei logische Verzweigungen an: 210 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Workflows Bedingte Verzweigung Beschreibung If Ein Boolescher Ausdruck, der TRUE oder FALSE auswertet. Sie können den Ausdruck mithilfe von Funktionen, Variablen und Standardoperatoren anlegen. Then Workflow-Elemente, die ausgeführt werden müssen, wenn der If-Ausdruck als TRUE ausgewertet wird. Else (Optional) Workflow-Elemente, die ausgeführt werden müssen, wenn der If-Ausdruck als FALSE ausgewertet wird. Definieren Sie die Verzweigungen Then und Else innerhalb der Definition der bedingten Verzweigung. Eine bedingte Verzweigung kann in einen Workflow eingepasst werden. Nehmen wir an, Sie übertragen Daten mithilfe einer Windows-Befehlsdatei von einem älteren System in die Software. Sie legen ein Skript in einem Workflow an, um die Befehlsdatei auszuführen und ein Erfolgskennzeichen zurückzugeben. Anschließend definieren Sie eine bedingte Verzweigung, die das Erfolgskennzeichen liest, um zu bestimmen, ob der Wert für den übrigen Workflow zur Verfügung steht. Um diese bedingte Verzweigung in die Software zu implementieren, definieren Sie zwei Workflows – einen für jede Verzweigung der bedingten Verzweigung. Wenn die Elemente in den einzelnen Verzweigungen einfach sind, können Sie diese im Bedingungseditor selbst definieren. Die Verzweigungen Then und Else der bedingten Verzweigung können jeweils beliebige Objekte enthalten, die in einem Workflow enthalten sind, der andere Workflows, verschachtelte Bedingungen, Try-/Catch-Blöcke usw. einschließt. Designer-Handbuch Workflows PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 211 10.5.1 Definieren einer bedingten Verzweigung 1. Definieren Sie die Workflows, die von den Verzweigungen Then und Else der bedingten Verzweigung aufgerufen werden. Es empfiehlt sich, jeden Workflow als separates Objekt zu definieren, zu testen und zu speichern, statt diese Workflows im Bedingungseditor anzulegen. 2. Öffnen Sie den Workflow, in den Sie die bedingte Verzweigung stellen möchten. 3. Klicken Sie in der Toolpalette auf das Symbol für die bedingte Verzweigung. 4. Klicken Sie an die Stelle, an der Sie die bedingte Verzweigung im Diagramm platzieren möchten. Die bedingte Verzweigung wird im Diagramm angezeigt. 5. Klicken Sie auf den Namen der bedingten Verzweigung, um den Bedingungseditor zu öffnen. 6. Klicken Sie auf if. 7. Geben Sie den Booleschen Ausdruck ein, der die bedingte Verzweigung steuert. Entwickeln Sie Ihren Ausdruck weiter. Sie können dazu den Funktionsassistenten oder den Smart Editor verwenden. 8. Nachdem Sie den Ausdruck abgeschlossen haben, klicken Sie auf OK. 9. Fügen Sie den vordefinierten Workflow dem Feld Then hinzu. Um einen vorhandenen Workflow hinzuzufügen, öffnen Sie die Objektbibliothek zum Tab "Workflows", wählen Sie den gewünschten Workflow aus, und ziehen Sie ihn dann in das Feld "Then". 10. (Optional) Fügen Sie den vordefinierten Workflow dem Feld Else hinzu. Wenn der If-Ausdruck als FALSE ausgewertet wird und das Feld "Else" leer ist, wird die bedingte Verzweigung beendet und der Workflow fortgesetzt. 11. Nachdem Sie die bedingte Verzweigung abgeschlossen haben, wählen Sie DebuggenValidieren. Die Software testet, ob die bedingte Verzweigung Syntaxfehler aufweist, und zeigt alle Fehler an. 12. Die bedingte Verzweigung ist jetzt definiert. Klicken Sie auf die Schaltfläche Zurück, um zu dem Workflow zurückzukehren, der die bedingte Verzweigung aufruft. 10.6 While-Schleifen Die While-Schleife ist ein einzeln verwendbares Objekt, das in einem Workflow verwendet werden kann. Verwenden Sie eine While-Schleife, wenn Sie eine Folge von Schritten in einem Workflow wiederholen möchten, solange eine Bedingung als "True" ausgewertet wird. 212 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Workflows In der Regel resultieren die während der While-Schleife ausgeführten Schritte zu einer Änderung der Bedingung, so dass die Bedingung letztendlich nicht mehr erfüllt wird und der Workflow die While-Schleife beendet. Wenn die Bedingung sich nicht ändert, wird die While-Schleife nicht beendet. Angenommen, Sie möchten, dass ein Workflow wartet, bis das System eine bestimmte Datei schreibt. Mithilfe einer While-Schleife können Sie überprüfen, ob die Datei, die die Funktion file_exists verwendet, vorhanden ist. Solange die Datei nicht vorhanden ist, kann der Workflow für einen bestimmten Zeitraum, z.B. eine Minute, in den Ruhezustand versetzt werden, bevor mit der Prüfung fortgefahren wird. Da das System die Datei möglicherweise nie schreibt, müssen Sie eine andere Prüfung zu der Schleife hinzufügen, wie z.B. einen Zähler, um sicherzustellen, dass die While-Schleife vorhanden ist. Anders ausgedrückt, Sie ändern die While-Schleife so, dass sie eine Prüfung auf das Vorhandensein der Datei und den Wert des Zählers durchführt. Solange die Datei nicht vorhanden ist und der Zähler unter einem bestimmten Wert liegt, wiederholen Sie die While-Schleife. Versetzen Sie den Workflow bei jeder Iteration der Schleife in den Ruhezustand und inkrementieren Sie dann den Zähler. Designer-Handbuch Workflows PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 213 10.6.1 Definieren einer While-Schleife Sie können eine While-Schleife in jedem Workflow definieren. 1. Öffnen Sie den Workflow, in den Sie die While-Schleife setzen möchten. 2. Klicken Sie in der Symbolleiste auf das Symbol für While-Schleifen. 3. Klicken Sie auf den Ort, an den Sie die While-Schleife im Arbeitsbereichsdiagramm setzen möchten. Die While-Schleife wird im Diagramm angezeigt. 4. Klicken Sie auf die While-Schleife, um den Editor für While-Schleifen zu öffnen. 5. Geben Sie in das Feld While oben im Editor die Bedingung ein, die erfüllt sein muss, um die Schritte in der While-Schleife auszulösen und zu wiederholen. Alternativ können Sie den Ausdruckseditor öffnen, in dem Sie mehr Platz zum Eingeben eines Ausdrucks haben und auf den Funktionsassistenten zugreifen können. Klicken Sie auf OK, wenn Sie in den Editor einen Ausdruck eingegeben haben. 6. Fügen Sie im Editor für While-Schleifen im Arbeitsbereich die Schritte hinzu, die während der While-Schleife ausgeführt werden sollen. Sie können alle Objekte hinzufügen, die in einem Workflow zulässig sind, einschließlich Skripte, Workflows und Datenflüsse. Verbinden Sie diese Objekte in der Reihenfolge miteinander, in der die Schritte ausgeführt werden sollen. Hinweis Sie können zwar den übergeordneten Workflow in die While-Schleife aufnehmen, rekursive Aufrufe können jedoch eine Endlosschleife verursachen. 214 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Workflows 7. Wenn Sie die Schritte in der While-Schleife definiert haben, wählen Sie Debuggen Validieren . Die Software testet die Definition auf Syntaxfehler und zeigt eventuelle Fehler an. 8. Schließen Sie den Editor für While-Schleifen, um zum aufrufenden Workflow zurückzukehren. 10.6.2 Verwenden von While-Schleifen mit "Daten anzeigen" Je nach Entwurf des Jobs führt die Software unter Umständen nicht alle Iterationen einer While-Schleife aus, wenn Sie einen Job im Datenanzeigemodus ausführen. Bei Verwendung von "Daten anzeigen" wird ein Job gestoppt, wenn die Software die angegebene Anzahl von Zeilen für alle durchsuchbaren Objekte abgerufen hat. Die Verwendung einer While-Schleife während der Ausführung eines Jobs im Datenanzeigemodus kann zu Folgendem führen: ● Wenn die While-Schleife durchsuchbare Objekte enthält und sich außerhalb der While-Schleife keine durchsuchbaren Objekte befinden (zum Beispiel wenn die While-Schleife das letzte Objekt in einem Job ist), wird der Job nach dem Durchlaufen der durchsuchbaren Objekte in der While-Schleife fortgesetzt, möglicherweise nach der ersten Iteration der While-Schleife. ● Wenn sich nach der While-Schleife durchsuchbare Objekte befinden, wird die Schleife normal ausgeführt. Durchsuchte Objekte in der While-Schleife zeigen die Ergebnisse aus der letzten Iteration an. ● Wenn nach der While-Schleife keine durchsuchbaren Objekte folgen, jedoch durchsuchbare Objekte parallel zur While-Schleife durchlaufen wurden, wird der Job fortgesetzt, sobald alle durchsuchbaren Objekte durchlaufen sind. Die While-Schleife kann beliebig viele Iterationen ausführen. 10.7 Try-/Catch-Blöcke Ein Try-/Catch-Block ist eine Kombination aus einem Try-Objekt und einem oder mehreren Catch-Objekten, mit denen Sie alternative Workflows angeben können, wenn während der Ausführung eines Jobs Fehler auftreten. Try-/Catch-Blöcke haben folgende Funktionen: ● Sie "entdecken" Gruppen von Ausnahmen, die von der Software, dem DBMS oder dem Betriebssystem "ausgelöst" wurden. ● Sie wenden Lösungen an, die Sie für die Ausnahmegruppen oder für konkrete Fehler innerhalb einer Gruppe bereitstellen. ● Sie setzen die Ausführung fort. Try- und Catch-Objekte sind einmal verwendbare Objekte. Allgemeine Methode zum Implementieren der Behandlung von Ausnahmen: 1. Fügen Sie vor den Schritten, für die Sie eine Fehlerbehandlung durchführen, ein Try-Objekt ein. 2. Fügen Sie nach den Schritten ein Catch-Objekt im Workflow ein. 3. Gehen Sie im Catch-Objekt folgendermaßen vor: ○ Wählen Sie eine oder mehrere Gruppen von Fehlern, die Sie entdecken möchten. Designer-Handbuch Workflows PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 215 ○ Legen Sie die Maßnahmen fest, die von einer ausgelösten Ausnahme ausgeführt werden. Bei den Maßnahmen kann es sich um ein einzelnes Skriptobjekt, einen Datenfluss, einen Workflow oder eine Kombination aus diesen Objekten handeln. ○ Optional. Verwenden Sie Catch-Funktionen im Catch-Block, um die Details des Fehlers zu identifizieren. Wenn während der Ausführung eines Try-/Catch-Blocks eine Ausnahme ausgelöst wird und kein Catch-Objekt nach dieser Ausnahme sucht, wird die Ausnahme von der normalen Fehlerlogik bearbeitet. Der folgende Workflow zeigt einen Try-/Catch-Block um einen Datenfluss herum: Wenn in diesem Fall der Datenfluss BuildTable vom System generierte Ausnahmen verursacht, die im Catch Catch_A angegeben sind, dann werden die in Catch_A definierten Maßnahmen ergriffen. Die vom Catch-Objekt ausgelöste Maßnahme kann einfach oder komplex sein. Nachfolgend werden einige Beispiele für mögliche Maßnahmen bei Ausnahmen aufgeführt: ● Senden der Fehlermeldung an eine Online-Berichtsdatenbank oder Ihre Supportgruppe. ● Erneutes Ausführen eines fehlgeschlagenen Workflows oder Datenflusses. ● Ausführen einer vereinfachten Version eines fehlgeschlagenen Workflows oder Datenflusses. Weitere Informationen Definieren eines Try-/Catch-Blocks [Seite 216] Kategorien von verfügbaren Ausnahmen [Seite 218] Beispiel: Erfassen von Fehlerdetails mit Catch [Seite 218] Referenzhandbuch: Objekte, Catch 10.7.1 Definieren eines Try-/Catch-Blocks Gehen Sie wie folgt vor, um einen Try-/Catch-Block zu definieren: 1. Öffnen Sie den Workflow, der den Try-/Catch-Block enthalten soll. 2. Klicken Sie auf das Try-Symbol in der Symbolleiste. 3. Klicken Sie auf die Position im Diagramm, an der das Try-Objekt eingefügt werden soll. Das Try-Symbol wird im Diagramm angezeigt. Hinweis Es gibt keinen Editor für ein Try-Objekt; dieses Objekt leitet lediglich einen Try-/Catch-Block ein. 216 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Workflows 4. Klicken Sie auf das Catch-Symbol in der Symbolleiste. 5. Klicken Sie auf die Position im Arbeitsbereich, an der das Catch-Objekt eingefügt werden soll. Das Catch-Objekt wird im Arbeitsbereich angezeigt. 6. Verbinden Sie das Try- und das Catch-Objekt mit den benachbarten Objekten. 7. Klicken Sie auf den Namen des Catch-Objekts, um den Catch-Editor zu öffnen. 8. Wählen Sie mindestens eine Gruppe in der Liste Ausnahmen aus. Zum Auswählen aller Ausnahmegruppen klicken Sie auf das oben angezeigte Kontrollkästchen. 9. Definieren Sie die Aktionen, die für jede Ausnahmegruppe ausgeführt werden sollen, und fügen Sie die Aktionen dem Feld für den Catch-Workflow hinzu. Diese Aktionen können ein einzelnes Skript, ein Datenfluss, ein Workflow oder eine beliebige Kombination dieser Objekte sein. a. Es wird empfohlen, dass Sie die Aktionen als separate Objekte definieren, testen und speichern, anstatt sie innerhalb des Catch-Editors anzulegen. b. Wenn Sie Aktionen für bestimmte Fehler definieren möchten, verwenden Sie die folgenden CatchFunktionen in einem Skript, das der Workflow ausführt: ○ error_context() ○ error_message() ○ error_number() ○ error_timestamp() c. Wenn Sie dem Feld für den Catch-Workflow einen vorhandenen Workflow hinzufügen möchten, öffnen Sie den Tab "Workflows" in der Objektbibliothek, wählen Sie den gewünschten Workflow aus, und ziehen Sie ihn in das Feld. 10. Nachdem Sie den Catch-Workflow fertiggestellt haben, wählen Sie in Sicht Validierung Validieren Alle Objekte aus. Die Software testet die Definition auf Syntaxfehler und zeigt eventuelle Fehler an. 11. Klicken Sie auf die Schaltfläche Zurück, um zu dem Workflow zurückzukehren, der das Catch-Objekt aufruft. 12. Wenn Sie mehrere Ausnahmegruppen erfassen und jeder Ausnahmegruppe verschiedene Aktionen zuweisen möchten, wiederholen Sie die Schritte 4 bis 11 für jedes Catch-Objekt im Workflow. Hinweis Bei mehreren aufeinanderfolgenden Catch-Blöcken werden die nachfolgenden Catch-Blöcke nicht ausgeführt, wenn ein Catch-Block eine Ausnahme erfasst. Beispiel: Wenn der Workflow die folgende Sequenz umfasst und Catch1 eine Ausnahme erfasst, werden Catch2 und CatchAll nicht ausgeführt. Try > DataFlow1 > Catch1 > Catch2 > CatchAll Tritt während der Ausführung des Try-/Catch-Blocks ein Fehler bei der Ausnahmegruppe auf, die in dem CatchObjekt aufgelistet ist, führt die Software den Catch-Workflow aus. Weitere Informationen Kategorien von verfügbaren Ausnahmen [Seite 218] Beispiel: Erfassen von Fehlerdetails mit Catch [Seite 218] Designer-Handbuch Workflows PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 217 Referenzhandbuch: Objekte, Catch 10.7.2 Kategorien von verfügbaren Ausnahmen Die verfügbaren Ausnahmen gliedern sich in folgende Kategorien: ● Ausführungsfehler (1001) ● Datenbankzugriffsfehler (1002) ● Datenbankverbindungsfehler (1003) ● Flatfile-Verarbeitungsfehler (1004) ● Dateizugriffsfehler (1005) ● Repository-Zugriffsfehler (1006) ● SAP-Systemfehler (1007) ● Systemressourcenausnahmen (1008) ● SAP-BW-Ausführungsfehler (1009) ● XML-Verarbeitungsfehler (1010) ● COBOL-Copybook-Fehler (1011) ● Excel-Arbeitsmappenfehler (1012) ● Data-Quality-Transformationsfehler (1013) 10.7.3 Beispiel: Erfassen von Fehlerdetails mit Catch Dieses Beispiel zeigt, wie Sie die Fehlerfunktionen in einem Catch-Skript verwenden. Es soll angenommen werden, dass Sie Datenbankzugriffsfehler mit Catch erfassen und die Fehlerdetails an Ihre Unterstützungsgruppe senden möchten. 1. Wählen Sie im Catch-Editor die Ausnahmegruppe aus, für die die Catch-Funktion ausgeführt werden soll. Aktivieren Sie in diesem Beispiel das Kontrollkästchen vor Datenbank-Zugriffsfehler (1002). 2. Legen Sie im Workflow-Bereich des Catch-Editors ein Skriptobjekt mit folgendem Skript an: mail_to('[email protected]', 'Data Service error number' || error_number(), 'Error message: ' || error_message(),20,20); print('DBMS Error: ' || error_message()); 3. Dieses Beispiel-Catch-Skript umfasst die Funktion mail_to für folgende Aufgaben: ○ Geben Sie die E-Mailadresse Ihrer Unterstützungsgruppe an. ○ Senden Sie die Fehlernummer, die von der error_number()-Funktion für die erfasste Ausnahme zurückgegeben wurde. ○ Senden Sie die Fehlermeldung, die von der error_message()-Funktion für die erfasste Ausnahme zurückgegeben wurde. 4. Das Beispiel-Catch-Skript umfasst einen Druckbefehl, um die Fehlermeldung für den Datenbankfehler zu drucken. 218 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Workflows Weitere Informationen Referenzhandbuch: Objekte, Beschreibung von Objekten, Catch, Catch-Fehlerfunktionen Referenzhandbuch: Objekte, Beschreibung von Objekten, Catch-Skripte 10.8 Skripte Skripte sind einmal verwendbare Objekte, die verwendet werden, um Funktionen aufzurufen und Werte zu Variablen in einem Workflow zuzuweisen. Sie können beispielsweise die SQL-Funktion in einem Skript verwenden, um die letzte Aktualisierungszeit einer Tabelle zu ermitteln und diesen Wert dann einer Variablen zuzuweisen. Anschließend weisen Sie die Variable einem Parameter zu, der sie in einen Datenfluss überträgt und die aus einer Quelle zu extrahierenden Zeilen ermittelt. Ein Skript kann folgende Anweisungen enthalten: ● Funktionsaufrufe ● If-Anweisungen ● While-Anweisungen ● Zuweisungsanweisungen ● Operatoren Für die Syntax des Skripts gelten die folgenden grundlegenden Regeln: ● Jede Zeile endet mit einem Semikolon (;). ● Variablennamen beginnen mit einem Dollarzeichen ($). ● Zeichenfolgenwerte werden in einfache Anführungszeichen (') gesetzt. ● Kommentarte beginnen mit einer Raute (#). ● Funktionsaufrufe geben stets Parameter an, selbst dann, wenn die Funktion keine Parameter verwendet. Die folgende Skriptanweisung bestimmt beispielsweise das aktuelle Datum und weist den Wert der Variablen $TODAY zu: $TODAY = sysdate(); Sie können Variablen nur dann verwenden, wenn Sie sie in dem Workflow, der das Skript aufruft, deklarieren. Weitere Informationen Referenzhandbuch: Skriptsprache Designer-Handbuch Workflows PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 219 10.8.1 Anlegen von Skripten 1. Öffnen Sie den Workflow. 2. Klicken Sie in der Symbolleiste auf das Skriptsymbol. 3. Klicken Sie auf den Ort, an den Sie das Skript im Diagramm setzen möchten. Daraufhin wird das Skriptsymbol im Diagramm angezeigt. 4. Klicken Sie auf den Namen des Skripts, um den Skripteditor zu öffnen. 5. Geben Sie die Skriptanweisungen ein, jeweils gefolgt von einem Semikolon. Im folgenden Beispiel wird ein Skript gezeigt, das die Startzeit von der Ausgabe einer benutzerdefinierten Funktion festlegt. AW_StartJob ('NORMAL','DELTA', $G_STIME,$GETIME); $GETIME =to_date( sql('ODS_DS','SELECT to_char(MAX(LAST_UPDATE) , \'YYYY-MM-DDD HH24:MI:SS\') FROM EMPLOYEE'), 'YYYY_MMM_DDD_HH24:MI:SS'); Klicken Sie auf die Funktionsschaltfläche, um Funktionen in das Skript aufzunehmen. 6. Wenn Sie das Skript fertig gestellt haben, wählen Sie Validierung Validieren . Daraufhin wird das Skript auf Syntaxfehler geprüft. Festgestellte Fehler werden angezeigt. 7. Klicken Sie auf die Schaltfläche ... und anschließend auf Speichern, um dem Skript einen Namen zuzuweisen und das Skript zu speichern. Das Skript wird standardmäßig unter <VERKNÜPFUNGSVERZ>/Data Services/DataQuality/Samples gespeichert. 10.8.2 Debuggen von Skripts mit der Druckfunktion Die Software verfügt über eine Debugging-Funktion, die das Drucken folgender Elemente ermöglicht: ● Die Werte von Variablen und Parametern während der Ausführung ● Den innerhalb eines Skripts verfolgten Ausführungspfad Mit der Funktion „print“ können Sie die Werte von Parametern und Variablen in einem Workflow in das TraceProtokoll schreiben. Beispielweise wird über folgende Zeile in einem Skript: print('The value of parameter $<x>: [$<x>]'); die folgende Ausgabe in einem Trace-Protokoll generiert: The following output is being printed via the Print function in <Session <job_name>. The value of parameter $<x>: <value> 220 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Workflows Weitere Informationen Referenzhandbuch: Funktionen und Prozeduren, Beschreibungen von integrierten Funktionen, print Designer-Handbuch Workflows PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 221 11 Verschachtelte Daten Verschachtelte Daten werden einem separaten Schema zugeordnet, das sich implizit auf eine einzelne Zeile und Spalte des übergeordneten Schemas bezieht. Diesen Mechanismus bezeichnet man als Nested Relational Data Modelling (NRDM). Daten haben in der Praxis häufig hierarchische Beziehungen, die in einer relationalen Datenbank mit MasterDetail-Schemas dargestellt werden, bei denen die Zuordnung mithilfe von Fremdschlüsseln erfolgt. Einige Datasets wie XML-Dokumente und SAP ERP IDocs handhaben hierarchische Beziehungen jedoch über verschachtelte Daten. NRDM bietet eine Möglichkeit, um hierarchische Beziehungen in Datenflussquellen, -zielen und Transformationen anzuzeigen und zu bearbeiten. Kundenaufträge werden häufig mittels Verschachtelung vorgelegt: Die Einzelposten in einem Kundenauftrag beziehen sich auf einen einzelnen Header und werden mittels eines verschachtelten Schemas dargestellt. Jede Zeile des Kundenauftrags-Datasets enthält ein verschachteltes LineItem-Schema. 11.1 Darstellung von hierarchischen Daten Sie können dieselben Daten unterschiedlich darstellen. Hier einige Beispiele: Mehrere Zeilen in einem einzigen Datensatz Tabelle 73: Bestelldatensatz OrderNo CustID ShipTo1 ShipTo2 Item Qty ItemPrice 9999 1001 123 State St Town, CA 001 2 10 9999 1001 123 State St Town, CA 002 4 5 Mehrere durch einen Join verbundene Datensätze 222 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Verschachtelte Daten Tabelle 74: Bestellkopf-Datensatz OrderNo CustID ShipTo1 ShipTo2 9999 1001 123 State St Town, CA Tabelle 75: Zeilenpositions-Datensatz OrderNo Item Qty ItemPrice 9999 001 2 10 9999 002 4 5 WOBEI Header.OrderNo=LineItem.OrderNo Verschachtelte Daten Durch die Verwendung der Methode für verschachtelte Daten erhalten Sie eine bessere Übersichtlichkeit (keine wiederholten Informationen) und können skalieren, um eine tiefere hierarchische Komplexität zu darzustellen. Beispielsweise können Spalten in einem verschachtelten Schema auch Spalten enthalten. Es gibt eine eindeutige Instanz von jedem verschachtelten Schema für jede Zeile auf jeder Ebene der Beziehung. Bestelldatensatz Allgemein ausgedrückt kann bei verschachtelten Daten jede Zeile auf jeder Ebene eine beliebige Anzahl von Spalten enthalten, die verschachtelte Schemas enthalten. Bestelldatensatz Designer-Handbuch Verschachtelte Daten PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 223 Sie können die Struktur der verschachtelten Daten in den Ein- und Ausgabeschemas der Quellen, der Ziele und der Transformationen in Datenflüssen sehen. Verschachtelte Schemas werden mit einem Schema-Symbol und einem Pluszeichen angezeigt, was anzeigt, dass das Objekt Spalten enthält. Die Struktur des Schemas zeigt, wie die Daten angeordnet sind. ● "Sales" ist das Schema auf oberster Ebene. ● LineItems ist ein verschachteltes Schema. Das Minuszeichen vor dem Schema-Symbol zeigt an, dass die Spaltenliste offen ist. ● CustInfo ist ein verschachteltes Schema, dessen Spaltenliste geschlossen ist. 224 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Verschachtelte Daten 11.2 Formatieren von XML-Dokumenten Mit der Software können Sie Metadaten für XML-Dokumente (Dateien oder Meldungen) importieren und exportieren. Diese XML-Dokumente können Sie als Quellen oder Ziele in Jobs verwenden. XML-Dokumente sind hierarchisch aufgebaut. Ihre gültige Struktur wird in separaten Formatdokumenten gespeichert. Das Format einer XML-Datei oder -Meldung (.xml) kann entweder mit einem XML-Schema (z.B. .xsd) oder mit einer Document Type Definition (.dtd) angegeben werden. Wenn Sie die Metadaten eines Formatdokuments importieren, werden sie entsprechend dem internen Schema der Software für hierarchische Dokumente strukturiert. Dieses Schema verwendet das verschachtelte relationale Datenmodell (NRDM – Nested Relational Data Model). Weitere Informationen XML-Schema-Spezifikation [Seite 226] Zuordnung optionaler Schemas [Seite 233] Designer-Handbuch Verschachtelte Daten PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 225 Angeben von Quelloptionen für XML-Dateien [Seite 231] Verwenden von Document Type Definitions (DTDs) [Seite 234] Generieren von DTDs und XML-Schemas aus einem NRDM-Schema [Seite 236] 11.2.1 XML-Schema-Spezifikation Die Software unterstützt die WC3 XML Schema Specification 1.0. Für ein XML-Dokument, das Informationen zum Aufgeben einer Bestellung enthält – Bestellkopf, Kunde und Zeilenpositionen – enthält ein XML-Schema die Bestellstruktur und die Beziehung zwischen den Daten. Meldung mit Daten Tabelle 76: OrderNo CustID ShipTo1 ShipTo2 9999 1001 123 State St Town, CA LineItems Item ItemQty ItemPrice 001 2 10 002 4 5 Jede Spalte im XML-Dokument entspricht einer ELEMENT- oder Attributdefinition im XML-Schema. Entsprechendes XML-Schema <?xml version="1.0"?> <xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"> <xs:element name="Order"> <xs:complexType> <xs:sequence> <xs:element name="OrderNo" type="xs:string" /> <xs:element name="CustID" type="xs:string" /> <xs:element name="ShipTo1" type="xs:string" /> <xs:element name="ShipTo2" type="xs:string" /> <xs:element maxOccurs="unbounded" name="LineItems"> <xs:complexType> <xs:sequence> <xs:element name="Item" type="xs:string" /> <xs:element name="ItemQty" type="xs:string" /> <xs:element name="ItemPrice" type="xs:string" /> </xs:sequence> </xs:complexType> </xs:element> </xs:sequence> </xs:complexType> </xs:element> </xs:schema> 226 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Verschachtelte Daten Weitere Informationen Referenzhandbuch: Objekte, Beschreibung von Objekten, XML-Schema 11.2.2 Informationen über den Import von XML-Schemas Importieren Sie die Metadaten für jedes von Ihnen verwendete XML-Schema. In der Objektbibliothek sind importierte XML-Schemas im Tab Formate in der Kategorie „Verschachtelte Schemas“ aufgeführt. Beim Importieren eines XML-Schemas werden die definierten Elemente und Attribute gelesen, und dann wird Folgendes importiert: ● Dokumentstruktur ● Namespace ● Tabellen- und Spaltennamen ● Datentyp der einzelnen Spalten ● Inhaltstyp der einzelnen Spalten ● Verschachtelte Tabellen- und Spaltenattribute XML-Schemas unterscheiden zwischen Elementen und Attributen. Die Software importiert und konvertiert sie hingegen alle in verschachtelte Tabellen- und Spaltenattribute. Weitere Informationen Referenzhandbuch: Objekte, Beschreibung von Objekten, XML-Schema 11.2.2.1 Importieren von XML-Schemas 1. Klicken Sie in der Objektbibliothek auf den Tab Format. 2. Klicken Sie mit der rechten Maustaste auf das Symbol Verschachtelte Schemas, und wählen Sie XML-Schema Neu aus. 3. Geben Sie die Einstellungen basierend auf den unten beschriebenen Optionen für die XML-Schemas ein, die Sie importieren. Tabelle 77: Option Beschreibung Formatname Geben Sie den Namen ein, den Sie für das Format in der Software verwenden möchten. Designer-Handbuch Verschachtelte Daten PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 227 Option Beschreibung Dateiname/URL Geben Sie den Dateinamen des XML-Schemas oder dessen URL-Adresse ein. Hinweis Wenn sich der Jobserver auf einem anderen Rechner als der Designer befindet, können Sie den Dateipfad nicht über Durchsuchen angeben. Sie müssen den Pfad einge ben. Sie können einen absoluten oder relativen Pfad ein geben, der Jobserver muss jedoch darauf zugreifen kön nen. Namespace Wählen Sie ein importiertes XML-Schema aus der Drop down-Liste nur dann aus, wenn der Root-Elementname im XML-Schema nicht eindeutig ist. Hinweis Wenn Sie ein XML-Schema für einen Echtzeit-Web-Ser vice-Job importieren, sollten Sie für das Schema einen eindeutigen Ziel-Namespace verwenden. Wenn Data Services die WSDL-Datei für einen Echtzeitjob mit einem Quell- oder Zielschema ohne Ziel-Namespace generiert, wird dem Bereich "Typen" des XML-Schemas ein auto matisch generierter Ziel-Namespace hinzugefügt. Dies kann zu einer Leistungsverschlechterung führen, da Data Services bei der Verarbeitung die Namespace-In formationen von der Web-Service-Anforderung unter drücken und anschließend die richtigen Namespace-In formationen wieder anhängen muss, bevor die Antwort an den Client zurückgegeben wird. Root-Elementname Wählen Sie den Namen des primären Knotens, den Sie im portieren möchten, in der Dropdown-Liste aus. Es werden nur Elemente des XML-Schemas importiert, die zu diesem Knoten oder einem Unterknoten gehören. Zirkuläre Ebene Geben Sie nur dann die Anzahl von Ebenen an, wenn das XML-Schema rekursive Elemente enthält (Element A ent hält B, Element B enthält A). Dieser Wert muss mit der An zahl der rekursiven Ebenen im Inhalt des XML-Schemas übereinstimmen. Andernfalls wird der Job, der dieses XMLSchema verwendet, nicht ausgeführt. Varchar-Standardgröße Legen Sie die Einstellungen so fest, dass Zeichenfolgen als varchar-Werte beliebiger Größe importiert werden. Der Standardwert ist 1024. 4. Klicken Sie auf OK. Nachdem Sie ein XML-Schema importiert haben, können Sie seine Spalteneigenschaften wie Datentyp über den Tab Allgemein des Fensters "Spalteneigenschaften" bearbeiten. Sie können verschachtelte Tabellen- und Spaltenattribute auch über das Fenster "Spalteneigenschaften" anzeigen und bearbeiten. 228 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Verschachtelte Daten 11.2.2.2 Anzeigen und Bearbeiten von verschachtelten Tabellen- und Spaltenattributen für ein XML-Schema 1. Wählen Sie in der Objektbibliothek den Tab Formate aus. 2. Klappen Sie die Kategorie Verschachteltes Schema auf. 3. Doppelklicken Sie auf einen Schemanamen. Das Fenster XML-Formateditor wird im Arbeitsbereich geöffnet. Die XML-Schemaformat-Teile befinden sich im oberen Fensterbereich. Die Spalte "Type" zeigt die Datentypen an, die beim Importieren der Metadaten des XML-Dokuments verwendet werden. 4. Doppelklicken Sie auf eine verschachtelte Tabelle oder Spalte, und wählen Sie den Tab Attribute des Dialogfensters Eigenschaften, um die XML-Schemaattribute anzuzeigen oder zu bearbeiten. Weitere Informationen Referenzhandbuch: Objekte, Beschreibung von Objekten, XML-Schema 11.2.3 Importieren von abstrakten Typen Ein XML-Schema bedient sich abstrakter Typen, um den Ersatz eines bestimmten Elements oder Typs zu erzwingen. ● Wenn ein Element als abstrakt definiert ist, muss ein Mitglied der Ersatzgruppe des Elements im Instanzdokument erscheinen. ● Ist ein Typ als abstrakt definiert, muss das Instanzdokument einen von diesem Typ abgeleiteten Typ verwenden (identifiziert durch das xsi:type-Attribut). Das abstrakte Element "PublicationType" könnte beispielsweise über eine Ersatzgruppe verfügen, die aus komplexe Typen wie "MagazineType", "BookType" und "NewspaperType" besteht. Normalerweise werden alle komplexen Typen in der Ersatzgruppe oder alle abgeleiteten Typen des abstrakten Typs ausgewählt, Sie können jedoch auch eine Teilmenge auswählen. 11.2.3.1 Beschränken der für einen abstrakten Typ zu importierenden Anzahl von abgeleiteten Typen 1. Wenn Sie im Fenster XML-Schemaformat importieren den Dateinamen oder die URL-Adresse eines XMLSchemas eingeben, das einen abstrakten Typ enthält, wird die Schaltfläche Abstrakter Typ aktiviert. Designer-Handbuch Verschachtelte Daten PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 229 Im folgenden Auszug aus einer XSD-Datei wird beispielsweise das Element "PublicationType" als abstrakter Typ mit den abgeleiteten Typen "BookType" und "MagazineType" definiert: <xsd:complexType name="PublicationType" abstract="true"> <xsd:sequence> <xsd:element name="Title" type="xsd:string"/> <xsd:element name="Author" type="xsd:string" minOccurs="0" maxOccurs="unbounded"/> <xsd:element name="Date" type="xsd:gYear"/> </xsd:sequence> </xsd:complexType> <xsd:complexType name="BookType"> <xsd:complexContent> <xsd:extension base="PublicationType"> <xsd:sequence> <xsd:element name="ISBN" type="xsd:string"/> <xsd:element name="Publisher" type="xsd:string"/> </xsd:sequence> </xsd:extension> /xsd:complexContent> </xsd:complexType> <xsd:complexType name="MagazineType"> <xsd:complexContent> <xsd:restriction base="PublicationType"> <xsd:sequence> <xsd:element name="Title" type="xsd:string"/> <xsd:element name="Author" type="xsd:string" minOccurs="0" maxOccurs="1"/> <xsd:element name="Date" type="xsd:gYear"/> </xsd:sequence> </xsd:restriction> </xsd:complexContent> </xsd:complexType> 2. Um eine Teilmenge von abgeleiteten Typen eines abstrakten Typs auszuwählen, klicken Sie auf die Schaltfläche Abstrakter Typ und gehen wie folgt vor: a. Wählen Sie aus der Drop-Down-Liste des Felds Abstrakter Typ den Namen des abstrakten Typs aus. b. Aktivieren Sie das Kontrollkästchen vor dem Namen eines jeden abgeleiteten Typs, den Sie importieren möchten. c. Klicken Sie auf OK. Hinweis Wenn Sie das XML-Schemaformat bearbeiten, wählt die Software alle abgeleiteten Typen des abstrakten Typs standardmäßig aus. Die zuvor ausgewählte Teilmenge bleibt also nicht erhalten. 11.2.4 Importieren von Ersatzgruppen Ein XML-Schema verwendet Ersatzgruppen, um Elemente einer speziellen Gruppe von Elementen zuzuweisen, die als Ersatz für ein bestimmtes benanntes Element (das sogenannte Kopfelement) eingesetzt werden können. Die Liste der Ersatzgruppen kann Hunderte oder sogar Tausende Mitglieder enthalten. Eine Anwendung verwendet jedoch in der Regel nur eine begrenzte Anzahl dieser Gruppen. Standardmäßig werden alle Ersatzgruppen ausgewählt; Sie können jedoch eine Untermenge auswählen. 230 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Verschachtelte Daten 11.2.5 Beschränken der Anzahl an zu importierenden Ersatzgruppen Sie können eine zu importierende Teilmenge von Ersatzgruppen auswählen. 1. Wenn Sie im Fenster XML-Schemaformat importieren den Dateinamen oder die URL-Adresse eines XMLSchemas eingeben, das Ersatzgruppen enthält, wird die Schaltfläche Ersatzgruppe aktiviert. Beispiel: In dem folgenden Auszug aus einer xsd-Datei ist das Element PublicationType mit den Ersatzgruppen MagazineType, BookType, AdsType und NewspaperType definiert: <xsd:element name="Publication" type="PublicationType"/> <xsd:element name="BookStore"> <xsd:complexType> <xsd:sequence> <xsd:element ref="Publication" maxOccurs="unbounded"/> </xsd:sequence> </xsd:complexType> </xsd:element> <xsd:element name="Magazine" type="MagazineType" substitutionGroup="Publication"/> <xsd:element name="Book" type="BookType" substitutionGroup="Publication"/> <xsd:element name="Ads" type="AdsType" substitutionGroup="Publication"/> <xsd:element name="Newspaper" type="NewspaperType" substitutionGroup="Publication"/> 2. Klicken Sie auf die Schaltfläche Ersatzgruppe. a. Wählen Sie in der Drop-Down-Liste im Feld Ersatzgruppe den Namen der Ersatzgruppe aus. b. Wählen Sie das Kontrollkästchen neben jeder Ersatzgruppe aus, die Sie importieren möchten. c. Klicken Sie auf OK. Hinweis Wenn Sie das XML-Schemaformat bearbeiten, wählt die Software standardmäßig alle Elemente als Ersatzgruppen aus. Die zuvor ausgewählte Teilmenge bleibt also nicht erhalten. 11.2.6 Angeben von Quelloptionen für XML-Dateien Legen Sie einen Datenfluss mit einer XML-Datei als Quelle an. Nachdem Sie Metadaten für XML-Dokumente (Dateien oder Meldungen) importiert haben, können Sie einen Datenfluss anlegen, um die XML-Dokumente in Jobs als Quellen oder Ziele zu verwenden. So legen Sie einen Datenfluss mit einer XML-Quelldatei an: 1. Ziehen Sie aus der Kategorie Verschachteltes Schema auf dem Tab Format der Objektbibliothek das XMLSchema, das Ihre XML-Quelldatei definiert, in Ihren Datenfluss. 2. Sehen Sie eine Abfrage im Datenfluss vor, und verbinden Sie die XML-Quelle mit der Eingabe der Abfrage. 3. Doppelklicken Sie auf die XML-Quelle im Arbeitsbereich, um den XML-Quelldateieditor zu öffnen. 4. Geben Sie den Namen der XML-Quelldatei im Textfeld XML-Datei an. Designer-Handbuch Verschachtelte Daten PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 231 Weitere Informationen Gleichzeitiges Lesen mehrerer XML-Dateien [Seite 232] Identifizieren von Quelldateinamen [Seite 122] Referenzhandbuch: Objekte, Beschreibung von Objekten, Quelle, XML-Dateiquelle 11.2.6.1 Gleichzeitiges Lesen mehrerer XML-Dateien Es können mehrere Dateien mit demselben Format unter Verwendung eines einzelnen Quellobjekts aus einem einzelnen Verzeichnis gleichzeitig gelesen werden. Richten Sie einen Datenfluss ein, wie in Angeben von Quelloptionen für XML-Dateien [Seite 231] beschrieben. 1. Doppelklicken Sie auf die XML-Quelldatei im entsprechenden Datenfluss, um das Fenster Quelldateieditor für verschachtelte Schemas im Arbeitsbereich zu öffnen. 2. Geben Sie auf dem Tab Quelle im unteren Fensterbereich in die Option Datei einen geeigneten Dateinamen ein, der ein Platzhalterzeichen (* oder ?) enthält. Beispiel: D:\Aufträge\1999????.xml liest alle .xml-Dateien, die „1999“ im Dateinamen enthalten, aus dem angegebenen Verzeichnis. D:\Aufträge\*.xml liest alle Dateien mit der Erweiterung .xml aus dem angegebenen Verzeichnis. Weitere Informationen Referenzhandbuch: Objekte, Beschreibung von Objekten, Quelle, XML-Dateiquelle 11.2.6.2 Identifizieren von Quelldateinamen Möglicherweise möchten Sie in folgenden Situationen die XML-Quelldatei für jede Zeile Ihrer Quellausgabe festlegen: ● Sie haben ein Platzhalterzeichen angegeben, um mehrere Quelldateien gleichzeitig zu lesen. ● Sie laden an unterschiedlichen Tagen aus unterschiedlichen Quelldateien. 11.2.6.2.1 Identifizieren der XML-Quelldatei für alle Zeilen im Ziel Richten Sie einen Datenfluss ein, wie in Angeben von Quelloptionen für XML-Dateien [Seite 231] beschrieben. 232 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Verschachtelte Daten 1. Doppelklicken Sie auf die XML-Quelldatei im entsprechenden Datenfluss, um das Fenster Quelldateieditor für verschachtelte Schemas im Arbeitsbereich zu öffnen. 2. Wählen Sie auf dem Tab Quelle im unteren Fensterbereich Dateinamenspalte einschließen. Diese Option generiert eine Spalte namens DI_FILENAME, die den Namen der XML-Quelldatei enthält. 3. Öffnen Sie die Query-Transformation im Datenfluss. Orden Sie im Query-Editor die Spalte DI_FILENAME vom Eingabeschema zum Ausgabeschema zu. Wenn Sie den Job ausführen, enthält die Zielspalte DI_FILENAME den XML-Quelldateinamen für jede Zeile im Ziel. 11.2.7 Zuordnung optionaler Schemas Sie können die Standardzuordnung für optionale Schemas auf einfache Weise angeben, ohne dass Sie manuell eine leere verschachtelte Tabelle für jedes optionale Schema in der Query-Transformation anlegen müssen. Wenn Sie XML-Schemas (über DTD- oder XSD-Dateien) importieren, werden ferner verschachtelte Tabellen automatisch als optional gekennzeichnet, wenn die zugehörige Option in der DTD- oder XSD-Datei gesetzt wurde. Diese Option wird beibehalten, wenn Sie Schemas kopieren und in Ihre Query-Transformationen einfügen. Diese Funktion ist besonders nützlich, wenn Sie in Ihren Jobs sehr große XML-Schemas mit vielen verschachtelten Ebenen haben. Wenn Sie eine Schemaspalte als optional festlegen und keine Zuordnung dafür bereitstellen, wird die leere verschachtelte Tabelle instantiiert, wenn Sie den Job ausführen. Während ein Schemaelement als optional gekennzeichnet ist, können Sie weiterhin eine Zuordnung für das Schema bereitstellen, indem Sie den entsprechenden Unterabfrageblock mit Anwendungslogik, die angibt, wie die Ausgabe angelegt werden soll, entsprechend programmieren. Wenn Sie jedoch einen Teil des Unterabfrageblocks ändern, muss der resultierende Abfrageblock vollständig sein und den normalen Validierungsregeln entsprechen, die für einen verschachtelten Abfrageblock erforderlich sind. Sie müssen alle Ausgabeschemas, die nicht als optional gekennzeichnet sind, einem gültigen verschachtelten Abfrageblock zuordnen. Für alle optionalen Schemas ohne zugehörigen definierten Unterabfrageblock wird eine NULL im zugehörigen PROJECTListenprozess der ATL generiert. 11.2.7.1 Ändern einer verschachtelten Tabelle in eine optionale Tabelle 1. Klicken Sie mit der rechten Maustaste auf eine verschachtelte Tabelle, und wählen Sie Optional aus, um diese Option zu aktivieren. Um die Option zu deaktivieren, klicken Sie erneut mit der rechten Maustaste auf die verschachtelte Tabelle und wählen nochmals Optional aus. 2. Sie können auch mit der rechten Maustaste auf eine verschachtelte Tabelle klicken und Eigenschaften auswählen. Öffnen Sie dann den Tab "Attribute", und setzen Sie den Attributwert Optional Table auf yes oder no. Klicken Sie auf Anwenden und auf OK, um die Einstellung anzuwenden. Hinweis Wenn für "Optional Table" ein anderer Wert als "yes" oder "no" ausgewählt wird, kann die verschachtelte Tabelle nicht als optional gekennzeichnet werden. Designer-Handbuch Verschachtelte Daten PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 233 Wenn Sie einen Job mit einer auf optional gesetzten verschachtelten Tabelle ausführen und für keine der Spalten und verschachtelten Tabellen unter dieser Tabelle einen Wert definiert haben, wird eine spezielle ATL generiert, und es wird keine Benutzerschnittstellenvalidierung für diese verschachtelte Tabelle durchgeführt. Beispiel: CREATE NEW Query ( EMPNO int KEY , ENAME varchar(10), JOB varchar (9) NT1 al_nested_table ( DEPTNO int KEY , DNAME varchar (14), NT2 al_nested_table (C1 int) ) SET("Optional Table" = 'yes') ) AS SELECT EMP.EMPNO, EMP.ENAME, EMP.JOB, NULL FROM EMP, DEPT; Hinweis Sie können Schemas der obersten Tabelle, unverschachtelte Tabellen oder verschachtelte Tabellen mit Funktionsaufrufen nicht als optional kennzeichnen. 11.2.8 Verwenden von Document Type Definitions (DTDs) Das Format eines XML-Dokuments (Datei oder Meldung) kann über eine Document Type Definition (DTD) angegeben werden. In der DTD werden die im XML-Dokument enthaltenen Daten und die Beziehung zwischen den Elementen in den Daten beschrieben. Für ein XML-Dokument mit Informationen zur Erteilung eines Kundenauftrags, wie Auftragskopf, Kunde und Einzelposten, enthält die entsprechende DTD die Auftragsstruktur und die Beziehung zwischen den Daten. Meldung mit Daten Tabelle 78: OrderNo CustID ShipTo1 ShipTo2 9999 1001 123 State St Town, CA LineItems Item ItemQty ItemPrice 001 2 10 002 4 5 Jede Spalte im XML-Dokument entspricht einer ELEMENT-Definition. Entsprechende DTD-Definition <?xml encoding="UTF-8"?> <!ELEMENT Order (OrderNo, CustID, ShipTo1, ShipTo2, LineItems+)> 234 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Verschachtelte Daten <!ELEMENT <!ELEMENT <!ELEMENT <!ELEMENT <!ELEMENT <!ELEMENT <!ELEMENT <!ELEMENT OrderNo (#PCDATA)> CustID (#PCDATA)> ShipTo1 (#PCDATA)> ShipTo2 (#PCDATA)> LineItems (Item, ItemQty, ItemPrice)> Item (#PCDATA)> ItemQty (#PCDATA)> ItemPrice (#PCDATA)> Importieren Sie die Metadaten für jede verwendete DTD. Die importierten DTDs werden in der Objektbibliothek auf dem Tab Formate aufgeführt. Sie können Metadaten aus einer vorhandenen XML-Datei (mit einer Referenz zu einer DTD) oder einer DTD-Datei importieren. Wenn Sie die Metadaten aus einer XML-Datei importieren, wird die DTD für diese XML-Datei automatisch abgerufen. Beim Importieren einer DTD werden die definierten Elemente und Attribute von der Software gelesen. Andere Bestandteile der Definition, wie etwa Text und Kommentare, werden ignoriert. So können Sie bei Bedarf die importierten XML-Daten modifizieren und den Datentyp bearbeiten. Weitere Informationen Referenzhandbuch: Objekte, Beschreibung von Objekten, DTD 11.2.8.1 Importieren eines DTD- oder XML-Schemaformats 1. Klicken Sie in der Objektbibliothek auf den Tab Format. 2. Klicken Sie mit der rechten Maustaste auf das Symbol Verschachtelte Schemas, und wählen Sie DTD Neu aus. 3. Geben Sie die Einstellungen in das Fenster "DTD-Format importieren" ein: ○ Geben Sie im Feld DTD-Definitionsname den Namen ein, mit dem Sie das importierte DTD-Format benennen möchten. ○ Geben Sie die Datei ein, in der die DTD genau beschrieben wird, die Sie importieren möchten. Hinweis Wenn sich der Jobserver auf einem anderen Rechner als der Designer befindet, können Sie den Dateipfad nicht über "Durchsuchen" angeben. Sie müssen den Pfad eingeben. Sie können einen absoluten Pfad oder einen relativen Pfad eingeben, der Jobserver muss jedoch darauf zugreifen können. ○ Wenn Sie eine XML-Datei importieren, wählen Sie XML für die Option Dateityp. Wenn Sie eine DTD-Datei importieren, wählen Sie die Option DTD. ○ Wählen Sie im Feld Root-Elementname den Namen des Primärknotens, den Sie importieren möchten. Es werden nur Elemente der DTD importiert, die zu diesem Knoten oder zugehörigen Unterknoten gehören. ○ Wenn die DTD rekursive Elemente (Element A enthält Element B, Element B enthält Element A) umfasst, geben Sie die Anzahl der vorhandenen Ebenen an, indem Sie den Wert im Feld Zirkuläre Ebene eingeben. Designer-Handbuch Verschachtelte Daten PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 235 Dieser Wert muss mit der Anzahl an rekursiven Ebenen im DTD-Inhalt übereinstimmen. Andernfalls schlägt die Ausführung des Jobs, der diese DTD verwendet, fehl. ○ Sie können die Einstellungen so festlegen, dass Zeichenfolgen als varchar-Werte beliebiger Größe importiert werden. Der Standard ist varchar 1024. 4. Klicken Sie auf OK. Nachdem Sie eine DTD importiert haben, können Sie die Spalteneigenschaften wie etwa den Datentyp bearbeiten, indem Sie den Tab Allgemein im Fenster Spalteneigenschaften verwenden. Außerdem können Sie im Fenster Spalteneigenschaften die Attribute von verschachtelten DTD-Tabellen und -Spalten anzeigen und bearbeiten. 11.2.8.2 Anzeigen und Bearbeiten von verschachtelten Tabellen- und Spaltenattributen für ein XML-Schema 1. Wählen Sie in der Objektbibliothek den Tab Formate aus. 2. Klappen Sie die Kategorie Verschachtelte Schemas auf. 3. Doppelklicken Sie auf einen DTD-Namen. Im Arbeitsbereich wird das Fenster DTD-Format angezeigt. 4. Doppelklicken Sie auf eine verschachtelte Tabelle oder Spalte. Das Fenster Spalteneigenschaften wird geöffnet. 5. Wählen Sie den Tab Attribute, um DTD-Attribute anzuzeigen oder zu bearbeiten. 11.2.9 Generieren von DTDs und XML-Schemas aus einem NRDM-Schema Sie können innerhalb eines Abfrageeditors im Designer mit der rechten Maustaste auf ein beliebiges Schema klicken und eine DTD oder ein XML-Schema generieren, die bzw. das der Struktur des ausgewählten Schemas (NRDM oder relational) entspricht. Diese Funktion ist hilfreich, wenn Sie Daten in einer XML-Datei bereitstellen und anschließend in einen anderen Datenfluss einlesen möchten. 1. Generieren Sie eine DTD/ein XML-Schema. 2. Verwenden Sie die DTD/das XML-Schema zur Anlage eines XML-Formats. 3. Verwenden Sie das XML-Format zur Anlage einer XML-Quelle für die bereitgestellte Datei. Die generierte DTD bzw. XML-Schema basiert auf folgenden Informationen: ● Je nachdem, ob das XML-Typattribut auf ATTRIBUT oder ELEMENT festgelegt ist, werden die Spalten zu Elementen oder Attributen. ● Wenn das erforderliche Attribut auf NEIN festgelegt ist, wird das entsprechende Element oder Attribut als optional gekennzeichnet. ● Verschachtelte Tabellen werden zu Zwischenelementen. ● Das Attribut "Nativer Typ" wird verwendet, um den Element- oder Attributtyp festzulegen. 236 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Verschachtelte Daten ● Beim Generieren von XML-Schemas werden die Werte "MinOccurs" und "MaxOccurs" auf Grundlage der Attribute "Minimum Occurrence" und "Maximum Occurrence" der entsprechenden verschachtelten Tabelle festgelegt. Während der DTD- oder XML-Schemagenerierung werden keine weiteren Informationen berücksichtigt. Weitere Informationen Referenzhandbuch: Objekte, Beschreibung von Objekten, DTD Referenzhandbuch: Objekte, Beschreibung von Objekten, XML-Schema 11.3 Operationen für verschachtelte Daten In diesem Abschnitt werden die Operationen erläutert, die Sie für verschachtelte Daten ausführen können. 11.3.1 Übersicht über verschachtelte Daten und die QueryTransformation Bei der Arbeit mit verschachtelten Daten bietet die Query-Transformation eine Schnittstelle zur Durchführung von SELECT-Anweisungen auf jeder Ebene der Beziehung, die Sie im Ausgabeschema definieren. Bei relationalen Daten können Sie mit einer Query-Transformation eine SELECT-Anweisung ausführen. Die Zuordnung zwischen Eingabe- und Ausgabeschema definiert die Projektliste für die Anweisung. Sie verwenden die Query-Transformation zum Manipulieren verschachtelter Daten. Wenn Sie nur einen Teil der verschachtelten Daten extrahieren möchten, können Sie die XML_Pipeline-Transformation verwenden. Ohne verschachtelte Schemas geht die Query-Transformation davon aus, dass die FROM-Klausel in der SELECTAnweisung die Datasets enthält, die als Eingaben mit dem Abfrageobjekt verbunden sind. Bei der Arbeit mit verschachtelten Daten müssen Sie die FROM-Klausel in einer Abfrage ausdrücklich definieren. Die Software unterstützt Sie dabei, indem die Eingaben der obersten Ebene als Standard-FROM-Klausel für das Ausgabeschema der obersten Schema festgelegt werden. Die anderen Elemente der SELECT-Anweisung, die von der Abfrage definiert werden, funktionieren bei verschachtelten Daten genauso wie bei flachen Daten. Da eine SELECT-Anweisung jedoch nur Referenzen auf relationale Datasets enthalten kann, enthält eine Abfrage mit verschachtelten Daten eine SELECT-Anweisung zum Definieren von Vorgängen für jedes übergeordnete und untergeordnete Schema in der Ausgabe. Der Query-Editor enthält einen Tab für jede Klausel der Abfrage: ● SELECT bietet eine Möglichkeit zum Angeben eigener Zeilen zur Ausgabe (identische doppelt vorhandene Zeilen werden verworfen). ● FROM führt alle Eingabeschemas auf und ermöglicht die Angabe von Join-Paaren und Bedingungen. Die Parameter, die Sie für die folgenden Tabs eingeben, gelten nur für das aktuelle Schema (das im Textfeld "Ausgabeschema" rechts oben im Abfrageeditor angezeigt wird): Designer-Handbuch Verschachtelte Daten PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 237 ● WHERE ● GROUP BY ● ORDER BY Weitere Informationen Abfrageeditor [Seite 185] Referenzhandbuch: Transformationen, Data-Integrator-Transformationen, XML_Pipeline 11.3.2 FROM-Klausel-Konstruktion Die FROM-Klausel ermöglicht Ihnen, die in einer Join-Anweisung zu verwendenden Tabellen und Sichten anzugeben. Die FROM-Klausel befindet sich unten im Tab „FROM“. Sie wird automatisch mit den Informationen aus dem Bereich "Eingabeschema(s)" oben und dem Bereich "Join-Paare" in der Mitte des Tabs aufgefüllt. Sie können die FROM-Klausel ändern, indem Sie das ausgewählte Schema im Bereich „Eingabeschema(s)“ und dem Bereich „Join-Paare“ ändern. Im Bereich "Eingabeschema(s)" ausgewählte (und in der FROM-Klausel widergespiegelte) Schemas, einschließlich Spalten mit verschachtelten Schemas, stehen für die Aufnahme in der Ausgabe zur Verfügung. Wenn Sie mehrere Schemas in den Bereich "Eingabeschema(s)" aufnehmen (indem Sie das Kontrollkästchen From markieren), können Sie Join-Paare und Join-Bedingungen angeben und Join-Rang und Cache für jedes Eingabeschema eingeben. FROM-Klausel-Beschreibungen und das Verhalten der Abfrage sind bei verschachtelten Daten und bei relationalen Daten identisch. Das aktuelle Schema ermöglicht es Ihnen, mehrere SELECT-Anweisungen in einer einzigen Abfrage voneinander zu unterscheiden. Da die SELECT-Anweisungen jedoch voneinander abhängig sind und der Aufbau willkürlicher Datasets mit der Benutzeroberfläche einfach ist, kann die Ermittlung geeigneter FROM-Klauseln für mehrere Verschachtelungsebenen komplex sein. Eine FROM-Klausel kann folgende Elemente enthalten: ● Ein beliebiges Schema der obersten Ebene von der Eingabe ● Ein beliebiges Schema, das in der FROM-Klausel des übergeordneten Schemas eine Spalte eines Schemas ist ● Eine beliebige Join-Bedingung von den Join-Paaren Die FROM-Klausel bildet einen Pfad, der auf einer beliebigen Ausgabeebene beginnen kann. Das erste Schema im Pfad muss immer ein Schema oberster Ebene von der Eingabe sein. Welche Daten eine SELECT-Anweisung von einem unteren Schema erzeugt, hängt davon ab, ob die FROM-Klausel auf der obersten Ebene ein Schema enthält. Bei den nächsten beiden Beispielen werden anhand des Kundenauftrags-Datasets Szenarien veranschaulicht, bei denen Werte der FROM-Klausel die Daten ändern, die aus der Abfrage resultieren. 238 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Verschachtelte Daten Weitere Informationen Ändern des Inhalts von Ausgabeschemas [Seite 185] 11.3.2.1 Beispiel: FROM-Klausel enthält alle Eingaben der obersten Ebene Um detaillierte Kundeninformationen für alle Aufträge in die Ausgabe einzuschließen, verbinden Sie das Order_Status_In-Schema auf der obersten Ebene mit dem Cust-Schema. Fügen Sie beide Eingabeschemas auf der obersten Ebene in die FROM-Klausel ein, um die entsprechenden Daten zu produzieren. Wenn Sie beide Eingabeschemas im Eingabeschema-Bereich des Tabs FROM auswählen, werden sie automatisch in der FROMKlausel angezeigt. Beachten Sie folgende Punkte: ● Die Tabelle der Eingabeschema(s) im Tab FROM enthält die beiden Schemas auf oberster Ebene Order_Status_In und Cust (dies sieht man auch in der FROM-Klausel). ● Der Bereich "Ausgabeschema" zeigt das verschachtelte Schema cust_info und die Spalten Cust_ID, Customer_name und Address an. Designer-Handbuch Verschachtelte Daten PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 239 11.3.2.2 Beispiel: Die FROM-Klausel auf tieferer Ebene enthält Eingaben von der obersten Ebene Angenommen, Sie möchten, dass detaillierte Informationen von einem Schema für jede Zeile auf einer tieferen Ebene eines anderen Schemas angezeigt werden. Die Eingabe enthält beispielsweise ein Materials-Schema auf oberster Ebene und ein LineItems-Schema, und Sie möchten, dass die Ausgabe detaillierte Informationen für jede Zeilenposition enthält. In der Grafik unten sieht man, wie dies im Designer konfiguriert wird. Das Beispiel links zeigt die folgende Konfiguration: ● Im Bereich Eingabeschema(s) im Tab "FROM" ist das verschachtelte LineItems-Schema ausgewählt. ● Im Tab "FROM" wird die FROM-Klausel „FROM "Order".LineItems“ angezeigt. Das Beispiel rechts zeigt die folgende Konfiguration: ● Das Materials.Description-Schema wird dem LineItems.Item-Ausgabeschema zugeordnet. ● Auf dem Tab "FROM" sind im Bereich "Eingabeschema(s)" die Einträge "Materials" und "Order.LineItems ausgewählt (in der Spalte "Von" wird ein Häkchen angezeigt). ● Es wird ein Join-Paar angelegt, mit dem das verschachtelte Order.LineItems-Schema mit dem MaterialsSchema unter Verwendung eines linken Outer-Join-Typs verbunden wird. 240 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Verschachtelte Daten ● Eine Join-Bedingung wird hinzugefügt, wobei das Item-Feld unter den verschachtelten Schema-LineItems gleich dem Item-Feld im Materials-Schema der obersten Ebene ist. Die resultierende FROM-Klausel: "Order".LineItems.Item = Materials.Item 11.3.3 Verschachteln von Spalten Wenn Sie Zeilen eines Schemas in einem anderen Schema verschachteln, ist das im verschachtelten Schema angelegte Dataset das Ergebnis einer Abfrage für das erste Schema unter Verwendung der zugehörigen Werte aus dem zweiten Schema. Wenn Sie beispielsweise Vertriebsauftragsinformationen in einem Kopfschema und in einem Einzelpostenschema haben, können Sie die Einzelposten unter dem Kopfschema verschachteln. Die Einzelposten für eine einzelne Zeile des Kopfschemas entsprechen den Ergebnissen einer Abfrage mit der Auftragsnummer: SELECT * FROM LineItems WHERE Header.OrderNo = LineItems.OrderNo Sie können eine Query-Transformation verwenden, um ein verschachteltes Dataset aus relationalen Daten anzulegen. Wenn Sie die im verschachtelten Schema enthaltenen Spalten angeben, geben Sie die Abfrage an, die verwendet wurde, um das verschachtelte Dataset für jede Zeile des übergeordneten Schemas zu definieren. 11.3.3.1 Anlegen von verschachtelten Datasets Führen Sie die nachfolgenden Schritte aus, um ein verschachteltes Dataset einzurichten. 1. Legen Sie einen Datenfluss mit den Eingabequellen an, die Sie in das verschachtelte Dataset einbeziehen möchten. 2. Platzieren Sie eine Query-Transformation und eine Zieltabelle im Datenfluss. Verbinden Sie die Quellen mit der Eingabe der Abfrage. 3. Öffnen Sie die Query-Transformation, und richten Sie die Auswahlliste, FROM-Klausel und WHERE-Klausel ein, um die SELECT-Anweisung zu beschreiben, die die Abfrage zur Bestimmung des Datasets der obersten Ebene ausführt. Designer-Handbuch Verschachtelte Daten PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 241 Tabelle 79: Option Hinweise Auswahlliste Ordnen Sie die Eingabeschemaelemente dem Ausgabe schema zu, indem Sie die Spalten vom Eingabeschema in das Ausgabeschema ziehen. Sie können auch neue Spalten oder Zuordnungsausdrücke für die Spalten einbeziehen. FROM-Klausel Beziehen Sie die Eingabequellen in der Liste auf dem Tab Von sowie alle zur Definition der Daten erforderlichen Joins und Join-Bedingungen ein. WHERE-Klausel Beziehen Sie alle Filter ein, die zur Definition des Datasets für die Ausgabe der obersten Ebene benötigt werden. 4. Legen Sie ein neues Schema in der Ausgabe an. Klicken Sie mit der rechten Maustaste im Bereich "Ausgabeschema" des Abfrageeditors, wählen Sie Neues Ausgabeschema aus, und geben Sie dem neuen Schema einen Namen. Das Symbol für neue Schemas wird in der Ausgabe angezeigt, verschachtelt unter dem Schema der obersten Ebene. Sie können auch ein gesamtes Schema von der Eingabe in die Ausgabe ziehen. 5. Ändern Sie das aktuelle Ausgabeschema in das verschachtelte Schema, indem Sie mit der rechten Maustaste auf das verschachtelte Schema klicken und Als aktuell festlegen auswählen. Der Abfrageeditor zeigt nun das neue aktuelle Schema an. 6. Geben Sie die FROM-Klausel, Auswahlliste und WHERE-Klausel an, um die SELECT-Anweisung zu beschreiben, die die Abfrage zur Bestimmung des Datasets der obersten Ebene ausführt. Tabelle 80: Option Hinweise FROM-Klausel Wenn Sie ein neues Ausgabeschema angelegt haben, müs sen Sie Schemas aus der Eingabe ziehen, um die FROMKlausel zu füllen. Falls Sie ein vorhandenes Schema von der Eingabe in die Ausgabe der obersten Ebene gezogen haben, wird dieses Schema automatisch zugeordnet und auf dem Tab "Von" aufgeführt. Auswahlliste Es stehen nur Spalten zur Verfügung, die die Anforderun gen der FROM-Klausel erfüllen. WHERE-Klausel Es stehen nur Spalten zur Verfügung, die die Anforderun gen der FROM-Klausel erfüllen. 7. Verschachteln Sie ein weiteres Schema auf dieser Ebene, falls es für die Ausgabe erforderlich ist. Wiederholen Sie die Schritte 4 bis 6 in diesem aktuellen Schema für alle verschachtelten Schemas, die Sie einrichten möchten. 8. Verschachteln Sie ein weiteres Schema unter der obersten Ebene, falls es für die Ausgabe erforderlich ist. Machen Sie das Schema der obersten Ebene zum aktuellen Schema. Weitere Informationen Abfrageeditor [Seite 185] 242 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Verschachtelte Daten FROM-Klausel-Konstruktion [Seite 238] Ändern des Inhalts von Ausgabeschemas [Seite 185] 11.3.4 Verwenden korrelierender Spalten in verschachtelten Daten Mithilfe der Korrelation können Sie ein verschachteltes Schema mit Spalten aus einem Schema einer höheren Ebene anlegen. In einem verschachtelt-relationalen Modell beziehen sich die Spalten in einem verschachtelten Schema implizit auf die Spalten in der übergeordneten Zeile. Um diese Beziehung zu nutzen, können Sie beim Anlegen des verschachtelten Schemas Spalten aus dem übergeordneten Schema verwenden. Die Spalte einer höheren Ebene ist eine korrelierende Spalte. Das Einschließen einer korrelierenden Spalte in ein verschachteltes Schema kann zwei Zwecken dienen: ● Die korrelierende Spalte ist ein Schlüssel im übergeordneten Schema. Wenn Sie den Schlüssel in das verschachtelte Schema einschließen, können Sie eine Beziehung zwischen den beiden Schemas beibehalten, nachdem Sie diese vom verschachtelten Datenmodell in ein relationales Modell konvertiert haben. ● Die korrelierende Spalte ist ein Attribut im übergeordneten Schema. Wenn Sie das Attribut in das verschachtelte Schema einschließen, können Sie das Attribut verwenden, um korrelierende Queries für die verschachtelten Daten zu vereinfachen. Um eine korrelierende Spalte in ein verschachteltes Schema einzuschließen, brauchen Sie das Schema nicht einzuschließen, das die Spalte in die FROM-Klausel des verschachtelten Schemas einschließt. 1. Legen Sie einen Datenfluss mit einer Quelle an, die ein übergeordnetes Schema mit einem verschachtelten Schema einschließt. Die Quelle könnte beispielsweise ein Auftragskopfschema mit einer Spalte LineItems sein, die ein verschachteltes Schema enthält. 2. Verbinden Sie eine Query mit der Ausgabe der Quelle. 3. Kopieren Sie im Query-Editor alle Spalten des übergeordneten Schemas in die Ausgabe. Zusätzlich zu den Spalten der obersten Ebene wird eine Spalte mit dem Namen LineItems angelegt, die ein verschachteltes Schema enthält, das dem verschachtelten LineItems-Schema in der Ausgabe entspricht. 4. Ändern Sie das aktuelle Schema in das LineItems-Schema. 5. Schließen Sie eine korrelierende Spalte in das verschachtelte Schema ein. Korrelierende Spalten können Spalten vom übergeordneten Schema und allen anderen Schemas in der FROM-Klausel des übergeordneten Schemas einschließen. Ziehen Sie beispielsweise die Spalte OrderNo vom Header-Schema in das LineItems-Schema. Wenn Sie die korrelierende Spalte einschließen, wird im LineItems-Schema eine neue Ausgabespalte mit dem Namen OrderNo angelegt und der Spalte Order.OrderNo zugeordnet. Das für LineItems angelegte Dataset schließt alle Spalten LineItems und die Spalte OrderNo ein. Wenn die korrelierende Spalte von einem anderen Schema als dem direkt übergeordneten Schema stammt, schließen die Daten im verschachtelten Schema nur die Zeilen ein, die sowohl mit den zugehörigen Werten in der aktuellen Spalte des übergeordneten Schemas als auch mit dem Wert der korrelierenden Spalte übereinstimmen. Designer-Handbuch Verschachtelte Daten PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 243 11.3.5 Eindeutige Zeilen und verschachtelte Daten Die Option Eindeutige Zeilen in Query-Transformationen entfernt alle doppelten Zeilen auf der obersten Ebene eines Joins. Dies ist besonders nützlich, um Kreuzprodukte in Joins zu vermeiden, die eine verschachtelte Ausgabe erzeugen. 11.3.6 Gruppieren von Werten über verschachtelte Schemas hinweg Wenn Sie eine GROUP-BY-Klausel für ein Schema mit einem verschachtelten Schema angeben, kombiniert die Gruppierungsoperation die verschachtelten Schemas für jede Gruppe. Sollen beispielsweise alle Einzelposten zusammengestellt werden, die in allen Aufträgen für jeden Staat enthalten sind, können Sie die GROUP-BY-Klausel in der obersten Ebene des Datasets auf die Spalte für den Staat (Order.State) setzen und ein Ausgabeschema anlegen, das die Spalte "State" (auf Order.State gesetzt) und das verschachtelte Schema LineItems umfasst. Das Ergebnis ist eine Reihe von Zeilen (eine einzige für jeden Staat), die die Spalte "State" und das verschachtelte Schema LineItems umfasst und alle Einzelposten für alle Aufträge für diesen Staat enthält. 11.3.7 Aufheben der Verschachtelung von Daten Wenn ein Dataset, das verschachtelte Schemas enthält, in ein relationales (nicht verschachteltes) Ziel geladen wird, muss die Verschachtelung der verschachtelten Zeilen aufgehoben werden. 244 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Verschachtelte Daten Ein Verkaufsauftrag kann beispielsweise ein verschachteltes Schema verwenden, um die Beziehung zwischen dem Auftragskopf und den Einzelposten des Auftrags zu definieren. Um die Daten in relationale Schemas zu laden, muss die mehrstufige Verschachtelung aufgehoben werden. Das Aufheben der Verschachtelung eines Schemas ergibt ein Kreuzprodukt aus dem Schema auf oberster Ebene (Elternschema) und dem verschachtelten Schema (Kindschema). Außerdem kann es vorkommen, dass Sie verschiedene Spalten aus verschiedenen Verschachtelungsebenen in verschiedene Schemas laden. Die Struktur eines Verkaufsauftrags kann beispielsweise abgeflacht werden, sodass die Auftragsnummer separat mit jedem Einzelposten verwaltet wird und der Kopf und die Einzelposteninformationen in separate Schemas geladen werden. In der Software können Sie eine beliebige Anzahl verschachtelter Schemas in beliebiger Tiefe aufheben. Unabhängig von der Anzahl der betroffenen Ebenen ist das Ergebnis einer Aufhebung der Verschachtelung stets ein Kreuzprodukt aus den über- und untergeordneten Schemas. Wenn die Verschachtelung mehrerer Ebenen aufgehoben wird, wird die Verschachtelung des innersten Kindes zuerst aufgehoben. Danach wird die Verschachtelung des Ergebnisses – das Kreuzprodukt aus dem übergeordneten Schema (Elternschema) und dem innersten Kind – mit dem Elternschema aufgehoben usw., bis das oberste Schema erreicht ist. Designer-Handbuch Verschachtelte Daten PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 245 Das Aufheben der Verschachtelung aller Schemas (Kreuzprodukt aller Daten) erbringt unter Umständen nicht die von Ihnen gewünschten Ergebnisse. Wenn ein Verkaufsauftrag beispielsweise mehrere Kundenwerte wie Warenempfänger- und Rechnungsadresse enthält, kann das Abflachen der Struktur des Auftrags durch Aufheben der Verschachtelung von Kunden- und Einzelpostenschemas zu Datenzeilen führen, die möglicherweise für die Verarbeitung des Auftrags nicht nützlich sind. 11.3.7.1 Aufheben der Verschachtelung von Daten 1. Legen Sie die Ausgabe an, deren Verschachtelung Sie aufheben möchten, im Ausgabeschema einer Abfrage. Daten für unbenötigte Spalten oder Schemas lassen sich nach dem Aufheben der Verschachtelung unter Umständen schlechter ausfiltern. Sie können den Befehl "Ausschneiden" verwenden, um Spalten oder Schemas von der obersten Ebene zu entfernen. Um verschachtelte Schemas oder Spalten innerhalb von verschachtelten Schemas zu entfernen, machen Sie das verschachtelte Schema zum aktuellen Schema und schneiden dann die unbenötigen oder verschachtelten Spalten aus. 246 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Verschachtelte Daten 2. Klicken Sie für jedes der verschachtelten Schemas, dessen Verschachtelung Sie aufheben möchten, mit der rechten Maustaste auf den Schemanamen, und wählen Sie Verschachtelung aufheben aus. Die Ausgabe der Abfrage (die Eingabe für den nächsten Schritt im Datenfluss) umfasst die Daten in der neuen Beziehung, wie das folgende Diagram zeigt. 11.3.8 Umwandeln niedrigerer Ebenen verschachtelter Daten Verschachtelte Daten, die in der Eingabe für Transformationen (außer einer Query- oder einer XML_PipelineTransformation) enthalten sind, werden durch die Transformation geleitet, ohne in die Operation der Transformation aufgenommen zu werden. Nur die Spalten auf der ersten Ebene des Eingabe-Datasets stehen für nachfolgende Transformationen zur Verfügung. 11.3.8.1 Umwandeln von Werten auf niedrigeren Ebenen verschachtelter Schemas 1. Rufen Sie die verschachtelten Daten mit einer der folgenden Möglichkeiten ab: ○ Verwenden Sie eine Query-Transformation, um die Verschachtelung der Daten aufzuheben. ○ Verwenden Sie eine XML_Pipeline-Transformation, um Teile der verschachtelten Daten auszuwählen. ○ Führen Sie die Transformation durch. 2. Verschachteln Sie die Daten wieder, um die verschachtelten Beziehungen wieder herzustellen. Designer-Handbuch Verschachtelte Daten PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 247 Weitere Informationen Aufheben der Verschachtelung von Daten [Seite 244] Referenzhandbuch: Transformationen, Data-Integrator-Transformationen, XML_Pipeline 11.4 XML-Extraktion und Parsen nach Spalten Sie können mit der Software XML-Daten extrahieren, die in einer Quelltabellen- oder einer Flatfile-Spalte gespeichert sind, sie als NRDM-Daten transformieren und dann als in eine Ziel- oder Flatfile-Spalte laden. Außerdem können Sie XML-Meldungs- und Dateidaten extrahieren, diese während der Transformation als NRDMDaten darstellen und dann in eine XML-Meldung oder -Datei laden. Immer mehr Datenbankanbieter ermöglichen die Speicherung von XML in einer Spalte. Beim Feld handelt es sich normalerweise um "varchar", "long" oder "clob". Die XML-Fähigkeiten der Software unterstützen auch das Lesen und Beschreiben solcher Felder. Die Software verfügt über vier Funktionen, mit denen das Extrahieren aus und Beladen von Spalten unterstützt wird: ● extract_from_xml ● load_to_xml ● long_to_varchar ● varchar_to_long Die Funktion extract_from_xml speichert den XML-Inhalt in einer einzelnen Spalte und legt die entsprechende NRDM-Struktur an, sodass die Software sie umwandeln kann. Diese Funktion akzeptiert nur varchar-Daten. Um das Extrahieren und Parsen nach Spalten zu ermöglichen, müssen Daten aus den Spalten "long" und "clob" in "varchar" konvertiert werden, bevor sie von der Software umgewandelt werden können. ● Die Software konvertiert eine Dateneingabe des Typs "clob" in "varchar", wenn Sie die Option Nicht unterstützte Datentypen importieren als VARCHAR der Größe auswählen, wenn Sie eine DatenbankDatastore-Verbindung im Datastore-Editor anlegen. ● Wenn Ihre Quelle den Datentyp "long" verwendet, konvertieren Sie die Daten mit der Funktion long_to_varchar in "varchar". Hinweis Softwareseitig ist das mit diesen Verfahren unterstützte XML auf Grund der aktuellen Beschränkung des Datentyps "varchar" auf 100 KB begrenzt. Es gibt Pläne, diese Beschränkungen in Zukunft aufzuheben. Mit der Funktion load_to_xml wird XML aus einer vorgegebenen NRDM-Struktur in der Software generiert und anschließend das generierte XML in eine varchar-Spalte geladen. Wenn ein Job die Ausgabe in eine Spalte des Typs "long" konvertieren soll, verwenden Sie die Funktion varchar_to_long, die die Ausgabe der Funktion load_to_xml als Eingabe verwendet. 248 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Verschachtelte Daten 11.4.1 Beispielszenarien Die folgenden Szenarios beschreiben die Verwendung von Funktionen zum Extrahieren von XML-Daten aus einer Quellspalte, um sie in eine Zielspalte zu laden. Weitere Informationen Extrahieren von XML-Daten aus Spalten in die Software [Seite 249] Laden von XML-Daten in eine Spalte mit dem Datentyp "long" [Seite 251] Data-Quality-XML-Zeichenfolgen mit der Funktion extract_from_xml extrahieren [Seite 252] 11.4.1.1 Extrahieren von XML-Daten aus Spalten in die Software In diesem Szenario werden mithilfe der Funktionen long_to_varchar und extract_from_xml XML-Daten aus einer Spalte mit Datentyp LONG extrahiert. Führen Sie die folgenden vorausgesetzten Schritte durch, bevor Sie mit den Hauptschritten fortfahren: 1. Importieren Sie eine Oracle-Tabelle mit einer Spalte namens Content mit dem Datentyp LONG. Diese Spalte enthält XML-Daten für eine Bestellung. 2. Importieren Sie das XML-Schema PO.xsd in das Repository importiert. Dieses Schema stellt das Format für die XML-Daten bereit. 3. Legen Sie ein Projekt, einen Job und einen Datenfluss an. 4. Öffnen Sie den Datenfluss, und legen Sie die Quelltabelle mit der Spalte namens Content im Datenfluss ab. Um XML-Daten aus einer Spalte in der Software zu extrahieren, führen Sie die oben stehenden vorausgesetzten Schritte und dann die folgenden durch: 1. Legen Sie eine Abfrage mit einer Ausgabespalte des Datentyps VARCHAR an, und stellen Sie sicher, dass sie groß genug ist für die XML-Daten. 2. Nennen Sie diese Ausgabespalte Content. 3. Öffnen Sie im Zuordnungsbereich des Abfrageeditors den Funktionsassistenten, wählen Sie den Funktionstyp Konvertierung und dann die Funktion long_to_varchar aus. Konfigurieren Sie die Funktion durch Eingabe der entsprechenden Parameter. long_to_varchar(content, 4000) Der zweite Parameter in dieser Funktion (im oben stehenden Beispiel 4000) ist die maximale Größe der XMLDaten, die in der Tabellenspalte gespeichert werden. Lassen Sie bei Verwendung dieses Parameters Vorsicht walten. Wenn die Spalte für die maximale XML-Datenmenge nicht groß genug ist, schneidet die Software die Daten ab und löst einen Laufzeitfehler aus. Allerdings sollten Sie auch keinen zu großen Wert eingeben, da sonst zur Laufzeit Arbeitsspeicher des Rechners verschwendet würde. 4. Ordnen Sie im Abfrageeditor die Quelltabellenspalte einer neuen Ausgabespalte zu. 5. Legen Sie eine zweite Abfrage an, die mithilfe der Funktion extract_from_xml die XML-Daten extrahiert. Designer-Handbuch Verschachtelte Daten PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 249 So rufen Sie die Funktion extract_from_xml auf: a. Klicken Sie mit der rechten Maustasten auf den aktuellen Kontext in der Abfrage. b. Wählen Sie Neuer Funktionsaufruf. c. Wenn der Funktionsassistent geöffnet ist, wählen Sie Konvertierung und dann extract_from_xml aus. Hinweis Sie können die Funktion extract_from_xml nur in einem neuen Funktionsaufruf verwenden. Ansonsten wird diese Funktion nicht im Funktionsassistenten angezeigt. 6. Geben Sie Werte für die Eingabeparameter ein, und klicken Sie auf Weiter. Tabelle 81: Eingabeparameter Parameter Beschreibung XML-Spaltenname Geben Sie Content ein, wobei es sich um die Ausgabespalte aus der vorherigen Abfrage handelt, in der die XML-Daten gespeichert sind. DTD- oder Schemaname Geben Sie den Namen des Bestellungsschemas ein (in die sem Fall PO für Purchase Order). Validierung aktivieren Geben Sie 1 ein, wenn die Software die XML-Daten mit dem angegebenen Schema validieren soll. Geben Sie 0 ein, wenn dies nicht erfolgen soll. 7. Wählen Sie für die Funktion eine oder mehrere Spalten für die Ausgabe aus. Bei diesem Bestellungsschema wird von fünf Elementen auf oberster Ebene ausgegangen: "orderDate", "shipTo", "billTo", "comment" und "items". Sie können eine beliebige Anzahl von Spalten mit skalaren oder Nested-Relational Data-Model-Daten (NRDM-Daten) auf oberster Ebene aus einem XML-Schema auswählen. Der Rückgabetyp der Spalte wird im Schema definiert. Wenn die Funktion beim Generieren der XML-Ausgabe aufgrund eines Fehlers fehlschlägt, gibt die Software NULL für skalare Spalten und leere verschachtelte Tabellen für NRDM-Spalten zurück. Die Funktion extract_from_xml fügt außerdem zwei Spalten hinzu: ○ AL_ERROR_NUM – Gibt Fehlercodes zurück: 0 bei erfolgreichem Abschluss und eine Ganzzahl ungleich Null bei Fehlern ○ AL_ERROR_MSG — Gibt eine Fehlermeldung zurück, wenn AL_ERROR_NUM nicht 0 ist. Gibt NULL zurück, falls AL_ERROR_NUM 0 ist. Wählen Sie eine oder mehrere dieser Spalten als das jeweilige Ausgabeziel für die Funktion extract_from_xml. 8. Klicken Sie auf Fertig stellen. Die Software generiert den Funktionsaufruf im aktuellen Kontext und füllt das Ausgabeschema der Abfrage mit den angegebenen Ausgabespalten. Nachdem die Daten nun in die NRDM-Struktur konvertiert wurden, können Sie dafür die gewünschten Transformationsoperationen ausführen. Wenn Sie beispielsweise die NRDM-Struktur in eine Ziel-XML-Datei laden möchten, legen Sie ein XML-Dateiziel an und verbinden die zweite Abfrage damit. Hinweis Falls Sie den Funktionsaufruf ändern möchten, klicken Sie auf diesen mit der rechten Maustaste in der zweiten Abfrage und wählen Funktionsaufruf ändern aus. 250 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Verschachtelte Daten In diesem Beispiel wurden zum Extrahieren von XML-Daten aus einer Spalte vom Typ LONG zwei Abfragen angelegt: Die erste Abfrage konvertiert die Daten mithilfe der Funktion long_to_varchar und die zweite Abfrage fügt die Funktion extract_from_xml hinzu. Alternativ können Sie auch nur eine einzige Abfrage anlegen, indem Sie den Funktionsausdruck long_to_varchar direkt in den ersten Parameter der Funktion extract_from_xml eingeben. Der erste Parameter der Funktion extract_from_xml kann eine Spalte mit dem Datentyp VARCHAR oder einen Ausdruck, der Daten des Typs VARCHAR zurückgibt, annehmen. Wenn der Datentyp der Quellspalte nicht LONG, sondern VARCHAR ist, dürfen Sie die Funktion long_to_varchar nicht in den Datenfluss einfügen. 11.4.1.2 Laden von XML-Daten in eine Spalte mit dem Datentyp "long" In diesem Szenario wird die load_to_xml-Funktion und die varchar_to_long-Funktion verwendet, um eine NRDMStruktur in skalare Daten des "varchar"-Typs in einem XML-Format zu konvertieren und in eine Spalte mit dem Datentyp "long" zu laden. In diesem Beispiel möchten Sie unter Verwendung der load_to_xml-Funktion eine NRDM-Struktur für eine Bestellung in XML-Daten konvertieren und die Daten anschließend in eine Oracle-Tabellenspalte mit dem Namen content laden, die den Datentyp "long" aufweist. Da die Funktion load_to_xml einen Wert mit dem "varchar"Datentyp zurückgibt, verwenden Sie die Funktion varchar_to_long, um den Wert des "varchar"-Datentyps in einen Wert mit dem Datentyp "long" zu konvertieren. 1. Legen Sie eine Abfrage an, und verbinden Sie eine vorherige Abfrage oder Quelle (die die NRDM-Struktur einer Bestellung aufweist) mit dieser Abfrage. Legen Sie in dieser Abfrage eine Ausgabespalte mit dem Datentyp "varchar" und dem Namen content an. Stellen Sie sicher, dass die Spalte groß genug für die XMLDaten ist. 2. Öffnen Sie aus dem Bereich Zuordnung den Funktionsassistenten, klicken Sie auf die Kategorie Konvertierungsfunktionen, und wählen Sie dann die Funktion load_to_xml. 3. Klicken Sie auf Weiter. 4. Geben Sie Werte für die Eingabeparameter ein. Die Funktion load_to_xml hat sieben Parameter. 5. Klicken Sie auf Fertig stellen. Im Zuordnungsbereich des Query-Fensters wird der Funktionsausdruck angezeigt: load_to_xml(PO, 'PO', 1, '<?xml version="1.0" encoding = "UTF-8" ?>', NULL, 1, 4000) In diesem Beispiel wird die NRDM-Struktur der Bestellung (PO) durch die Funktion in XML-Daten konvertiert, und der Wert wird dem Ausgangsspalteninhalt zugewiesen. 6. Legen Sie eine weitere Abfrage mit Ausgabespalten an, die den Spalten der Zieltabelle entsprechen. a. Angenommen, der Spaltenname lautet content, und der Datentyp entspricht "long". b. Öffnen Sie den Funktionsassistenten aus dem Zuordnungsbereich der Query, und wählen Sie die Kategorie Konvertierungsfunktionen. c. Verwenden Sie die Funktion varchar_to_long, um die Eingabespalte content der Ausgabespalte content zuzuordnen. Designer-Handbuch Verschachtelte Daten PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 251 Die Funktion varchar_to_long nimmt nur einen Eingabeparameter an. d. Geben Sie einen Wert für den Eingabeparameter ein. varchar_to_long(content) 7. Verbinden Sie diese Abfrage mit einem Datenbankziel. Wie im Beispiel mit der Funktion extract_from_xml wurden auch in diesem Beispiel zwei Abfragen verwendet. Sie haben die erste Abfrage verwendet, um eine NRDM-Struktur in XML-Daten zu konvertieren und den Wert einer Spalte vom "varchar"-Datentyp zuzuweisen. Die zweite Abfrage haben Sie verwendet, um den "varchar"-Datentyp in den Datentyp "long" zu konvertieren. Sie können nur eine Abfrage verwenden, wenn Sie die beiden Funktionen in einem Ausdruck verwenden: varchar_to_long( load_to_xml(PO, 'PO', 1, '<?xml version="1.0" encoding = "UTF-8" ? >', NULL, 1, 4000) ) Wenn der Datentyp der Spalte in der Zieldatenbanktabelle, in der die XML-Daten gespeichert sind, "varchar" ist, ist varchar_to_long in der Transformation nicht erforderlich. Weitere Informationen Referenzhandbuch: Funktionen und Prozeduren 11.4.1.3 Data-Quality-XML-Zeichenfolgen mit der Funktion extract_from_xml extrahieren Dieses Szenario verwendet die Funktion extract_from_xml, um XML-Daten aus den Transformationen Geocoder, Global Suggestion Lists, Global Address Cleanse und USA Regulatory Address Cleanse zu extrahieren. Die Funktionen Geocoder-Transformation, Global Suggestion Lists-Transformation und Vorschlagsliste in den Global Address Cleanse- und USA Regulatory Address Cleanse-Transformationen können ein Feld ausgeben, das eine XML-Zeichenfolge enthält. Die Transformationen geben die folgenden Felder aus, die XML enthalten können. Transformation Geocoder XML-Ausgabefeld Ergebnisliste Beschreibung des Ausgabefeldes Enthält eine XML-Ausgabezeichenfolge, wenn mehrere Datensätze für eine Suche zurückgegeben werden. Der Inhalt hängt von den verfügbaren Daten ab. Global Address Cleanse Suggestion_List Global Suggestion List USA Regulatory Address Cleanse Enthält eine XML-Ausgabezeichenfolge, die alle Feldwerte der Vorschlagslistenkomponenten umfasst, die in den Transformationsoptionen angegeben wurden. 252 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Verschachtelte Daten Transformation XML-Ausgabefeld Beschreibung des Ausgabefeldes Um diese Felder als XML auszugeben, müssen Sie in den Transformationsoptionen XML aus Ausgabeformat angeben. Um die in den XML-Zeichenfolgen enthaltenen Daten zu verwenden (beispielsweise in einer Webanwendung, die den als Web-Service veröffentlichten Job verwendet), müssen Sie die Daten extrahieren. Sie können die Daten auf zwei Arten extrahieren: Tabelle 82: Methoden zum Extrahieren von Daten Methode Beschreibung Fügen Sie eine Query-Transformation mit der ext ract_from_xml-Funktion hinzu. Bei dieser Methode fügen Sie nach der Geocoder-, Global Sug gestion Lists-, Global Address Cleanse- oder USA Regulatory Address Cleanse-Transformation eine Query-Transformation in den Datenfluss ein. Anschließend verwenden Sie die ext ract_from_xml-Funktion, um die verschachtelten Ausgabeda ten zu parsen. Diese Methode wird als optimale Vorgehensweise erachtet, da mit ihr geparste Ausgabedaten bereitgestellt werden, die für einen Integrator leicht zugänglich sind. Entwickeln Sie einen einfachen Datenfluss, mit dem die Ver schachtelung der verschachtelten Daten nicht aufgehoben wird. Bei dieser Methode geben Sie lediglich das Ausgabefeld aus, das die XML-Zeichenfolge enthält, ohne die Verschachtelung der verschachtelten Daten aufzuheben. Bei dieser Methode kann der Anwendungsentwickler oder In tegrator die Ausgabekomponenten im abschließenden Ausga beschema dynamisch auswählen, bevor er sie als Web-Ser vice zur Verfügung stellt. Der Anwendungsentwickler muss eng mit dem Datenfluss-Designer zusammenarbeiten, um den Datenfluss hinter einem Echtzeit-Web-Service zu kennen. Der Anwendungsentwickler muss die Transformationsoptionen kennen und angeben, was aus der Rückgabe-Adressvor schlagsliste zurückgegeben werden soll. Anschließend hebt er die Verschachtelung der XML-Ausgabezeichenfolge auf, um diskrete Adresselemente zu generieren. Weitere Informationen Datenqualität [Seite 361] Referenzhandbuch: Funktionen und Prozeduren, Beschreibungen von integrierten Funktionen, extract_from_xml Designer-Handbuch Verschachtelte Daten PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 253 11.4.1.3.1 Extrahieren von Data-Quality-XML-Zeichenfolgen mit der Funktion extract_from_xml 1. Legen Sie eine XSD-Datei für die Ausgabe an. 2. Legen Sie im Tab Format der lokalen Objektbibliothek ein XML-Schema für die XSD-Ausgabedatei an. 3. Legen Sie im Tab Format der lokalen Objektbibliothek ein XML-Schema für die Datei gac_suggestion_list.xsd, global_suggestion_list.xsd,urac_suggestion_list.xsd oder result_list.xsd an. 4. Nehmen Sie im Datenfluss das folgende Feld in das Ausgabeschema der Transformation auf: Tabelle 83: Transformation ○ Global Address Cleanse ○ Global Suggestion Lists ○ USA Regulatory Address Cleanse Geocoder Feld Vorschlagsliste Ergebnisliste 5. Fügen Sie eine Query-Transformation nach der Global Address Cleanse-, Global Suggestion Lists-,USA Regulatory Address Cleanse- oder Geocoder-Transformation hinzu. Schließen Sie den Vorgang wie beschrieben ab. a. Übergeben Sie alle Felder außer dem Feld "Vorschlagsliste" oder "Ergebnisliste" vom Eingabeschema an das Ausgabeschema. Ziehen Sie zu diesem Zweck Felder direkt vom Eingabeschema auf das Ausgabeschema. b. Klicken Sie im Ausgabeschema mit der rechten Maustaste auf den Abfrageknoten, und wählen Sie Neues Ausgabeschema. Geben Sie "Vorschlagsliste" oder "Ergebnisliste" als Schemaname ein (bzw. den jeweiligen Feldnamen in Ihrer XSD-Ausgabedatei). c. Klicken Sie im Ausgabeschema mit der rechten Maustaste auf das Feld „Vorschlagsliste“ oder „Ergebnisliste“, und wählen Sie die Option Als aktuell festlegen. d. Klicken Sie im Ausgabeschema mit der rechten Maustaste auf das Feld „Vorschlagsliste“ oder „Ergebnisliste“, und wählen Sie Neuer Funktionsaufruf. e. Wählen Sie Konvertierungsfunktione in der Spalte Funktionskategorien und extract_from_xml in der Spalte Funktionsname aus, und klicken Sie auf Weiter. f. Geben Sie im Fenster Eingabeparameter definieren die folgenden Informationen ein, und klicken Sie dann auf Weiter. Tabelle 84: Eingabeparameteroptionen definieren Option Beschreibung XML-Feldname Wählen Sie das Feld „Vorschlagsliste“ oder „Ergebnis liste“ von der vorgelagerten Transformation. DTD-oder Schemaname Wählen Sie das XML-Schema, das Sie für die Datei gac_suggestion_list.xsd, urac_suggestion_list.xsd oder result_list.xsd angelegt haben. Validierung aktivieren Geben Sie 1 ein, um die Validierung zu aktivieren. g. Wählen Sie "LIST" oder "RECORD" aus der linken Parameterliste, und klicken Sie auf die rechte Pfeiltaste, um den Parameter zur Liste "Ausgewählte Ausgabeparameter" hinzuzufügen. 254 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Verschachtelte Daten h. Klicken Sie auf Fertig stellen. Das Ausgabeschema enthält die Vorschlagslisten-/Ergebnislistenfelder im Feld „Vorschlagsliste“ bzw. „Ergebnisliste“. 6. Nehmen Sie das XML-Schema für die XML-Ausgabedatei nach der Abfrage auf. Öffnen Sie das XML-Schema, um zu validieren, dass die Felder im Eingabeschema und im Ausgabeschema identisch sind. 7. Wenn Sie Daten von einer Global Address Cleanse-, Global Suggestion Lists- oder USA Regulatory Address Cleanse-Transformation extrahieren und nur einen Teil der verfügbaren Vorschlagslistenausgabefelder im Tab Optionen ausgeben möchten, fügen Sie eine zweite Query-Transformation ein, um die Felder anzugeben, die Sie ausgeben möchten. Auf diese Weise können Sie die Ausgabekomponenten im endgültigen Ausgabeschema auswählen, bevor es als Web-Service zur Verfügung steht. Weitere Informationen Datenqualität [Seite 361] Referenzhandbuch: Funktionen und Prozeduren, Beschreibungen von integrierten Funktionen, extract_from_xml 11.5 JSON-Extraktion Sie können die Software neben der Extraktion von JSON-Meldungs- und Dateidaten, wobei diese während der Transformation als NRDM-Daten dargestellt und anschließend in eine JSON-Meldung oder -Datei geladen werden, auch zur Extraktion von in einer Quelltabellen- oder Flatfile-Spalte gespeicherten JSON-Daten verwenden. Die Software enthält die Funktion extract_from_json zur Unterstützung der Extraktion aus Spalten. Die Funktion extract_from_json speichert den JSON-Inhalt in einer einzelnen Spalte und legt die entsprechende NRDM-Struktur an, sodass die Software sie umwandeln kann. Diese Funktion akzeptiert nur varchar-Daten. Um das Extrahieren und Parsen nach Spalten zu ermöglichen, müssen Daten aus den Spalten „long“ und „clob“ in „varchar“ konvertiert werden, bevor sie von der Software umgewandelt werden können. ● Die Software konvertiert eine Dateneingabe des Typs „clob“ in „varchar“, wenn Sie die Option Nicht unterstützte Datentypen importieren als VARCHAR der Größe auswählen, wenn Sie eine DatenbankDatastore-Verbindung im Datastore-Editor anlegen. ● Wenn Ihre Quelle den Datentyp „long“ verwendet, konvertieren Sie die Daten mit der Funktion long_to_varchar in „varchar“. 11.5.1 Extrahieren von Daten von der JSON-Zeichenfolge mit der Funktion extract_from_json 1. Legen Sie eine Schemadatei oder eine JSON-Datendatei für die Ausgabe an. 2. Klicken Sie im Tab Format der lokalen Objektbibliothek auf Neu JSON-Schema , um mithilfe der Schemadatei oder der JSON-Datendatei oben ein Schema für Ihre Ausgabe anzulegen. Designer-Handbuch Verschachtelte Daten PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 255 3. Klicken Sie im Ausgabeschema des Datenflusses mit der rechten Maustaste auf eine Spalte und wählen Neuer Funktionsaufruf aus. 4. Wählen Sie in der Kategorie Konvertierungsfunktionen extract_from_json und klicken auf Weiter. 5. Geben Sie im Fenster „Eingabeparameter definieren die folgenden Informationen ein, und klicken Sie dann auf Weiter. Option Beschreibung JSON-Feldname Wählen Sie das Feld „Vorschlagsliste“ oder „Ergebnisliste“ von der vorgelagerten Transformation. Schemaname Wählen Sie das von Ihnen angelegte Schema aus Validierung aktivieren Geben Sie 1 ein, um die Validierung zu aktivieren. 6. Wählen Sie LIST oder RECORD aus der linken Parameterliste, und klicken Sie auf die rechte Pfeiltaste, um den Parameter zur Liste der ausgewählten Ausgabeparameter hinzuzufügen. 7. Klicken Sie auf Fertig stellen. Das Ausgabeschema enthält die Vorschlagslisten-/Ergebnislistenfelder im Feld "Vorschlagsliste" bzw. "Ergebnisliste". 256 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Verschachtelte Daten 12 Echtzeitjobs Die Software unterstützt Datentransformation in Echtzeit. "Echtzeit" bedeutet, dass die Software Anforderungen von ERP-Systemen und Webanwendungen empfangen und Antworten unmittelbar nach Erhalt der angeforderten Daten von einem Datencache oder einer zweiten Anwendung senden kann. Sie definieren Operationen für die Verarbeitung bedarfsgerechter Meldungen, indem im Designer Echtzeitjobs angelegt werden. 12.1 Anforderungsantwort-Meldungsverarbeitung Die über ein Echtzeitsystem weitergeleitete Meldung umfasst die Informationen, die zur Durchführung eines Geschäftsvorgangs erforderlich sind. Der Inhalt der Meldung kann variieren: ● Es kann sich um einen Kundenauftrag oder eine Rechnung handeln, der bzw. die von einem ERP-System verarbeitet wird und für einen Datencache bestimmt ist. ● Es kann sich um eine Auftragsstatusanfrage von einer Webanwendung handeln, für die eine Antwort von einem Datencache- oder Back-Office-System erforderlich ist. Der Zugriffsserver wartet fortwährend auf eingehende Meldungen. Wenn eine Meldung empfangen wird, leitet der Zugriffsserver die Meldung an einen wartenden Prozess weiter, der eine vordefinierte Reihe von Operationen für den Meldungstyp ausführt. Anschließend empfängt der Zugriffsserver eine Antwort auf die Meldung und antwortet der Ursprungsanwendung. Für zwei Komponenten ist die Anforderungsantwort-Meldungsverarbeitung erforderlich: Tabelle 85: Komponente Beschreibung Zugriffsserver Wartet auf Meldungen und leitet die Meldungen auf Grundlage des Meldungstyps weiter. Echtzeitjob Führt eine vordefinierte Reihe von Operationen für diesen Meldungstyp aus und generiert eine Antwort. Für die Verarbeitung müssen möglicherweise zusätzliche Daten aus einem Datencache zur Meldung hinzugefügt werden, oder die Meldungsdaten müssen in einen Datencache geladen werden. Der Zugriffsserver gibt die Antwort an die Ursprungsanwendung zurück. Designer-Handbuch Echtzeitjobs PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 257 12.2 Was ist ein Echtzeitjob? Im Designer können Sie die Verarbeitung von Echtzeitmeldungen mit einem Echtzeitjob definieren. Sie legen für jede Art von Meldung, die Ihr System erzeugen kann, einen anderen Echtzeitjob an. 12.2.1 Echtzeitjobs im Vergleich zu Batch-Jobs Ein Echtzeitjob extrahiert Daten aus dem Textkörper der empfangenen Meldung und aus allen sekundären Quellen, die im Job verwendet werden. Echtzeitjobs extrahieren, transformieren und laden Daten, genau wie Batch-Jobs. Jeder Echtzeitjob kann Daten aus einem einzelnen Meldungstyp extrahieren. Außerdem kann er Daten aus anderen Quellen wie Tabellen oder Dateien extrahieren. In Echtzeitjobs stehen dieselben leistungsstarken Transformationen zur Verfügung, die Sie auch in Batch-Jobs definieren können. Allerdings werden Transformationen in Echtzeitjobs unter Umständen anders eingesetzt. Sie könnten beispielsweise Verzweigungen und Logiksteuerelemente öfter verwenden als in Batch-Jobs. Wenn Kunden wissen möchten, wann ihre Bestellung in Ihrem Vertriebslager abzuholen ist, könnten Sie einen Job namens "BestellstatusPrüfen" mit einer Lookup-Funktion anlegen, um die Bestellposten zu zählen, und dann eine Case-Transformation verwenden, um den Status in Form von Zeichenfolgen wie den folgenden auszugeben: „Es liegen keine Posten zur Abholung bereit“ oder „X Posten Ihrer Bestellung können abgeholt werden“ oder „Ihre Bestellung liegt zur Abholung bereit“. In Echtzeitjobs schreibt die Software außerdem Daten parallel in Meldungsziele und sekundäre Ziele. Damit wird sichergestellt, dass jede Meldung so bald wie möglich eine Antwort erhält. Im Gegensatz zu Batch-Jobs werden Echtzeitjobs nicht als Reaktion auf einen Zeitsteuerungs- oder internen Trigger ausgeführt. Ihre Ausführung erfolgt vielmehr als Echtzeitdienst über den Administrator. Echtzeitdienste warten dann auf Meldungen vom Zugriffsserver. Wenn der Zugriffsserver eine Meldung empfängt, gibt er sie an einen ausgeführten Echtzeitdienst weiter, der auf die Verarbeitung des jeweiligen Meldungstyps ausgelegt ist. Der 258 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Echtzeitjobs Echtzeitdienst verarbeitet die Meldung und gibt eine Antwort zurück. Der Echtzeitdienst bleibt weiter in Bereitschaft und verarbeitet Meldungen bei Bedarf, bis er eine Anweisung zum Beenden erhält. 12.2.2 Meldungen Zu typischen Meldungen gehören Informationen, die zum Deployment einer bestimmten Geschäftsoperation oder zum Generieren einer entsprechenden Antwort benötigt werden. Wie Sie einen Echtzeitjob entwerfen, hängt davon ab, welche Meldung von dem Job verarbeitet werden soll. Eine Meldung könnte beispielsweise Informationen umfassen, die zur Bestimmung des Bestellstatus für eine bestimmte Bestellung erforderlich sind. Beim Inhalt der Meldung kann es sich einfach um die Bestellnummer handeln. Der jeweilige Echtzeitjob könnte anhand der Eingabe die richtigen Quellen abfragen und die entsprechende Produktinformation zurückgeben. In diesem Fall enthält die Meldung Daten, die in Form einer einzelnen Spalte in einer Tabelle mit einer Zeile dargestellt werden können. In einem anderen Fall könnte eine Meldung eine Bestellung beinhalten, die in ein ERP-System eingegeben werden muss. In der Meldung sind unter Umständen die Bestellnummer, Kundeninformationen und die Einzelpostendetails für die Bestellung enthalten. Die Meldungsverarbeitung könnte die Bestätigung zurückgeben, dass das Senden der Bestellung erfolgreich war. In diesem Fall enthält die Meldung Daten, die nicht in einer einzigen Tabelle dargestellt werden können. Die Informationen des Bestellungskopfes lassen sich in einer Tabelle und die Einzelposten für die Bestellung in einer zweiten Tabelle wiedergeben. Die Software stellt die Kopf- und Einzelpostendaten in der Meldung in Form einer verschachtelten Beziehung dar. Designer-Handbuch Echtzeitjobs PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 259 Bei der Meldungsverarbeitung werden alle Zeilen der verschachtelten Tabelle für jede Zeile der Tabelle auf oberster Ebene vom Echtzeitjob verarbeitet. In dieser Bestellung werden beide Einzelposten für die einzelne Zeile der Kopfinformationen verarbeitet. Echtzeitjobs können nur eine Datenzeile in einer Antwortmeldung (Meldungsziel) senden. Alledings besteht die Möglichkeit, Meldungsziele so zu strukturieren, dass alle Daten in einer einzigen Zeile untergebracht werden. Hierfür verschachteln Sie Tabellen in Spalten einer einzigen Tabelle auf oberster Ebene. Die Datenflüsse der Software unterstützen die Verschachtelung von Tabellen in anderen Tabellen. Weitere Informationen Verschachtelte Daten [Seite 222] 12.2.3 Echtzeitjobs – Beispiele Beispiele, die einen allgemeinen Überblick über die Vorgehensweisen von Echtzeitjobs in typischen Echtzeitszenarien bieten. In nachfolgenden Abschnitten werden die eigentlichen Objekte beschrieben, die Sie zum Anlegen der Logik im Designer verwenden. 12.2.3.1 Laden von Transaktionen in eine BackofficeAnwendung Ein Echtzeitjob kann eine Transaktion von einer Webanwendung empfangen und in eine Backoffice-Anwendung (ERP, SCM, Legacy-Programm) laden. Mithilfe einer Query-Transformation lassen sich Werte aus einem Datencache zur Ergänzung der Transaktion einbeziehen, bevor sie auf die Backoffice-Anwendung (wie ein ERPSystem) angewendet wird. 260 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Echtzeitjobs 12.2.3.2 Erfassen von Backoffice-Daten in einen Datencache Mithilfe von Meldungen lässt sich der Datencache auf dem letzten Stand halten. Echtzeitjobs können Meldungen von einer Backoffice-Anwendung empfangen und in einen Datencache oder ein Data-Warehouse laden. 12.2.3.3 Abrufen von Werten – Datencaches und BackofficeAnwendungen Sie können Echtzeitjobs anlegen, die anhand von Werten aus einem Datencache feststellen, ob die BackofficeAnwendung (wie ein ERP-System) direkt abzufragen ist oder nicht. Designer-Handbuch Echtzeitjobs PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 261 12.3 Anlegen von Echtzeitjobs Sie können Echtzeitjobs mit den gleichen Objekten anlegen wie Batch-Jobs (Datenflüsse, Workflows, bedingte Verzweigungen, Skripte, While-Schleifen usw.). Die Objektnutzung muss jedoch einem gültigen Echtzeit-Jobmodell folgen. 12.3.1 Echtzeitjob-Modelle Im Gegensatz zu Batch-Jobs, die meistens große Datenmengen zu festgelegten Zeiten verschieben, wartet ein Echtzeitjob, sobald er als Echtzeitservice gestartet wurde, auf eine Anforderung. Wenn ein Echtzeitjob eine Anforderung erhält (meistens um auf eine kleinere Anzahl von Datensätzen zuzugreifen), verarbeitet die Software die Anforderung, gibt eine Antwort zurück und wartet weiter. Die Überwachungslogik des Warteprozesses bildet eine Prozessschleife. Ein Echtzeitjob besteht aus drei Prozesskomponenten: der Initialisierung, einer Echtzeit-Prozessschleife und der Bereinigung. ● Bei der Initialisierungskomponente (optional) kann es sich um ein Skript, einen Workflow, einen Datenfluss oder eine Kombination von Objekten handeln. Sie wird nur ausgeführt, wenn ein Echtzeitservice startet. ● Die Echtzeit-Verarbeitungsschleife ist ein Container für die einzelne Prozesslogik des Jobs. Sie können in ihr eine beliebige Anzahl von Workflows und Datenflüssen angeben. ● Bei der Bereinigungskomponente (optional) kann es sich um ein Skript, einen Workflow, einen Datenfluss oder eine Kombination von Objekten handeln. Sie wird nur ausgeführt, wenn ein Echtzeitservice beendet wird. Bei einer Echtzeit-Prozessschleife muss eine einzelne Meldungsquelle im ersten Schritt und ein einzelnes Meldungsziel im letzten Schritt enthalten sein. 262 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Echtzeitjobs Die folgenden Modelle unterstützen diese Regel: ● Modell mit einem einzigen Datenfluss ● Modell mit mehreren Datenflüssen ● Request/Acknowledge-Datenflussmodell Weitere Informationen Modell mit einem einzigen Datenfluss [Seite 263] Modell mit mehreren Datenflüssen [Seite 263] Supplement for SAP: SAP ERP und R/3 und Echtzeitjobs, IDoc-Quellen in Echtzeitjobs 12.3.1.1 Modell mit einem einzigen Datenfluss Bei dem Modell mit einem einzigen Datenfluss legen Sie einen Echtzeitjob unter Verwendung eines einzigen Datenflusses in seiner Echtzeit-Verarbeitungsschleife an. Dieser eine Datenfluss muss eine einzige Meldungsquelle und ein einziges Meldungsziel enthalten. 12.3.1.2 Modell mit mehreren Datenflüssen Bei dem Modell mit mehreren Datenflüssen können Sie einen Echtzeitjob unter Verwendung mehrerer Datenflüsse in ihrer Echtzeit-Verarbeitungsschleife anlegen. Durch die Verwendung mehrerer Datenflüsse können Sie sicherstellen, dass die Daten in jeder Meldung im ersten Datenfluss vollständig verarbeitet sind, bevor die Verarbeitung für den nächsten Datenfluss gestartet wird. Wenn die Daten beispielsweise aus 40 Elementen bestehen, müssen alle 40 Elemente den ersten Datenfluss durchlaufen und in einer Bereitstellungs- oder Arbeitsspeichertabelle gespeichert werden, bevor sie an den zweiten Datenfluss übergeben werden. Auf diese Weise können Sie alle Daten in einer Meldung an jedem Punkt in Designer-Handbuch Echtzeitjobs PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 263 einem Echtzeitjob steuern und erfassen, sodass sie für Entwurfs- oder Fehlerbehebungszwecke zur Verfügung stehen. Wenn Sie mehrere Datenflüsse in einer Echtzeit-Verarbeitungsschleife verwenden, beachten Sie Folgendes: ● Das erste Objekt in der Schleife muss ein Datenfluss sein. Dieser Datenfluss muss genau eine Meldungsquelle haben. ● Das letzte Objekt in der Schleife muss ein Datenfluss sein. Dieser Datenfluss muss ein Meldungsziel haben. ● Weitere Datenflüsse dürfen weder Meldungsquellen noch Meldungsziele haben. ● Sie können der Schleife eine beliebige Anzahl weiterer Datenflüsse hinzufügen, und Sie können sie innerhalb einer beliebigen Anzahl Workflows hinzufügen. ● Alle Datenflüsse können Eingabe- und/oder Ausgabearbeitsspeichertabellen verwenden, um Datasets an den nächsten Datenfluss zu übergeben. Arbeitsspeichertabellen speichern Daten im Arbeitsspeicher, während eine Schleife ausgeführt wird. Sie verbessern die Leistung von Echtzeitjobs mit mehreren Datenflüssen. 12.3.2 Verwenden von Echtzeitjob-Modellen 12.3.2.1 Modell mit einem einzigen Datenfluss Wenn Sie einen einzigen Datenfluss innerhalb einer Echtzeit-Verarbeitungsschleife verwenden, könnte das Datenflussdiagramm ungefähr wie folgt aussehen: Beachten Sie, dass der Datenfluss über eine Meldungsquelle und ein Meldungsziel verfügt. 12.3.2.2 Modell mit mehreren Datenflüssen Wenn Sie mehrere Datenflüsse innerhalb einer Echtzeit-Verarbeitungsschleife verwenden, könnten die Datenflussdiagramme ungefähr wie die im folgenden Beispielszenario gezeigten Diagramme aussehen, in denen Data Services Daten gemäß Ihres aus mehreren Datenflüssen bestehenden Entwurfs in mehrere Ziele schreibt. 264 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Echtzeitjobs Voraussetzungen für das Beispielszenario Im Job müssen die folgenden Aufgaben ausgeführt werden, wobei jede Aufgabe abgeschlossen sein muss, bevor die nächste begonnen werden kann: ● Empfangen von Anforderungen zum Status einzelner Bestellungen aus einem Webportal und Aufzeichnen aller Meldungen in ein Sicherungs-Flatfile ● Ausführen eines Abfrage-Joins, um den Status der jeweiligen Bestellung herauszufinden und in eine Kundentabelle in der Datenbank zu schreiben ● Beantworten der einzelnen Meldungen mit den Ergebnissen des Abfrage-Joins Lösung: Legen Sie zuerst einen Echtzeitjob an, und fügen Sie der Echtzeit-Verarbeitungsschleife einen Datenfluss, einen Workflow und einen weiteren Datenfluss hinzu. Fügen Sie als Zweites dem Workflow einen Datenfluss hinzu. Richten Sie dann die Aufgaben in jedem Datenfluss ein: ● Der erste Datenfluss empfängt die XML-Meldung (über eine XML-Meldungsquelle) und zeichnet die Meldung in dem Flatfile auf (Formatziel Flatfile). Gleichzeitig schreibt derselbe Datenfluss die Daten in eine Arbeitsspeichertabelle (Tabellenziel). Hinweis Die Anlage einer Arbeitsspeichertabelle empfiehlt sich, um Daten in sequenzielle Datenflüsse zu verschieben. ● Der zweite Datenfluss liest die Meldungsdaten aus der Arbeitsspeichertabelle (Tabellenquelle), führt ein Join mit gespeicherten Daten (Tabellenquelle) aus und schreibt die Ergebnisse in eine Datenbanktabelle (Tabellenziel) und eine neue Arbeitsspeichertabelle (Tabellenziel). Beachten Sie, dass dieser Datenfluss weder über eine Meldungsquelle noch ein Meldungsziel verfügt. Designer-Handbuch Echtzeitjobs PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 265 ● Der letzte Datenfluss sendet die Antwort. Er liest das Ergebnis des Joins in der Arbeitsspeichertabelle (Tabellenquelle) und lädt die Antwort (XML-Meldungsziel). Weitere Informationen Entwerfen von Echtzeitanwendungen [Seite 276] Speicher-Datastores [Seite 81] 12.3.3 Anlegen eines Echtzeitjobs mit einem einzelnen Datenfluss 1. Legen Sie im Designer ein Projekt an, oder öffnen Sie ein vorhandenes Projekt. 2. Klicken Sie im Projektbereich mit der rechten Maustaste auf den Leerraum, und wählen Sie im Kontextmenü Neuer Echtzeitjob. Im Projektbereich wird New_RTJob1 angezeigt. Im Arbeitsbereich wird die Jobstruktur angezeigt, die aus zwei Markierungen besteht: ○ RT_Process_begins ○ Step_ends Diese Markierungen stellen den Anfang und das Ende einer Echtzeit-Verarbeitungsschleife dar. 3. Benennen Sie im Projektbereich New_RTJob1 um. Fügen Sie zu Jobnamen stets ein Präfix mit dem Jobtyp hinzu. Verwenden Sie in diesem Fall die Benennungskonvention: RTJOB_JobName. Obwohl gespeicherte Echtzeitjobs auf dem Tab "Job" der Objektbibliothek gruppiert werden, werden die Jobnamen möglicherweise auch in Texteditoren angezeigt, die zur Anlage von Adapter- oder Web-ServiceAufrufen verwendet werden. In diesen Fällen können Sie die Jobs durch das mit dem Jobnamen gespeicherte Präfix einfacher identifizieren. 266 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Echtzeitjobs 4. Wenn Sie einen Job mit einem einzelnen Datenfluss anlegen möchten: a. Klicken Sie auf das Datenflusssymbol in der Tool-Palette. Sie können Datenflüsse zu einem Batch- oder Echtzeitjob hinzufügen. Wenn Sie ein Datenflusssymbol in einem Job platzieren, signalisieren Sie Data Services damit, den Datenfluss entsprechend den Anforderungen des Jobtyps (Batch oder Echtzeit) zu validieren. b. Klicken Sie in die Schleife. Die Grenzwerte einer Schleife werden durch Anfangs- und Endmarkierungen angegeben. In einer Echtzeit-Verarbeitungsschleife sind eine Meldungsquelle und ein Meldungsziel zulässig. c. Verbinden Sie die Anfangs- und Endmarkierungen mit dem Datenfluss. d. Legen Sie den Datenfluss einschließlich Meldungsquelle und Meldungsziel an. e. Fügen Sie bei Bedarf Initialisierungs- und Bereinigungsobjekte hinzu, und konfigurieren und verbinden Sie diese. 12.4 Echtzeitquell- und -zielobjekte Echtzeitjobs müssen eine Echtzeitquelle und/oder ein Zielobjekt enthalten. Normalerweise stehen Folgende zur Verfügung: Tabelle 86: Objekt Beschreibung Verwendungs zweck XML-Meldung Eine im DTD- oder XML-Schemaformat strukturierte XML- Quelle oder Ziel Meldung Direkt oder über Adapter Ausgehende Mel dung Eine Echtzeitmeldung in einem anwendungsspezifischen Format (vom XML-Parser nicht lesbar) Über einen Adapter Ziel Softwarezugriff Sie können auch IDoc-Meldungen als Echtzeitquellen für SAP-Anwendungen verwenden. Weitere Informationen finden Sie im Ergänzungsdokument für SAP. Beim Hinzufügen von Quellen und Zielen zu Echtzeitjobs gehen Sie ähnlich wie bei Batch-Jobs vor, allerdings mit folgenden Ausnahmen: Tabelle 87: Objekt Voraussetzung Position in Objektbibliothek XML-Meldungen Importieren eines DTD- oder XML-Schemas zum Definieren ei nes Formats Tab Formate Ausgehende Mel dung Definieren eines Adapter-Datastores und Importieren von Ob jektmetadaten. Tab Datastores unter Adapter-Data store Weitere Informationen Importieren eines DTD- oder XML-Schemaformats [Seite 235] Designer-Handbuch Echtzeitjobs PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 267 Adapter-Datastores [Seite 90] 12.4.1 Anzeigen von XML-Meldungsquellen oder -Zielschemas Klicken Sie im Arbeitsbereich eines Echtzeitjobs auf den Namen einer XML-Meldungsquelle oder eines XMLMeldungsziels, um den zugehörigen Editor zu öffnen. Falls die XML-Meldungsquelle oder das XML-Meldungsziel verschachtelte Daten enthält, werden im Schema verschachtelte Tabellen anzeigt, um die Beziehungen unter den Daten darzustellen. 12.4.2 Sekundäre Quellen und Ziele Echtzeitjobs können auch sekundäre Quellen oder Ziele haben. Beispiel: Angenommen, Sie verarbeiten eine Meldung, die einen Kundenauftrag aus einer Webanwendung enthält. Der Auftrag enthält den Kundennamen. Wenn Sie den Auftrag auf das ERP-System anwenden möchten, müssen Sie jedoch detailliertere Kundeninformationen angeben. Innerhalb eines Datenflusses eines Echtzeitjobs können Sie die Kundeninformationen in der Meldung ergänzen und das vollständige Dokument anlegen, das an das ERP-System gesendet wird. Die zusätzlichen Informationen können aus dem ERP-System selbst oder aus einem Datencache stammen, der dieselben Informationen enthält. Als Quellen verwendete Tabellen und Dateien (einschließlich XML-Dateien) können diese zusätzlichen Informationen bereitstellen. Die Software liest Daten aus sekundären Quellen in Abhängigkeit vom Entwurf des Datenflusses. Die Software lädt Daten parallel zu einer Zielmeldung in sekundäre Ziele. Gehen Sie beim Hinzufügen von sekundären Quellen und Zielen zu Datenflüssen in Echtzeitjobs ebenso wie bei Datenflüssen in Batch-Jobs vor. Weitere Informationen Quell- und Zielobjekte [Seite 158] 268 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Echtzeitjobs Hinzufügen von Quell- oder Zielobjekten zu Datenflüssen [Seite 159] 12.4.3 Transaktionales Laden von Tabellen Zieltabellen in Echtzeitjobs unterstützen das transaktionale Laden, bei dem die Daten, die sich aus der Verarbeitung eines einzelnen Datenflusses ergeben in einer einzelnen Transaktion in mehrere Tabellen geladen werden können. Falls ein Teil einer Transaktion fehlschlägt, wird kein Teil der Transaktion angewendet. Hinweis Zieltabellen in Batch-Jobs unterstützen auch das transaktionale Laden. Bevor Sie diese Option jedoch für einen Batch-Job aktivieren, sollten Sie berücksichtigen, dass dadurch mehr Arbeitsspeicher belegt wird, was beim Verschieben von Daten zu einer Verringerung der Leistung führen kann. Sie können die Reihenfolge, in der Tabellen in der Transaktion enthalten sind, mit dem Zieltabelleneditor festlegen. Diese Funktion unterstützt ein Szenario, in dem Sie eine Reihe von Tabellen mit Fremdschlüsseln haben, die von einer Tabelle mit Primärschlüsseln abhängen. Transaktionales Laden kann nur verwendet werden, wenn alle Ziele im Datenfluss sich im selben Datastore befinden. Falls der Datastore Tabellen in mehreren Datastores lädt, werden die Ziele in jedem Datastore unabhängig geladen. Während mehrere Ziele in einem Datastore in einer Transaktion enthalten sein können, müssen die Ziele in anderen Datastores in einer anderen Transaktion enthalten sein. Sie können festlegen, dass dieselbe Transaktionsreihenfolge oder verschiedene Transaktionsreihenfolgen für alle Ziele in derselben Transaktion enthalten sein sollen. Wenn Sie dieselbe Transaktionsreihenfolge für alle Ziele im selben Datastore angeben, sind die Tabellen zwar noch in derselben Transaktion enthalten, werden jedoch zusammen geladen. Das Laden wird übergeben, nachdem alle Tabellen in der Transaktion den Ladevorgang abgeschlossen haben. Wenn Sie eindeutige Transaktionsreihenfolgen für alle Ziele im selben Datastore angeben, zeigen die Transaktionsreihenfolgen die Reihenfolgen des Ladens der Tabellen an. Die Tabelle mit der kleinsten Transaktionsreihenfolge wird zuerst geladen usw., bis zur Tabelle mit der größten Transaktionsreihenfolge, die zuletzt geladen wird. Es werden keine zwei Tabellen gleichzeitig geladen. Das Laden wird übergeben, nachdem die letzte Tabelle geladen wurde 12.4.4 Entwurfstipps für Datenflüsse in Echtzeitjobs Beim Entwerfen von Datenflüssen in Echtzeit-Jobs müssen Regeln eingehalten werden. ● Wenn Sie eine Tabelle in einen Join mit einer Echtzeitquelle einbeziehen, nimmt die Software den Dataset aus der Echtzeitquelle als äußere Schleife des Joins auf. Wenn mehrere Ergänzungsquellen in einen Join einbezogen werden, können Sie mithilfe von Join-Rängen für die Tabellen steuern, welche Tabelle in die nächste äußerste Schleife des Joins aufgenommen wird. ● In Echtzeitjobs sollten Sie keine Daten aus sekundären Quellen zwischenspeichern, es sei denn, es handelt sich um statische Daten. Die Daten werden gelesen, wenn der Echtzeitjob gestartet wird und werden während der Ausführung des Jobs nicht aktualisiert. Designer-Handbuch Echtzeitjobs PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 269 ● Wenn keine Zeilen an das XML-Ziel übergeben werden, gibt der Echtzeitjob eine leere Antwort an den Zugriffsserver zurück. Wird beispielsweise eine Produktnummer angefordert, die nicht existiert, könnte der Job per Definition keine Daten an die Antwortnachricht übergeben. Eventuell empfiehlt es sich, dem Benutzer entsprechende Anweisungen zukommen zu lassen (Ausnahmebehandlung im Job), um diese Art von Szenario abzudecken. ● Wenn mehrere Zeilen an das XML-Ziel übergeben werden, liest das Ziel die erste Zeile und verwirft die restlichen. Um dieses Problem zu umgehen, sollten Sie sich des Nested Relational Data Model (NRDM) der Software bedienen und die Meldungsquelle und Zielformate so strukturieren, dass eine "Zeile" einer Meldung entspricht. Mit NRDM können Sie jede beliebige Datenmenge in einer einzigen "Zeile" unterbringen, da Spalten in Tabellen andere Tabellen enthalten können. ● Wiederherstellungsmechanismen werden in Echtzeitjobs nicht unterstützt. Weitere Informationen Referenzhandbuch: Objekte, Beschreibung von Objekten, Echtzeitjob Verschachtelte Daten [Seite 222] 12.5 Testen von Echtzeitjobs 12.5.1 Ausführen von Echtzeitjobs im Testmodus Sie können Echtzeitjobentwürfe testen, ohne den Job als einen Dienst zu konfigurieren, der einem Zugriffsserver zugeordnet ist. Im Testmodus können Sie einen Echtzeitjob mit einer Beispielquellmeldung aus einer Datei ausführen, um festzustellen, ob die erwartete Zielmeldung generiert wird. 12.5.1.1 Angeben von XML-Beispielmeldungen und Zieltestdateien 1. Geben Sie in den XML-Meldungsquell- und -zieleditoren einen Dateinamen im Feld XML-Testdatei ein. Geben Sie den vollständigen Pfadnamen für die Quelldatei ein, die Ihre Beispieldaten enthält. Verwenden Sie Pfade für beide Testdateien, die sich auf den Rechner beziehen, auf dem der Jobserver für das aktuelle Repository ausgeführt wird. 2. Führen Sie den Job aus. Der Testmodus ist für Echtzeitjobs stets aktiviert. Daten aus der Testquelldatei werden gelesen und in die Testzieldatei geladen. 270 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Echtzeitjobs 12.5.2 Verwenden von "Daten anzeigen" Mit „Daten anzeigen“ können Sie eine Stichprobe Ihrer Ausgabedaten erfassen, um sicherzustellen, dass Ihr Entwurf funktioniert. Sie können dann sehen, ob Ihr Entwurf die erwarteten Ergebnisse zurückgibt. Weitere Informationen Entwurf und Debugging [Seite 609] 12.5.3 Verwenden eines XML-Dateiziels Verwenden Sie ein „XML-Dateiziel“, um die von einem Datenfluss erzeugte Meldung zu erfassen, während die Meldung an den Zugriffsserver zurückgegeben wird. Wie bei einer XML-Meldung definieren Sie eine XML-Datei, indem Sie eine DTD oder ein XML-Schema für die Datei importieren und anschließend das Format in die Datenflussdefinition ziehen. Im Gegensatz zu XML-Meldungen können Sie XML-Dateien als Quellen oder Ziele in Batch- und Echtzeitjobs einschließen. 12.5.3.1 Verwenden einer Datei zur Ausgabeerfassung von Schritten in einem Echtzeitjob 1. Ziehen Sie die DTD oder das XML-Schema auf dem Tab Formate der Objektbibliothek in einen Datenfluss eines Echtzeitjobs. Über ein Menü werden Sie zur Eingabe der Dateifunktion aufgefordert. 2. Wählen Sie XML-Datei als Ziel verwenden. Das XML-Dateiziel wird im Arbeitsbereich angezeigt. 3. Geben Sie im Dateieditor den Speicherort an, in den die Daten geschrieben werden sollen. Geben Sie einen Dateinamen in Bezug auf den Rechner ein, auf dem der Jobserver ausgeführt wird. 4. Verbinden Sie die Ausgabe des Schritts in dem Datenfluss, den Sie erfassen möchten, mit der Eingabe der Datei. Designer-Handbuch Echtzeitjobs PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 271 12.6 Bausteine für Echtzeitjobs 12.6.1 Ergänzen von Meldungsdaten Sie können Schritte im Echtzeitjob definieren, um Meldungsinformationen zu ergänzen, wenn die in Meldungen aus Echtzeitquellen eingeschlossenen Daten nicht genau Ihren Anforderungen für die Verarbeitung oder Speicherung von Informationen entsprechen. Eine Technik zur Ergänzung der Daten in Echtzeitquellen umfasst die folgenden Schritte: 1. Beziehen Sie eine Tabelle oder Datei als Quelle ein. Beziehen Sie neben der Echtzeitquelle die Dateien oder Tabellen ein, aus denen Sie ergänzende Informationen benötigen. 2. Extrahieren Sie die erforderlichen Daten mithilfe einer Abfrage aus der Tabelle oder der Datei. 3. Suchen Sie mithilfe der Daten in der Echtzeitquelle nach den nötigen Ergänzungsdaten. Sie können einen Join-Ausdruck in die Abfrage aufnehmen, um die aus der Ergänzungsquelle erforderlichen Werte zu extrahieren. 272 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Echtzeitjobs Die Join-Bedingung verknüpft die zwei Eingabeschemas, sodass nur Daten für das Verkaufspositionsdokument und die Einzelposten ausgegeben werden, die in der Eingabe von der Anwendung enthalten sind. Achten Sie darauf, nur Daten im Join zu verwenden, die garantiert einen Wert zurückgeben. Wenn vom Join kein Wert zurückgegeben wird, generiert die Abfrage keine Zeilen und die Meldung wird leer an den Zugriffsserver zurückgegeben. Falls Sie nicht garantieren können, dass ein Wert zurückgegeben wird, sollten Sie folgende Alternativen in Betracht ziehen: ○ Aufruf der Lookup-Funktion – Gibt einen Standardwert zurück, wenn keine Übereinstimmung gefunden wurde. ○ Outer Join – Gibt immer einen Wert zurück, auch wenn keine Übereinstimmung gefunden wurde. 12.6.1.1 Ergänzen von Meldungsdaten – Datenbeispiel In diesem Beispiel enthält eine Anforderungsmeldung Bestellungsinformationen und die Antwortmeldung gibt den Bestellstatus zurück. Die Geschäftslogik bestimmt anhand der Kundennummer und der Prioritätsbewertung die zurückzugebene Statusebene. Die Meldung umfasst lediglich den Kundennamen und die Bestellnummer. Dann wird ein Echtzeitjob definiert, um die Kundennummer und die Bewertung aus anderen Quellen abzurufen, bevor der Bestellstatus bestimmt wird. Designer-Handbuch Echtzeitjobs PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 273 1. Beziehen Sie die Echtzeitquelle in den Echtzeitjob ein. 2. Beziehen Sie die Ergänzungsquelle in den Echtzeitjob ein. Bei dieser Quelle kann es sich um eine Tabelle oder eine Datei handeln. In diesem Beispiel ändern sich die benötigten Ergänzungsinformationen nicht sehr oft, sodass es sinnvoll ist, die Daten aus einem Datencache abzurufen, statt direkt aus einem ERP-System. 3. Verknüpfen Sie die Quellen. Legen Sie in einer Query-Transformation einen Join für den Kundennamen an: Message.CustName = Cust_Status.CustName Sie können die Ausgabe so definieren, dass nur die Spalten einbezogen werden, die der Echtzeitjob zur Bestimmung des Bestellstatus benötigt. 4. Schließen Sie den Echtzeitjob ab, um den Bestellstatus zu bestimmen. Im hier gezeigten Beispiel wird der Bestellstatus anhand einer von zwei Methoden auf Basis des Kundenstatuswerts ermittelt. Der Bestellstatus für die am höchsten bewerteten Kunden wird direkt über das ERP-System bestimmt. Der Bestellstatus für andere Kunden wird über einen Datencache mit Bestellungsinformationen ermittelt. Die Logik kann in einem oder mehreren Datenflüssen angeordnet werden. In der Abbildung unten wird ein einziges Datenflussmodell dargestellt. Beide Verzweigungen geben den Bestellstatus für die verschiedenen Einzelposten der Bestellung zurück. Der Datenfluss führt die Ergebnisse zusammen und generiert die Antwort. Im nächsten Abschnitt wird beschrieben, wie Sie Verzweigungspfade in einem Datenfluss entwerfen. 274 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Echtzeitjobs 12.6.2 Verzweigen von Datenflüssen basierend auf einem Datencachewert Zur Steigerung der Effizient können Sie für einen Echtzeitjob Logik entwickeln, die festlegt, ob Antworten von einem Datencache generiert werden sollen oder anhand von Daten in einer Backoffice-Anwendung (ERP, SCM, CRM). Im Folgenden wird eine Möglichkeit zum Anlegen dieser Logik beschrieben: 1. Bestimmen Sie die Regel für den Zeitpunkt des Zugriffs auf den Datencache sowie für den Zeitpunkt des Zugriffs auf die Backoffice-Anwendung. 2. Vergleichen Sie die Daten von der Echtzeitquelle mit der Regel. 3. Definieren Sie jeden Pfad, der aus dem Ergebnis resultieren könnte. Angenommen, die Regel legt Backoffice-Anwendungszugriff fest, das System ist jedoch gerade nicht verfügbar. 4. Führen Sie die Ergebnisse aus jedem Pfad in einem einzelnen Datensatz zusammen. 5. Leiten Sie das Einzelergebnis zu einem Echtzeitziel um. Sie sollten ggf. eine Fehlerüberprüfung und eine Ausnahmebehandlung in Erwägung ziehen, um sicherzustellen, dass der Wert an das Ziel übergeben wird. Falls das Ziel einen leeren Datensatz empfängt, gibt der Echtzeitjob eine leere Antwort zurück (nur XML-Start- und -End-Tags) an den Zugriffsserver zurück. In diesem Beispiel wird ein Abschnitt eines Echtzeitjobs beschrieben, der eine neue Bestellung verarbeitet. Der Abschnitt ist verantwortlich für die Überprüfung des für die bestellten Produkte verfügbaren Bestands – er beantwortet die Frage: "Ist der Bestand zum Erfüllen dieser Bestellung ausreichend?" Die Regel, die den Zugriff auf die Backoffice-Anwendung steuert, legt fest, dass der Bestand (Inv) größer als eine vordefinierte Menge (IMargin) sein muss, die größer als die bestellte Menge (Qty) ist, um die zwischengespeicherten Bestandswert als akzeptabel zu betrachten. Designer-Handbuch Echtzeitjobs PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 275 Es wird ein Vergleich für jede Zeilenposition in der Reihenfolge Ihrer Zuordnung vorgenommen. Tabelle 88: Eingehende Bestellung OrderNo 9999 CustID LineItem 1001 Element Material Qty 001 7333 300 002 2288 1400 Tabelle 89: Bestandsdatencache Material Inv IMargin 7333 600 100 2288 1500 200 Hinweis Die Artikelmenge in der Bestellung wird mit den Bestandswerten im Datencache verglichen. 12.6.3 Aufrufen von Anwendungsfunktionen Ein Echtzeitjob kann mithilfe von Anwendungsfunktionen Vorgänge für Daten ausführen. Sie können Tabellen als Eingabe- oder Ausgabeparameter für die Funktion einbeziehen. Bei Anwendungsfunktionen müssen für manche Parameter Eingabewerte angegeben werden, während andere Parameter keine Angabe erfordern. Sie müssen die Anforderungen der Funktion feststellen, sodass Sie die entsprechenden Eingaben vorbereiten können. Um die Eingabe zusammenzustellen, können Sie die Tabelle oder Spalten der obersten Ebene und alle Tabellen angeben, die eine Ebene unter den Tabellen verschachtelt sind, die in der FROM-Klausel des Kontextes, der die Funktion aufruft, aufgeführt sind. Wenn die Anwendungsfunktion eine Struktur als Eingabeparameter enthält, müssen Sie die einzelnen Spalten angeben, aus denen sich die Struktur zusammensetzt. Ein Datenfluss kann mehrere Schritte umfassen, die eine Funktion aufrufen, Ergebnisse abrufen und dann die Ergebnisse in den Spalten und Tabellen unterbringen, die für eine Antwort erforderlich sind. 12.7 Entwerfen von Echtzeitanwendungen Sie können Echtzeitanwendungen entwerfen, die Ihre internen und externen Informations- und Ressourcenanforderungen erfüllen. Die Software liefert eine zuverlässige Verbindung zwischen einer Webanwendung und Back-Office-Anwendungen wie ein ERP-System (Enterprise Resource Planning), die geringe Auswirkungen hat. Da jede Implementierung eines ERP-Systems anders ist und die Software eine vielseitige Entscheidungsunterstützungslogik umfasst, möchten Sie vielleicht ein System entwerfen. 276 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Echtzeitjobs 12.7.1 Reduzieren der Abfragen mit Bedarf an Zugriff auf Backoffice-Anwendungen Verschiedene Empfehlungen und Überlegungen, die den Zeitaufwand reduzieren sollen, der beim Experimentieren in den Entwicklungszyklen anfällt. Die Informationen, auf die Ihre Kunden über die Webanwendung zugreifen dürfen, können die vom Kunden wahrgenommene Webleistung beeinträchtigen. Sie können die Leistung optimieren, indem Sie während des Entwurfs der Webanwendung die richtigen Entscheidungen treffen. Insbesondere lässt sich die Anwendung so strukturieren, dass die Anzahl der Abfragen, die direkt auf Backoffice-Anwendungen (ERP, SCM, LegacyProgramme) zugreifen müssen, reduziert wird. Wenn Ihr ERP-System beispielsweise eine komplizierte Preisfindungsstruktur unterstützt, die Abhängigkeiten wie kundenseitige Priorität, Produktverfügbarkeit oder Bestellmenge umfasst, ist es unter Umständen nicht möglich, sich auf Werte aus dem Datencache für Preisinformationen zu stützen. Alternativ können die Preisinformationen direkt aus dem ERP-System angefordert werden. Die Wahrscheinlichkeit ist groß, dass der Zugriff auf das ERPSystem wesentlich langsamer erfolgt als der direkte Datenbankzugriff, was sich negativ auf die Leistung der Webanwendung und damit die Kundenwahrnehmung auswirkt. Indem Sie Änderungen an der Webanwendung vornehmen, können Sie die Auswirkung von Abfragen, die direkten Zugriff auf ERP-Systeme benötigen, reduzieren. Im Falle des Preisbeispiels entwerfen Sie die Anwendung so, dass die Anzeige von Preisinformationen zusammen mit Standardproduktinformationen vermieden und stattdessen der Preis nur angezeigt wird, nachdem der Kunde ein bestimmtes Produkt und die Menge ausgewählt hat. Diese Technik spiegelt sich in der Art und Weise wider, wie Flugreservierungssysteme Preisinformationen bereitstellen (ein Angebot pro jeweiligem Flug). Im Gegensatz dazu werden auf Websites anderer Händler Preisinformationen für jeden angezeigten Artikel als Teil des Produktkatalogs aufgeführt. 12.7.2 Meldungen von Echtzeitjobs zu Adapterinstanzen Wenn ein Echtzeitjob eine Meldung an eine Adapterinstanz sendet, müssen Sie entscheiden, ob Sie einen Meldungsfunktionsaufruf oder eine ausgehende Meldung anlegen. ● Mithilfe von Meldungsfunktionsaufrufen kann die Adapterinstanz Anforderungen sammeln und Antworten senden. ● Ausgehende Meldungsobjekte können nur ausgehende Meldungen senden. Sie können nicht für den Empfang von Meldungen verwendet werden. Weitere Informationen Importieren von Metadaten über einen Adapter-Datastore Designer-Handbuch Echtzeitjobs PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 277 12.7.3 Durch Adapterinstanz aufgerufener Echtzeitdienst Wenn eine Operationsinstanz (in einem Adapter) eine Meldung von einer Informationsressource erhält, übersetzt sie diese in XML (falls erforderlich) und sendet die XML-Meldung an einen Echtzeitdienst. Im Echtzeitdienst wird die Meldung von dem Adapter durch ein DTD- oder XML-Schema-Objekt dargestellt (wird im Tab Formate der Objektbibliothek gespeichert). Die DTD oder das XML-Schema stellt das Datenschema für die Informationsressource dar. Der Echtzeitdienst verarbeitet die Meldung von der Informationsressource (durch den Adapter umgeleitet) und gibt eine Antwort zurück. Im nachfolgenden Beispieldatenfluss wird eine durch eine Quelle (Adapterinstanz) empfangene Meldung (hier durch "Employment" dargestellt) von der Query verarbeitet, und die Antwort wird an ein Ziel (wiederum eine Adapterinstanz) zurückgegeben. Hinweis In diesem Dokument werden Begriffe verwendet, die zum Bereich der Java-Programmierung gehören. (Weitere Informationen zu Begriffen wie "Operationsinstanz" und "Informationsressource" erhalten Sie in der Dokumentation des Adapter-SDKs). 278 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Echtzeitjobs 13 Eingebettete Datenflüsse Ein eingebetteter Datenfluss ist ein Datenfluss, der aus einem anderen Datenfluss aufgerufen wird. Die Software liefert benutzerfreundliche Optionen zum Anlegen eingebetteter Datenflüsse. 13.1 Übersicht über eingebettete Datenflüsse Die Daten werden vom übergeordneten Fluss über eine einzelne Quelle oder ein einzelnes Ziel in den oder aus dem eingebetteten Datenfluss übergeben. Ein eingebetteter Datenfluss kann eine beliebige Anzahl an Quellen oder Zielen enthalten, die Daten können jedoch nur von einer Eingabe oder einer Ausgabe an den oder von dem übergeordneten Datenfluss übergeben werden. Sie können die folgenden Typen von eingebetteten Datenflüssen anlegen: Tabelle 90: Typ Verwendung Eine Eingabe Hinzufügen eines eingebetteten Datenflusses am Ende eines Datenflusses. Eine Ausgabe Hinzufügen eines eingebetteten Datenflusses am Anfang eines Datenflusses. Weder Eingabe noch Ausgabe Replizieren eines vorhandenen Datenflusses. Ein eingebetteter Datenfluss ist eine Entwurfshilfe, die sich nicht auf die Jobausführung auswirkt. Wenn der übergeordnete Datenfluss ausgeführt wird, werden alle eingebetteten Datenflüsse aufgeklappt, der übergeordnete Datenfluss wird optimiert und anschließend ausgeführt. Verwenden Sie eingebettete Datenflüsse für folgende Aktionen: ● Vereinfachen der Datenflussanzeige. Gruppieren Sie die Abschnitte eines Datenflusses in eingebetteten Datenflüssen für besseres Layout und Dokumentation. ● Wiederverwenden der Datenflusslogik. Speichern Sie die logischen Abschnitte eines Datenflusses, damit Sie diese Logik in anderen Datenflüssen verwenden können, oder wenden Sie eine einfache Methode zur Replizierung der Logik an, und passen Sie sie an die anderen Flüsse an. ● Debuggen der Datenflusslogik. Replizieren Sie Abschnitte eines Datenflusses als eingebettete Datenflüsse, so dass Sie sie unabhängig ausführen können. 13.2 Eingebetteter Datenfluss – Beispiele Beispiele für die Verwendung eingebetteter Datenflüsse. Designer-Handbuch Eingebettete Datenflüsse PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 279 In diesem Beispiel verwendet ein Datenfluss eine Einzelquelle, um drei verschiedene Zielsysteme zu laden. Die Case-Transformation sendet jede Zeile von der Quelle zu verschiedenen Transformationen, die diese verarbeiten, um eine eindeutige Zielausgabe zu erhalten. Sie können den übergeordneten Datenfluss vereinfachen, indem Sie für die drei verschiedenen Cases eingebettete Datenflüsse verwenden. 13.3 Anlegen eingebetteter Datenflüsse Sie können einen neuen eingebetteten Datenfluss anlegen oder einen vorhandenen Datenfluss einbetten. Zum Einbetten von Datenflüssen stehen zwei Methoden zur Verfügung: ● Wählen Sie Objekte innerhalb eines Datenflusses aus, klicken Sie mit der rechten Maustaste und wählen Als eingebetteten Datenfluss verwenden. ● Ziehen Sie einen vollständigen und voll validierten Datenfluss aus der Objektbibliothek in einen offenen Datenfluss im Arbeitsbereich. Gehen Sie dann folgendermaßen vor: 280 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Eingebettete Datenflüsse ○ Öffnen Sie den soeben hinzugefügten Datenfluss. ○ Klicken Sie mit der rechten Maustaste auf ein Objekt, das Sie als Eingabe- oder Ausgabeport verwenden möchten, und wählen Sie Als Port verwenden für dieses Objekt. Das von Ihnen gewählte Objekt wird als Verbindungspunkt für diesen eingebetteten Datenfluss markiert. Hinweis Sie können nur einen Port angeben, was bedeutet, dass der eingebettete Datenfluss nur am Anfang oder am Ende des übergeordneten Datenflusses angezeigt werden kann. Data Services ignoriert einige physische Dateien, die für Quellen und Ziele mit zugewiesenen Ports benötigt werden. ○ Bei Verwendung eines eingebetteten Datenflusses fließen Daten direkt vom Aufrufer an die Transformation(en) neben der Portquelle. ○ Wenn Sie einen Datenfluss direkt verwenden, greift Data Services auf die physischen Dateien in Quellen und Zielen zurück, ignoriert jedoch die Ports. 13.3.1 Verwenden der Option "Als eingebetteten Datenfluss verwenden" Legen Sie mithilfe dieser Option einen neuen eingebetteten Datenfluss an. 1. Zum Auswählen von Objekten aus einem offenen Datenfluss stehen Ihnen folgende Methoden zur Verfügung: ○ Klicken Sie auf den leeren Bereich, und ziehen Sie um die Objekte das Rechteck auf. ○ Klicken Sie bei gedrückter Strg-Taste auf jedes Objekt. Stellen Sie sicher, dass für die ausgewählte Gruppe von Objekten Folgendes gegeben ist: ○ Alle Objekte sind miteinander verbunden. ○ Die Objekte sind mit anderen Objekten gemäß dem Typ des anzulegenden eingebetteten Datenflusses verbunden, beispielsweise eine Eingabe, eine Ausgabe oder keine Eingabe oder Ausgabe. 2. Klicken Sie mit der rechten Maustaste, und wählen Sie Als eingebetteten Datenfluss verwenden aus. Das Fenster „Eingebetteten Datenfluss anlegen“ wird geöffnet, wobei der eingebettete Datenfluss mit dem übergeordneten Datenfluss über ein Eingabeobjekt verbunden ist. 3. Benennen Sie den eingebetteten Datenfluss gemäß der Konvention EDF_<EDFName>, z.B. EDF_ERP. Wenn Sie das Kontrollkästchen „Objekte in ursprünglichen Datenfluss zurückführen“ deaktivieren, werden im ursprünglichen Datenfluss keine Änderungen vorgenommen. Die Software speichert das neue eingebettete Datenflussobjekt im Repository und zeigt es in der Objektbibliothek auf dem Tab „Datenflüsse“ an. Sie können einen eingebetteten Datenfluss, der ohne Zurückführung angelegt wurde, als eigenständigen Datenfluss für die Fehlerbehebung verwenden. Wenn „Objekte in ursprünglichen Datenfluss zurückführen“ aktiviert ist, wird der ursprüngliche Datenfluss zum übergeordneten Datenfluss, der über einen Aufruf zum neuen eingebetteten Datenfluss verfügt. 4. Klicken Sie auf OK Designer-Handbuch Eingebettete Datenflüsse PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 281 . Der eingebettete Datenfluss wird im neuen übergeordneten Datenfluss angezeigt. 5. Klicken Sie auf den Namen des eingebetteten Datenflusses, um ihn zu öffnen. 6. Beachten Sie, dass die Software ein neues Objekt (EDF_ERP_Input) angelegt hat, wobei es sich um den Eingabeport handelt, der diesen eingebetteten Datenfluss mit dem übergeordneten Datenfluss verbindet. Bei Verwendung der Option Als eingebetteten Datenfluss verwenden legt die Software automatisch ein Eingabeoder Ausgabeobjekt auf Basis des Objekts an, das mit dem eingebetteten Datenfluss bei seiner Anlage verbunden ist. Wenn ein eingebetteter Datenfluss beispielsweise über eine Ausgabeverbindung verfügt, ist im eingebetteten Datenfluss ein Ziel-XML-Dateiobjekt mit der Bezeichnung <EDFName>_Output enthalten. Die Namenskonventionen für die einzelnen Typen von eingebetteten Datenflüssen lauten wie folgt: Tabelle 91: Typ Namenskonventionen Eine Eingabe <EDFName>_Input Eine Ausgabe <EDFName>_Output Weder Eingabe noch Ausgabe Die Software legt einen eingebetteten Datenfluss ohne Ein gabe- oder Ausgabeobjekt an. 13.3.2 Anlegen von eingebetteten Datenflüssen aus vorhandenen Datenflüssen Sie rufen einen vorhandenen Datenfluss aus einem anderen Datenfluss heraus auf. 282 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Eingebettete Datenflüsse Sie müssen den Datenfluss in den übergeordneten Datenfluss stellen und dann die zu verwendende Quelle oder das zu verwendende Ziel für die Übergabe der Daten zwischen dem übergeordneten und dem eingebetteten Datenfluss markieren. 1. Ziehen Sie einen vorhandenen gültigen Datenfluss von der Objektbibliothek in einen im Arbeitsbereich geöffneten Datenfluss. 2. Sie können den Datenfluss unter Verwendung der Namenskonvention EDF_<EDFName> umbenennen. Der eingebettete Datenfluss wird ohne Pfeilspitzen (Ports) im Arbeitsbereich angezeigt. 3. Öffnen Sie den eingebetteten Datenfluss. 4. Klicken Sie mit der rechten Maustaste auf ein Quell- oder Zielobjekt (Datei oder Tabelle) und wählen Als Port verwenden. Hinweis Stellen Sie sicher, dass Sie nur einen Ausgabeport oder einen Eingabeport angeben. Wie bei einem normalen Datenfluss werden verschiedene Typen von eingebetteten Datenflussports durch Richtungskennzeichen auf dem Symbol für eingebettete Datenflüsse angezeigt. 13.3.3 Verwenden eingebetteter Datenflüsse Wenn Sie einen eingebetteten Datenfluss mit der Option Als eingebetteten Datenfluss verwenden anlegen und konfigurieren, wird eine neue XML-Eingabe- oder -Ausgabedatei angelegt und das Schema im Repository als XMLSchema gespeichert. Sie können einen eingebetteten Datenfluss erneut verwenden, indem Sie ihn vom Tab Datenfluss der Objektbibliothek in andere Datenflüsse ziehen. Um Zeit bei der Zuordnung zu sparen, können Sie die Option "Schema aktualisieren" oder "Schema abgleichen" verwenden. Im folgenden Beispielszenario werden beide Optionen verwendet: ● Legen Sie Datenfluss 1 an. ● Wählen Sie Objekte in Datenfluss 1 aus, und legen Sie den eingebetteten Datenfluss 1 so an, dass der übergeordnete Datenfluss 1 den eingebetteten Datenfluss 1 aufruft. ● Legen Sie Datenfluss 2 und Datenfluss 3 an, und fügen Sie zu beiden Datenflüssen den eingebetteten Datenfluss 1 hinzu. ● Ändern Sie das Schema des Objekts vor dem eingebetteten Datenfluss 1, und verwenden Sie die Option „Schema aktualisieren“ für den eingebetteten Datenfluss 1. Das Schema des eingebetteten Datenflusses 1 im Repository wird aktualisiert. ● Jetzt unterscheiden sich die Schemas in Datenfluss 2 und Datenfluss 3, die Daten für den eingebetteten Datenfluss 1 bereitstellen, von dem Schema, das vom eingebetteten Datenfluss erwartet wird. ● Verwenden Sie die Option "Schema abgleichen" für den eingebetteten Datenfluss 1 sowohl in Datenfluss 2 als auch in Datenfluss 3, um Konflikte während der Laufzeit zu lösen. Die Option "Schema abgleichen" wirkt sich nur auf Einstellungen im aktuellen Datenfluss aus. In den folgenden Abschnitten wird die Verwendung der Optionen "Schema aktualisieren" und "Schema abgleichen" eingehender erläutert. Designer-Handbuch Eingebettete Datenflüsse PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 283 13.3.3.1 Aktualisieren von Schemas Die Software bietet eine Möglichkeit zum Aktualisieren eines Eingabeschemas eines eingebetteten Datenflusses. Mit dieser Option wird das Schema des Eingabeobjekts eines eingebetteten Datenflusses mit dem Schema des vorangegangenen Objekts im übergeordneten Datenfluss aktualisiert. Bei Verwendung dieser Option werden alle Vorkommen des eingebetteten Datenflusses aktualisiert. 1. Öffnen Sie den übergeordneten Datenfluss des eingebetteten Datenflusses. 2. Klicken Sie mit der rechten Maustaste auf das eingebettete Datenflussobjekt, und wählen Sie Schema aktualisieren. 13.3.3.2 Abgleichen von Daten zwischen übergeordneten und eingebetteten Datenflüssen Das Schema des Eingabeobjekts eines eingebetteten Datenflusses kann mit dem Schema des vorherigen Objekts im übergeordneten Datenfluss dem Namen oder der Position nach übereinstimmen. Eine Übereinstimmung nach Position ist der Standardwert. 13.3.3.2.1 Angeben der Abgleichtechnik für Schemas 1. Öffnen Sie den übergeordneten Datenfluss des eingebetteten Datenflusses. 2. Klicken Sie mit der rechten Maustaste auf das Objekt des eingebettenten Datenflusses, und wählen Sie Schema abgleichenNach Name oder Schema abgleichenNach Position aus. Die Option "Schema abgleichen" wirkt sich nur auf Einstellungen für den aktuellen Datenfluss aus. In Data Services ist es auch zulässig, dass das Schema des vorherigen Objekts im übergeordneten Datenfluss mehr oder weniger Spalten als der eingebettete Datenfluss aufweist. Der eingebettete Datenfluss ignoriert zusätzliche Spalten und liest fehlende Spalten als NULL ein. Spalten in beiden Schemas müssen identische oder konvertierbare Datentypen aufweisen. Weitere Informationen finden Sie im Abschnitt "Typkonvertierung" im Referenzhandbuch. 13.3.3.3 Löschen eingebetteter Datenflussobjekte Sie können eingebettete Datenflussports löschen oder ganze eingebettete Datenflüsse entfernen. 13.3.3.3.1 Entfernen von Ports Klicken Sie mit der rechten Maustaste auf das Eingabe- oder Ausgabeobjekt im eingebetteten Datenfluss, und deaktivieren Sie Als Port verwenden. Data Services entfernt die Verbindung mit dem übergeordneten Objekt. 284 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Eingebettete Datenflüsse Hinweis Sie können einen Port nicht entfernen, indem Sie einfach die Verbindung im übergeordneten Fluss löschen. 13.3.3.3.2 Entfernen von eingebetteten Datenflüssen Wählen Sie den Datenfluss im geöffneten übergeordneten Datenfluss, und wählen Sie Löschen im Kontextmenü oder im Menü „Bearbeiten“. Wenn Sie eingebettete Datenflüsse aus der Objektbibliothek löschen, wird das Symbol der eingebetteten Datenflüsse mit einem roten, durchgestrichenen Kreis im übergeordneten Datenfluss markiert. Löschen Sie diese nicht mehr funktionierenden eingebetteten Datenflussobjekte aus den übergeordneten Datenflüssen. 13.3.4 Separates Testen eines eingebetteten Datenflusses Eingebettete Datenflüsse können durch separate Ausführung als reguläre Datenflüsse getestet werden. 1. Geben Sie eine XML-Datei für den Eingabeport oder den Ausgabeport an. Bei Verwendung der Option "Als eingebetteten Datenfluss verwenden" wird ein Objekt einer XML-Eingabeoder Ausgabedatei angelegt und anschließend (optional) mit dem vorhergehenden oder nachfolgenden Objekt im übergeordneten Datenfluss verbunden. Um die XML-Datei ohne einen übergeordneten Datenfluss zu testen, klicken Sie auf den Namen der XML-Datei, um ihren Quell- oder Zieleditor zu öffnen und einen Dateinamen einzugeben. 2. Fügen Sie den eingebetteten Datenfluss in den Job ein. 3. Führen Sie den Job aus. Sie können eingebettete Datenflüsse auch anhand der folgenden Funktionen testen: ● "Daten anzeigen" zum Anzeigen von Stichproben von Daten, die an einen eingebetteten Datenfluss übergeben wurden. ● Auditstatistiken über Daten, die aus Quellen gelesen, transformiert und in Ziele geladen wurden sowie Regeln zu Auditstatistiken, um zu überprüfen, ob die erwarteten Daten verarbeitet wurden. Weitere Informationen Referenzhandbuch: Objekte, Beschreibung von Objekten, XML-Datei Entwurf und Debugging [Seite 609] Designer-Handbuch Eingebettete Datenflüsse PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 285 13.3.5 Fehlerbehebung bei eingebetteten Datenflüssen Die folgenden Situationen führen zu Fehlern: ● In einem eingebetteten Datenfluss wurden sowohl ein Eingabe- als auch ein Ausgabeport angegeben. ● Aufgefangene beschädigte Datenflüsse. ● Gelöschte Verbindung zum übergeordneten Datenfluss, während die Option Als Port verwenden im eingebetteten Datenfluss weiterhin ausgewählt ist. ● Transformationen mit Teilern (wie die Case-Transformation) als Ausgabeportobjekt angegeben, da ein Teiler mehrere Ausgaben anlegt und eingebettete Datenflüsse nur eine Ausgabe haben können. ● Im eingebetteten Datenfluss deklarierte Variablen und Parameter, die nicht auch im übergeordneten Datenfluss deklariert sind. ● Einbetten eines Datenflusses auf derselben Ebene wie er selbst. Sie können jedoch unbegrenzt viele Einbettungsstufen verwenden. Der DF1-Datenfluss ruft beispielsweise den eingebetteten EDF1-Datenfluss auf, der EDF2 aufruft. Weitere Informationen Entfernen von eingebetteten Datenflüssen [Seite 285] Entfernen von Ports [Seite 284] 286 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Eingebettete Datenflüsse 14 Variablen und Parameter Sie können die Flexibilität und Wiederverwendbarkeit von Workflows und Datenflüssen verbessern, wenn Sie beim Entwerfen von Jobs lokale und globale Variablen verwenden. Variablen sind symbolische Platzhalter für Werte. Beim Datentyp einer Variablen kann es sich um jeden von der Software unterstützten Datentyp handeln, wie eine Ganzzahl, eine Dezimalzahl, ein Datum oder eine Textzeichenfolge. Sie können Variablen in Ausdrücken verwenden, um die Entscheidungsfindung oder die Datenmanipulation (mit arithmetischer oder Zeichenersetzung) zu erleichtern. Eine Variable kann beispielsweise in einer LOOP- oder IFAnweisung zur Prüfung eines Variablenwertes verwendet werden, um zu entscheiden, welcher Schritt durchgeführt werden soll: If $<amount_owed> > 0 print('$<invoice.doc>'); Wenn Sie Variablen in einem Job oder einem Workflow definieren, verwendet sie die Software normalerweise in einem Skript, einem Catch oder einem Bedingungsprozess. Sie können Variablen in Datenflüssen verwenden. Verwenden Sie sie beispielsweise in einer benutzerdefinierten Funktion oder in der WHERE-Klausel einer Query-Transformation. In der Software sind lokale Variablen auf das Objekt beschränkt, in dem sie angelegt werden (Job oder Workflow). Um lokale Variablen an untergeordnete Objekte (Workflows und Datenflüsse) weiterzureichen, müssen Sie Parameter verwenden. Designer-Handbuch Variablen und Parameter PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 287 Globale Variablen sind auf den Job beschränkt, in dem sie angelegt werden; für die Weiterreichung an Workflows und Datenflüsse benötigen sie jedoch keine Parameter. Hinweis Wenn Sie Workflows haben, die parallel ausgeführt werden, werden die globalen Variablen nicht zugewiesen. Parameter sind Ausdrücken, die an einen Workflow oder Datenfluss weitergereicht werden, wenn sie in einem Job aufgerufen werden. Sie legen lokale Variablen, Parameter und globale Variablen im Fenster „Variablen und Parameter“ im Designer an. Sie können Werte für lokale und globale Variablen in Skriptobjekten festlegen. Sie können globale Variablen auch mit externen Eigenschaften für Jobs, Ausführungen oder Zeitpläne festlegen. Die Arbeit mit globalen Variablen bietet Ihnen maximale Flexibilität. Während der Produktion können Sie beispielsweise Werte für globale Standardvariablen während der Laufzeit vom Zeitplan eines Jobs oder SOAPAufrufs ändern, ohne den Job im Designer öffnen zu müssen. Variablen können als Namen für folgende Dateien verwendet werden: ● Flatfile-Quellen und -Ziele ● XML-Dateiquellen und -ziele ● XML-Meldungsziele (im Designer im Testmodus ausgeführt) ● IDoc-Dateiquellen und -ziele (in einer SAP-Anwendungsumgebung) ● IDoc-Meldungsquellen und -ziele (SAP-Anwendungsumgebung) Weitere Informationen Management-Console-Handbuch: Administrator, Unterstützung für Web-Services 14.1 Variablen und Parameter (Fenster) Die für ein Objekt definierten Variablen und Parameter werden im Fenster Variablen und Parameter angezeigt. 14.1.1 Anzeigen der Variablen und Parameter in jedem Job, Workflow oder Datenfluss 1. Wählen Sie im Menü Extras die Option Variablen. Das Fenster Variablen und Parameter wird geöffnet. 2. Doppelklicken Sie in der Objektbibliothek auf ein Objekt, oder klicken Sie im Projektbereich auf ein Objekt, um es im Arbeitsbereich zu öffnen. 288 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Variablen und Parameter Das Kontextfeld im Fenster ändert sich entsprechend dem angezeigten Objekt. Wenn kein Objekt ausgewählt ist, gibt das Fenster keinen Kontext an. Das Fenster "Variablen und Parameter" enthält zwei Tabs. Auf dem Tab Definitionen können Sie Variablen (Name und Datentyp) sowie Parameter (Name, Datentyp und Parametertyp) für einen Objekttyp anlegen und anzeigen. Lokale Variablen und Parameter lassen sich nur auf Workflow- und Datenflussebene festlegen. Globale Variablen können nur auf Jobebene festgelegt werden. In der folgenden Tabelle sind die Typen von Variablen und Parameter aufgeführt, die Sie im Fenster "Variablen und Parameter" anlegen können, wenn Sie verschiedene Objekte auswählen. Tabelle 92: Objekttyp Anlegbare Variablen und Parameter Verwendungsziel Job Lokale Variablen Ein Skript oder eine Bedingung im Job. Globale Variablen Ein beliebiges Objekt im Job. Lokale Variablen Dieser Workflow oder übergeben an andere Workflow Parameter Workflows oder Datenflüsse mithilfe eines Para meters. Übergeordnete Objekte zum Übergeben lokaler Variablen. Workflows können auch Variablen oder Parameter an übergeordnete Objekte zu rückgeben. Datenfluss Parameter Eine WHERE-Klausel, Spaltenzuordnung oder Funktion im Datenfluss. Datenflüsse können keine Ausgabewerte zurückgeben. Auf dem Tab Aufrufe können Sie die Namen aller Parameter anzeigen, die für sämtliche Objekte in der Definition des übergeordneten Objekts festgelegt wurden. Außerdem haben Sie die Möglichkeit, Werte für jeden Parameter einzugeben. Bei den Werten für den Eingabeparametertyp kann es sich auf dem Tab Aufrufe um Konstanten, Variablen oder einen anderen Parameter handeln. Für den Ausgabe- oder den Eingabe-/Ausgabeparametertyp können als Werte Variablen oder Parameter auf dem Tab Aufrufe eingegeben werden. Außerdem ist für Werte auf dem Tab Aufrufe Folgendes zu verwenden: ● Derselbe Datentyp wie die Variable, wenn die Werte in einem Eingabe- oder Eingabe-/Ausgabeparametertyp platziert werden, und ein kompatibler Datentyp, wenn die Werte in einem Ausgabeparametertyp platziert werden. ● Skriptsprachenregeln und -syntax. In der folgenden Abbildung wird die Beziehung zwischen dem geöffneten Workflow „DeltaFacts“, dem Feld Kontext im Fenster „Variablen und Parameter“ und dem Inhalt der Tabs Definition und Aufrufe dargestellt. Designer-Handbuch Variablen und Parameter PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 289 14.2 Verwenden lokaler Variablen und Parameter Um eine lokale Variable an ein anderes Objekt zu übertragen, definieren Sie die lokale Variable. Legen Sie dann aus dem aufrufenden Objekt einen Parameter an und ordnen ihn der lokalen Variable zu, indem Sie einen Parameterwert eingeben. Um beispielsweise eine lokale Variable innerhalb eines Datenflusses zu verwenden, definieren Sie die Variable in einem übergeordneten Workflow und übertragen dann den Wert der Variablen als Parameter des Datenflusses. 290 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Variablen und Parameter 14.2.1 Parameter Parameter können zu folgenden Zwecken definiert werden: ● Übergabe ihrer Werte als Eingabe in und Ausgabe von Workflows ● Übergabe ihrer Werte als Eingabe in Datenflüsse Jedem Parameter wird ein Typ zugewiesen: Eingabe, Ausgabe oder Eingabe/Ausgabe. Der von dem Parameter übergebene Wert kann von jedem Objekt verwendet werden, das von dem Workflow oder Datenfluss aufgerufen wird. Hinweis Sie können auch lokale Variablen und Parameter für die Verwendung in benutzerdefinierten Funktionen anlegen. Weitere Informationen Referenzhandbuch: Funktionen und Prozeduren, Benutzerdefinierte Funktionen 14.2.2 Weiterleiten von Werten in Datenflüsse Sie können einen Wert verwenden, der als Parameter in einen Datenfluss weitergeleitet wurde, um die im Datenfluss transformierten Daten zu kontrollieren. Beispielsweise werden mit dem Datenfluss DF_PartFlow Werte von Tagesbeständen verarbeitet. Es können alle verwendeten Teilenummern oder ein Bereich der Teilenummern auf Grundlage externer Anforderungen wie etwa dem Bereich der zuletzt verarbeiteten Nummern verarbeitet werden. Designer-Handbuch Variablen und Parameter PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 291 Wenn der Workflow, mit dem DF_PartFlow aufgerufen wird, den Bereich der verarbeiteten Nummern aufzeichnet, kann der Endwert des Bereichs $EndRange als Parameter an den Datenfluss weitergeleitet werden, um den Starwert des nächsten zu verarbeitenden Bereichs anzugeben. Auf Grundlage einer gespeicherten Anzahl von Teilen, die jedes Mal verarbeitet werden sollen, kann ein neuer Endwert wie etwa $SizeOfSet berechnet und an den Datenfluss weitergeleitet werden. Die weitergeleiteten Parameter werden von einer Query-Transformation im Datenfluss verwendet, um die aus der Quelle extrahierten Teilenummern zu filtern. Der Datenfluss kann von mehreren Aufrufen verwendet werden, die in einem oder mehreren Workflows enthalten sind, um dieselbe Aufgabe für verschiedene Teilenummernbereiche auszuführen, indem für die entsprechenden Aufrufe unterschiedliche Parameter angegeben werden. 14.2.3 Definieren einer lokalen Variablen 1. Klicken Sie auf den Namen des Jobs oder des Workflows im Projektbereich oder im Arbeitsbereich, oder doppelklicken Sie in der Objektbibliothek auf einen Job bzw. Workflow. 2. Klicken Sie auf Extras Variablen . Das Fenster Variablen und Parameter wird angezeigt. 3. Wählen Sie auf dem Tab Definitionen die Option Variablen. 4. Klicken Sie mit der rechten Maustaste und wählen Einfügen. Wenn Sie eine Variable an einer bestimmten Position in der Liste einfügen möchten, wählen Sie eine vorhandene Variable aus, klicken Sie mit der rechten Maustaste darauf und wählen Sie Davor einfügen oder Danach einfügen aus. Es wird eine neue Variable angezeigt (z.B. $NeueVariable0). Es wird ein Fokussierfeld um die Namenszelle angezeigt, und der Cursor ändert seine Form in einen Pfeil mit einem gelben Stift. 5. Um den Namen der neuen Variable zu bearbeiten, klicken Sie auf die Namenszelle. Der Name kann alphanumerische Zeichen oder Unterstriche (_) enthalten, jedoch keine Leerzeichen. Der Name muss immer mit einem Dollarzeichen beginnen ($). 6. Klicken Sie auf die Zelle "Datentyp" für eine neue Variable, und wählen Sie den entsprechenden Datentyp aus der Drop-Down-Liste aus. 7. Wenn Sie die Reihenfolge der Variablen in der Liste festlegen möchten, wählen Sie die Variable aus, klicken Sie mit der rechten Maustaste darauf und wählen Sie Nach oben oder Nach unten aus. 8. Schließen Sie das Fenster Variablen und Parameter. 292 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Variablen und Parameter 14.2.4 Replizieren einer lokalen Variable 1. Klicken Sie auf den Namen des Jobs oder des Workflows im Projektbereich oder im Arbeitsbereich, oder doppelklicken Sie in der Objektbibliothek auf einen Job bzw. Workflow. 2. Klicken Sie auf Extras Variablen . Das Fenster Variablen und Parameter wird angezeigt. 3. Wählen Sie auf dem Tab Definitionen die Option Variablen. 4. Wählen Sie eine vorhandene Variable aus, klicken Sie mit der rechten Maustaste darauf und wählen Sie Replizieren aus. Ein Eigenschaftenfenster öffnet sich und zeigt eine neue Variable mit den gleichen Eigenschaften wie die replizierte Variable an (Beispiel: $Copy_1_NewVariable1). 5. Bearbeiten Sie den Namen der neuen Variable. Der Name kann alphanumerische Zeichen oder Unterstriche (_) enthalten, jedoch keine Leerzeichen. Der Name muss immer mit einem Dollarzeichen beginnen ($). 6. Wählen Sie den entsprechenden Datentyp aus der Drop-Down-Liste aus. 7. Klicken Sie auf OK. 8. Wenn Sie die Reihenfolge der Variablen in der Liste festlegen möchten, wählen Sie die Variable aus, klicken Sie mit der rechten Maustaste darauf und wählen Sie Nach oben oder Nach unten aus. 9. Schließen Sie das Fenster Variablen und Parameter. 14.2.5 Definieren von Parametern Zur Einrichtung von Parametern für einen Workflow oder Datenfluss stehen zwei Möglichkeiten zur Verfügung: ● Hinzufügen der Parameterdefinition zum Workflow/Datenfluss. ● Einrichten des Parameterwerts im Aufruf des Workflows/Datenflusses. 14.2.5.1 Hinzufügen eines Parameters zu einem Workflow oder Datenfluss 1. Klicken Sie auf den Namen des Workflows oder Datenflusses. 2. Klicken Sie auf Extras Variablen . Das Fenster Variablen und Parameter wird angezeigt. 3. Navigieren Sie zum Tab Definition. 4. Wählen Sie Parameter. 5. Klicken Sie mit der rechten Maustaste und wählen Einfügen. Wenn Sie einen Parameter an einer bestimmten Position in der Liste einfügen möchten, wählen Sie einen vorhandenen Parameter aus, klicken Sie mit der rechten Maustaste darauf und wählen Sie Davor einfügen oder Danach einfügen aus. Es wird ein neuer Parameter angezeigt (beispielsweise $NewParameter0). Es wird ein Fokusfeld angezeigt, und die Form des Cursors ändert sich in einen Pfeil mit einem gelben Stift. Designer-Handbuch Variablen und Parameter PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 293 6. Um den Namen der neuen Variable zu bearbeiten, klicken Sie auf die Namenszelle. Der Name kann alphanumerische Zeichen oder Unterstriche (_) enthalten, jedoch keine Leerzeichen. Der Name muss immer mit einem Dollarzeichen beginnen ($). 7. Klicken Sie auf die Datentypzelle für den neuen Parameter, und wählen Sie den entsprechenden Datentyp aus der Drop-Down-Liste aus. Wenn der Parameter ein Eingabe- oder Eingabe-/Ausgabeparameter ist, muss er denselben Datentyp wie die Variable aufweisen. Wenn es sich um einen Ausgabeparametertyp handelt, muss er einen kompatiblen Datentyp aufweisen. 8. Klicken Sie auf die Parametertypzelle, und wählen Sie den Parametertyp aus (Eingabe, Ausgabe oder Eingabe/Ausgabe). 9. Wenn Sie die Reihenfolge der Parameter in der Liste festlegen möchten, wählen Sie den Parameter aus, klicken Sie mit der rechten Maustaste darauf und wählen Sie Nach oben oder Nach unten aus. 10. Schließen Sie das Fenster Variablen und Parameter. 14.2.5.2 Einrichten des Parameterwerts im Aufruf des Workflows/Datenflusses 1. Öffnen Sie den aufrufenden Job, Workflow oder Datenfluss. 2. Wählen Sie Extras Variablen , um das Fenster Variablen und Parameter zu öffnen. 3. Wählen Sie den Tab Aufrufe. Auf dem Tab "Aufrufe" werden alle Objekte angezeigt, die von dem offenen Job, Workflow oder Datenfluss aufgerufen werden. 4. Klicken Sie auf die Zelle Argumentwert. Es wird ein Fokusfeld angezeigt, und die Form des Cursors ändert sich in einen Pfeil mit einem gelben Stift. 5. Geben Sie den Ausdruck ein, den der Parameter in die Zelle weiterleiten wird. Wenn der Parametertyp "Eingabe" lautet, kann der Wert ein Ausdruck, der eine Konstante enthält (beispielsweise 0, 3 oder 'Zeichenfolge1'), eine Variable oder ein anderer Parameter sein (zum Beispiel $startID oder $parm1). Wenn der Parametertyp "Ausgabe" oder "Eingabe/Ausgabe" lautet, muss der Wert eine Variable oder ein Parameter sein. Der Wert darf keine Konstante sein, da der Wert eines Ausgabe- oder Eingabe-/ Ausgabeparameters definitionsgemäß von einem beliebigen Objekt innerhalb des Workflows oder Datenflusses modifiziert werden kann. Verwenden Sie folgende Syntax, um spezielle Werte anzugeben: Tabelle 93: 294 Werttyp Spezielle Syntax Variable <$variable_name> Zeichenfolge <'string> ' PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Variablen und Parameter 14.3 Verwenden globaler Variablen Globale Variablen sind global innerhalb eines Jobs. Die Einstellung von Parametern ist nicht erforderlich, wenn Sie globale Variablen verwenden. Wenn Sie jedoch einen Namen für eine globale Variable in einem Job verwenden, wird dieser Name für den Job zu einem reservierten Namen. Globale Variablen sind innerhalb des Kontextes des Jobs, in dem sie angelegt werden, exklusiv. 14.3.1 Anlegen globaler Variablen Sie definieren Variablen im Fenster "Variablen und Parameter". 14.3.1.1 Anlegen einer globalen Variable 1. Klicken Sie auf den Namen eines Jobs im Projektbereich, oder doppelklicken Sie auf einen Job der Objektbibliothek. 2. Klicken Sie auf Extras Variablen . Das Fenster Variablen und Parameter wird angezeigt. 3. Wählen Sie auf dem Tab Definitionen die Option Globale Variablen aus. 4. Klicken Sie mit der rechten Maustaste auf Globale Variablen, und wählen Sie Einfügen aus. Wenn Sie eine Variable an einer bestimmten Position in der Liste einfügen möchten, wählen Sie eine vorhandene Variable aus, klicken Sie mit der rechten Maustaste darauf und wählen Sie Davor einfügen oder Danach einfügen aus. Es wird eine neue globale Variable angezeigt (beispielsweise $NeuerJobGlobaleVariable0). Es wird ein Fokusfeld angezeigt, und die Form des Cursors ändert sich in einen Pfeil mit einem gelben Stift. 5. Um den Namen der neuen Variable zu bearbeiten, klicken Sie auf die Namenszelle. Der Name kann alphanumerische Zeichen oder Unterstriche (_) enthalten, jedoch keine Leerzeichen. Der Name muss immer mit einem Dollarzeichen beginnen ($). 6. Klicken Sie auf die Zelle "Datentyp" für eine neue Variable, und wählen Sie den entsprechenden Datentyp aus der Drop-Down-Liste aus. 7. Wenn Sie die Reihenfolge der Variablen in der Liste festlegen möchten, wählen Sie die Variable aus, klicken Sie mit der rechten Maustaste darauf und wählen Sie Nach oben oder Nach unten aus. 8. Schließen Sie das Fenster Variablen und Parameter. 14.3.1.2 Replizieren einer globalen Variable 1. Klicken Sie auf den Namen eines Jobs im Projektbereich, oder doppelklicken Sie auf einen Job der Objektbibliothek. 2. Klicken Sie auf Extras Variablen . Das Fenster Variablen und Parameter wird angezeigt. Designer-Handbuch Variablen und Parameter PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 295 3. Wählen Sie auf dem Tab Definitionen die Option Globale Variablen aus. 4. Wählen Sie eine vorhandene Variable aus, klicken Sie mit der rechten Maustaste darauf und wählen Sie Replizieren aus. Ein Eigenschaftenfenster öffnet sich und zeigt eine neue Variable mit den gleichen Eigenschaften wie die replizierte Variable an (Beispiel: $Copy_1_NewJobGlobalVariable1). 5. Bearbeiten Sie den Namen der neuen globalen Variablen. Der Name kann alphanumerische Zeichen oder Unterstriche (_) enthalten, jedoch keine Leerzeichen. Der Name muss immer mit einem Dollarzeichen beginnen ($). 6. Wählen Sie den entsprechenden Datentyp aus der Drop-Down-Liste aus. 7. Klicken Sie auf OK. 8. Wenn Sie die Reihenfolge der Variablen in der Liste festlegen möchten, wählen Sie die Variable aus, klicken Sie mit der rechten Maustaste darauf und wählen Sie Nach oben oder Nach unten aus. 9. Schließen Sie das Fenster Variablen und Parameter. 14.3.2 Anzeigen von globalen Variablen Globale Variablen sind in einem Job definiert und sind für die Objekte sichtbar, die zu diesem Job gehören. Eine globale Variable, die in einem Job definiert ist, ist in einem anderen Job nicht für die Anzeige oder für Änderungen verfügbar. Sie können globale Variablen über das Fenster "Variablen und Parameter" (wenn der Arbeitsbereich einen geöffneten Job enthält) oder über das Dialogfenster "Eigenschaften" eines ausgewählten Jobs anzeigen. 14.3.2.1 Anzeigen von globalen Variablen in einem Job über das Dialogfenster „Eigenschaften“ 1. Wählen Sie in der Objektbibliothek den Tab Jobs aus. 2. Klicken Sie mit der rechten Maustaste auf den Job, dessen globale Variablen Sie anzeigen möchten, und wählen Sie Eigenschaften aus. 3. Klicken Sie auf den Tab Globale Variable. Die globalen Variablen werden auf diesem Tab angezeigt. 14.3.3 Festlegen globaler Variablenwerte Sie können eine Variable nicht nur innerhalb eines Jobs mit einem Initialisierungsskript festlegen, sondern Sie können auch globale Variablenwerte außerhalb eines Jobs festlegen und verwalten. Außerhalb eines Jobs festgelegte Werte werden in derselben Weise verarbeitet wie die innerhalb eines Initialisierungsskripts festgelegten Werte. Wenn Sie jedoch einen Wert für dieselbe Variable sowohl innerhalb als auch außerhalb eines Jobs festlegen, überschreibt der interne Jobwert den externen Jobwert. 296 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Variablen und Parameter Werte für globale Variablen können außerhalb eines Jobs festgelegt werden: ● Als Jobeigenschaft ● Als Ausführungseigenschaft oder Zeitplaneigenschaft Globale Variablen ohne definierte Werte sind ebenfalls zulässig. Sie werden als NULL gelesen. Alle als Jobeigenschaften definierten Werte werden in den Dialogfenstern "Eigenschaften" und "Ausführungseigenschaften" im Designer und auf den Seiten "Ausführungsoptionen" und "Zeitplan" im Administrator angezeigt. Durch das Festlegen von Werten außerhalb eines Jobs können Sie diese Dialogfenster nutzen, um Werte anzuzeigen, die für globale Variablen festgelegt wurden, und problemlos Werte ändern, wenn Sie einen Job testen oder einplanen. Hinweis Sie können globale Variablen nicht als Befehlszeilenargumente für Echtzeitjobs übertragen. 14.3.3.1 Festlegen globaler Variablenwerte als Jobeigenschaft 1. Klicken Sie mit der rechten Maustaste auf einen Job in der Objektbibliothek oder im Projektbereich. 2. Klicken Sie auf Eigenschaften. 3. Klicken Sie auf den Tab Globale Variable. Alle im Job angelegten globalen Variablen werden angezeigt. 4. Um die angezeigten globalen Variablen nach Namen zu filtern, geben Sie einen Teil des Namens in das Feld Filter ein. 5. Geben Sie Werte für die globalen Variablen in diesem Job ein. Bei dieser Option können Sie alle in einem Skript verwendeten Anweisungen benutzen. 6. Wenn Sie mehrere globale Variablen festlegen möchten, verwenden Sie die Steuerungstaste, um die Variablen auszuwählen, klicken Sie mit der rechten Maustaste darauf und wählen Sie Wert aktualisieren aus. Geben Sie den Wert in Smart Editor ein und klicken Sie auf OK. 7. Klicken Sie auf OK. Die Werte werden als Jobeigenschaften im Repository gespeichert. Sie können diese Standardwerte auch im Dialogfenster "Ausführungseigenschaften" im Designer und auf den Seiten "Ausführungsoptionen" und "Zeitplan" im Administrator anzeigen und bearbeiten. Auf diese Weise können Sie Jobeigenschaftswerte zur Laufzeit überschreiben. Weitere Informationen Referenzhandbuch: Skriptsprache Designer-Handbuch Variablen und Parameter PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 297 14.3.3.2 Festlegen globaler Variablenwerte als Ausführungseigenschaft 1. Führen Sie einen Job mit dem Designer aus, oder führen Sie einen Batch-Job mit dem Administrator aus bzw. planen ihn mit dem Administrator. Hinweis Für Testzwecke können Sie Echtzeitjobs im Designer im Testmodus ausführen. Achten Sie darauf, dass Sie die Ausführungseigenschaften für einen Echtzeitjob festlegen. 2. Zeigen Sie die globalen Variablen im Job und deren Standardwerte (sofern vorhanden) an. 3. Bearbeiten Sie die gewünschten Werte für globale Variablen. 4. Wenn Sie den Designer verwenden, klicken Sie auf OK. Wenn Sie den Administrator verwenden, klicken Sie auf Ausführen oder Zeitplan. Der Job wird mit den von Ihnen eingegebenen Werten ausgeführt. Als Ausführungseigenschaften eingegebene Werte werden nicht gespeichert. Als Zeitplaneigenschaften eingegebene Werte werden gespeichert, können aber nur aus dem Administrator aufgerufen werden. 14.3.3.3 Automatische Einstufung von Werten globaler Variablen in einem Job Wenn Sie unter Anwendung der im vorangegangenen Abschnitt beschriebenen Methoden für eine einzelne globale Variable andere Werte eingeben, wird der am höchsten eingestufte Wert zur Verwendung in dem Job ausgewählt. Ein als Jobeigenschaft eingegebener Wert hat den niedrigsten Rang. Ein innerhalb eines Job definierter Wert hat den höchsten Rang. ● Wenn Sie den Wert einer globalen Variablen sowohl als Job- als auch als Ausführungseigenschaft festlegen, setzt der Wert der Ausführungseigenschaft den Wert der Jobeigenschaft außer Kraft und wird zum Standardwert für die aktuelle Jobausführung. Sie können Werte globaler Variablen für Ausführungseigenschaften nicht speichern. Nehmen Sie beispielsweise an, dass der Job JOB_Test1 drei globale Variablen hat: $YEAR, $MONTH und $DAY. Die Variable $YEAR wird als Jobeigenschaft mit dem Wert 2003 festgelegt. Für die Jobausführung legen Sie die Variablen $MONTH und $DAY als Ausführungseigenschaften mit den Werten "JANUAR" bzw. "31" fest. Die Software führt eine Liste von Anweisungen aus, die Standardwerte für JOB-Test1 enthalten: $YEAR=2003; $MONTH='JANUARY'; $DAY=31; Wenn Sie für die zweite Jobausführung die Variablen $YEAR und $MONTH als Ausführungseigenschaften auf die Werte 2002 bzw. "JANUAR" setzen, dann ersetzt die Anweisung $YEAR=2002 die Anweisung $YEAR=2003. Die Software führt die folgende Anweisungsliste aus: $YEAR=2002; $MONTH='JANUARY'; 298 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Variablen und Parameter Hinweis In diesem Szenario ist $DAY nicht definiert, und die Software liest dies als NULL. Sie setzen $DAY während der ersten Jobausführung auf 31; Ausführungseigenschaften für die Werte globaler Variablen werden jedoch nicht gespeichert. ● Wenn Sie den Wert einer globalen Variablen sowohl für eine Jobeigenschaft als auch für eine Zeitplaneigenschaft festlegen, setzt der Wert für die Zeitplaneigenschaft den Wert für die Jobeigenschaft außer Kraft und wird zum externen Standardwert für die aktuelle Jobausführung. Die Software speichert Werte für Zeitplaneigenschaften im Repository. Diese Werte werden jedoch nur mit dem Zeitplan eines Jobs verknüpft, nicht mit dem Job selber. Folglich werden diese Werte im Administrator angezeigt und bearbeitet. ● Der in einem Job definierte Wert für eine globale Variable hat immer eine höhere Priorität als externe Werte. Diese Priorisierung kommt jedoch erst zum Tragen, wenn die Software versucht, die externen Werte auf den Job anzuwenden, der mit dem internen Wert verarbeitet wird. Bis zu diesem Zeitpunkt verarbeitet die Software die Werte für Ausführung, Zeiztplan oder Jobeigenschaften als Standardwerte. Nehmen Sie beispielsweise an, Sie haben einen Job mit dem Namen JOB_Test2, der drei Workflows hat, von denen jeder einen Datenfluss enthält. Der zweite Datenfluss befindet sich in einem Workflow hinter einem Skript, in dem $MONTH als "MAI" definiert ist. Der erste und dritte Datenfluss haben dieselbe globale Variable ohne definierten Wert. Die Ausführungseigenschaft $MONTH = "APRIL" ist der Wert der globalen Variablen. In diesem Szenario wird "APRIL" zum Standardwert für den Job. "APRIL" bleibt der Wert für die globale Variable, bis die Software den anderen Wert für dieselbe Variable im zweiten Workflow entdeckt. Da sich der Wert im Skript innerhalb des Jobs befindet, hat "MAI" für die Variable $MONTH eine höhere Priorität als "APRIL". Die Verarbeitung des Jobs wird mit diesem neuen Wert fortgesetzt. Designer-Handbuch Variablen und Parameter PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 299 14.3.3.4 Vorteile gegenüber dem Festlegen von Werten außerhalb eines Jobs Sie können Werte zwar innerhalb von Jobs festlegen, doch bringt das Definieren von Werten für globale Variablen außerhalb von Jobs Vorteile mit sich. So werden beispielsweise als Jobeigenschaften definierte Werte in den Dialogfenstern "Eigenschaften" und "Ausführungseigenschaften" des Designers sowie auf den Seiten "Ausführungsoptionen" und "Zeitplan" des Administrators angezeigt. Wenn Sie Werte außerhalb eines Jobs festlegen, können Sie über diese Dialogfenster alle globalen Variablen und deren Werte anzeigen. Sie können diese auch problemlos zu Test- und Einplanungszwecken bearbeiten. Im Administrator können Sie globale Variablenwerte festlegen, wenn Sie einen Zeitplan anlegen oder bearbeiten, ohne den Designer öffnen zu müssen. Verwenden Sie beispielsweise globale Variablen als Dateinamen sowie als Start- und Enddatum. 300 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Variablen und Parameter 14.4 Lokale und globale Variablenregeln Beim Definieren von lokalen oder globalen Variablen sollten Regeln für Folgendes beachtet werden: ● Namenskonventionen ● Replizierung von Jobs und Workflows ● Import und Export 14.4.1 Benennung ● Lokale und globale Variablen müssen eindeutige Namen innerhalb ihres Jobkontextes aufweisen. ● Namensänderungen an globalen Variablen können nur auf Jobebene vorgenommen werden. 14.4.2 Replizieren von Jobs und Workflows ● Wenn Sie alle Objekte replizieren, werden auch die lokalen und globalen Variablen repliziert, die in diesem Jobkontext definiert sind. ● Wenn Sie einen Datenfluss oder Workflow replizieren, werden auch alle Parameter sowie alle lokalen und globalen Variablen repliziert. Sie müssen diese lokalen und globalen Variablen jedoch innerhalb des Jobkontextes validieren, in dem sie angelegt wurden. Wenn Sie versuchen, einen Datenfluss oder Workflow, der globale Variablen enthält, ohne einen Job zu validieren, meldet Data Services einen Fehler. 14.4.3 Importieren und Exportieren ● Wenn Sie ein Jobobjekt exportieren, exportieren Sie alle für diesen Job definierten lokalen und globalen Variablen. ● Wenn Sie ein Objekt einer niedrigeren Ebene (beispielsweise ein Datenfluss) ohne den übergeordneten Job exportieren, wird die globale Variable nicht exportiert. Lediglich der Aufruf der globalen Variable wird exportiert. Wenn Sie dieses Objekt in einem anderen Job verwenden, ohne die globale Variable im neuen Job zu definieren, tritt ein Validierungsfehler auf. 14.5 Umgebungsvariablen Sie können Systemumgebungsvariablen in Jobs, Workflows oder Datenflüssen verwenden. Die Funktionen get_env, set_env und is_set_env bieten Zugriff auf die zu Grunde liegenden Betriebssystemvariablen, die sich gemäß den Berechtigungen des Betriebssystems verhalten. Sie können den Wert einer Umgebungsvariablen in einem Job, einem Workflow oder einem Datenfluss vorübergehend festlegen. Wenn der Wert festgelegt ist, ist er für alle Objekte in diesem Job sichtbar. Designer-Handbuch Variablen und Parameter PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 301 Verwenden Sie die Funktionen get_env, set_env und is_set_env, um die Werte von Umgebungsvariablen festzulegen, abzurufen und zu testen. Weitere Informationen Referenzhandbuch: Funktionen und Prozeduren 14.6 Festlegen von Dateinamen zur Laufzeit mithilfe von Variablen Sie können Dateinamen zur Laufzeit festlegen, indem Sie Variablen als Dateinamen verwenden. Variablen können als Dateinamen für folgende Elemente verwendet werden: ● Folgende Quellen und Ziele: ○ Flatfiles ○ XML-Dateien und -Meldungen ○ IDoc-Dateien und -Meldungen (in einer SAP-Umgebung) ● Funktion lookup_ext (für ein Flatfile, das als Lookup-Tabellenparameter verwendet wird) 14.6.1 Verwenden einer Variablen in einem Flatfile-Namen 1. Legen Sie eine lokale oder globale Variable mithilfe des Fensters "Variablen und Parameter" an. 2. Legen Sie ein Skript an, um den Wert einer lokalen oder globalen Variable festzulegen, oder rufen Sie eine Systemumgebungsvariable auf. 3. Deklarieren Sie die Variable im Dateiformateditor oder im Funktionseditor als lookup_ext-Parameter. ○ Wenn Sie einen Variablenwert für ein Flatfile festlegen, geben Sie sowohl den Dateinamen als auch den Verzeichnisnamen an. Geben Sie die Variable bei der Eigenschaft Datei(en) unter Datendatei(en) im Dateiformateditor ein. Sie können keine Variable bei der Eigenschaft Root-Verzeichnis eingeben. ○ Für Lookups ersetzen Sie den Pfad und Dateinamen im Feld Lookup-Tabelle im lookup_extFunktionseditor durch den Variablennamen. Die folgende Abbildung zeigt, wie Sie Werte für Variablen in Flatfile-Quellen und -Zielen in einem Skript festlegen können. 302 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Variablen und Parameter Wenn Sie Variablen als Quellen und Ziele verwenden, können Sie auch mehrere Dateinamen und Platzhalter verwenden. Beides wird nicht unterstützt, wenn Sie Variablen in der Funktion lookup_ext verwenden. Das obige Beispiel illustriert die Verwendung mehrerer Variablennamen und Platzhalter. Die Variable $FILEINPUT enthält zwei Dateinamen (durch ein Komma getrennt). Die beiden Namen (KNA1comma.* und KNA1c?mma.in) verwenden auch die von der Software unterstützten Platzhalter (* und ?). Weitere Informationen Referenzhandbuch: Funktionen und Prozeduren, Beschreibungen von integrierten Funktionen, lookup_ext Referenzhandbuch: Skriptsprache 14.7 Ersatzparameter 14.7.1 Übersicht über Ersatzparameter Ersatzparameter sind hilfreich, wenn Sie einen Job exportieren und ausführen möchten, der konstante Werte in einer spezifischen Umgebung enthält. Wenn Sie beispielsweise einen Job anlegen, der ein eindeutiges Verzeichnis auf Ihrem lokalen Rechner referenziert, und Sie exportieren diesen Job in einen anderen Rechner, sucht der Job in Designer-Handbuch Variablen und Parameter PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 303 der neuen Umgebung nach dem eindeutigen Verzeichnis. Wenn dieses Verzeichnis nicht vorhanden ist, wird der Job nicht ausgeführt. Um den Job in der neuen Umgebung auszuführen, können Sie durch Verwendung eines Ersatzparameters einfach einen Wert für den ursprünglichen konstanten Wert zuweisen. Nachdem Sie einen Ersatzparameterwert für das Verzeichnis in Ihrer Umgebung angelegt haben, können Sie den Job in einer anderen Umgebung ausführen, und in allen Objekten, die das ursprüngliche Verzeichnis referenzieren, wird der Wert automatisch verwendet. Das bedeutet, dass nur der konstante Wert (der Name des ursprünglichen Verzeichnisses) an einer Stelle (Ersatzparameter) geändert werden muss. Der Wert wird automatisch an alle Objekte im Job weitergegeben, wenn dieser in der neuen Umgebung ausgeführt wird. Sie können eine Gruppe von Ersatzparametern für eine bestimmte Laufzeitumgebung konfigurieren, indem Sie deren konstanten Wert unter einer Ersatzparameterkonfiguration zuordnen. 14.7.1.1 Unterschiede zwischen Ersatzparametern und globalen Variablen Ersatzparameter unterscheiden sich von globalen Variablen dahin gehend, dass sie auf der Repository-Ebene angewendet werden. Globale Variablen werden nur auf den Job angewendet, in dem sie definiert sind. Sie verwenden eine globale Variable, wenn Sie den Wert vor der Ausführung nicht kennen, der Wert jedoch in dem Job berechnet werden muss. Sie verwenden einen Ersatzparameter für Konstanten, die sich während der Ausführung nicht ändern. Ein Ersatzparameter, der in einem lokalen Repository definiert ist, ist für alle Jobs in diesem Repository verfügbar. Daher müssen Sie keine globale Variable in jedem Job definieren, um einen konstanten Wert zu parametrisieren, wenn Sie einen Ersatzparameter verwenden. In der folgenden Tabelle sind die wichtigsten Unterschiede zwischen globalen Variablen und Ersatzparametern beschrieben. Tabelle 94: Globale Variablen Ersatzparameter Auf der Jobebene definiert Auf der Repository-Ebene definiert Verwendung durch mehrere Jobs nicht möglich Für alle Jobs in einem Repository verfügbar Vom Datentyp abhängig Kein Datentyp (alle Zeichenfolgen) Wert kann sich während der Jobausführung ändern Fester Wert wird vor der Ausführung des Jobs festgelegt (Konstanten) Sie können jedoch Ersatzparameter an allen Positionen verwenden, an denen globale Variablen unterstützt werden. Beispiele für diese Positionen sind: ● WHERE-Klauseln in Query-Transformationen ● Zuordnungen ● SQL-Anweisungs-IDs in SQL-Transformationen ● Optionen für Flatfiles ● User-defined-Transformationen ● Address cleanse-Transformationsoptionen ● Übereinstimmungsschwellenwerte 304 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Variablen und Parameter 14.7.1.2 Verwenden von Ersatzparametern Sie können Ersatzparameter in Ausdrücken, SQL-Anweisungen, Optionsfeldern und Konstantenzeichenfolgen verwenden. Beispielsweise enthalten viele Options- und Ausdruckseditoren ein Drop-Down-Menü, in dem eine Liste aller verfügbaren Ersatzparameter angezeigt wird. Die Software installiert einige Standardersatzparameter, die von einigen Data-Quality-Transformationen verwendet werden. Die USA Regulatory Address Cleanse-Transformation verwendet beispielsweise die folgenden integrierten Ersatzparameter: ● $$RefFilesAddressCleanse definiert den Speicherort der Adressbereinigungsverzeichnisse. ● $$ReportsAddressCleanse (auf "Ja" oder "Nein" gesetzt) aktiviert die Datenerfassung zum Anlegen von Berichten mit Adressbereinigungsstatistiken. Mithilfe des Ersatzparameters können Sie diese Option für alle Jobs im Repository an einem zentralen Ort aktivieren bzw. deaktivieren. Andere Beispiele dafür, wo Sie Ersatzparameter verwenden können, sind: ● In einem Skript: Print('Data read in : [$$FilePath]'); or Print('[$$FilePath]'); ● In einem Dateiformat z.B. mit [$$Dateipfad]/Datei.txt als Dateiname 14.7.2 Verwenden des Editors für Ersatzparameter Öffnen Sie den Editor für Ersatzparameter im Designer, indem Sie Extras Ersatzparameterkonfigurationen auswählen. Führen Sie mit dem Editor für Ersatzparameter folgende Aufgaben aus: ● Fügen Sie einen Ersatzparameter hinzu, und definieren Sie ihn, indem Sie im Editor eine neue Zeile hinzufügen. ● Verwenden Sie bei den einzelnen Parametern Kontextmenüs und Tastenkombinationen, um Parameter auszuschneiden, zu kopieren, einzufügen und zu löschen. ● Ändern Sie die Reihenfolge der Ersatzparameter, indem Sie die Zeilen ziehen oder mit den Befehlen "Ausschneiden", "Kopieren" und "Einfügen". ● Fügen Sie eine Ersatzparameterkonfiguration hinzu, indem Sie in der Symbolleiste auf das Symbol Neue Ersatzparameterkonfiguration klicken. ● Duplizieren Sie eine vorhandene Ersatzparameterkonfiguration, indem Sie auf das Symbol Doppelte Ersatzparameterkonfiguration anlegen klicken. ● Benennen Sie eine Ersatzparameterkonfiguration um, indem Sie auf das Symbol Ersatzparameterkonfiguration umbenennen klicken. ● Löschen Sie eine Ersatzparameterkonfiguration, indem Sie auf das Symbol Ersatzparameterkonfiguration löschen klicken. ● Ordnen Sie die Anzeige der Konfigurationen neu an, indem Sie auf die Symbole Konfigurationsnamen in aufsteigender Reihenfolge sortieren und Konfigurationsnamen in absteigender Reihenfolge sortieren klicken. ● Verschieben Sie die Standardkonfiguration so, dass sie neben der Liste der Ersatzparameter angezeigt wird, indem Sie auf das Symbol Standardkonfiguration nach vorn verschieben klicken. ● Ändern Sie die Standardkonfiguration. Designer-Handbuch Variablen und Parameter PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 305 Weitere Informationen Hinzufügen und Definieren von Ersatzparametern [Seite 306] 14.7.2.1 Benennen von Ersatzparametern Halten Sie sich beim Benennen und Definieren von Ersatzparametern an die folgenden Regeln: ● Das Namenspräfix besteht aus zwei Dollarzeichen $$ (globalen Variablen wird ein Dollarzeichen vorangestellt). Beim Hinzufügen neuer Ersatzparameter im Editor für Ersatzparameter fügt der Editor automatisch das Präfix hinzu. ● Verwenden Sie bei der Eingabe von Namen im Editor für Ersatzparameer keine Interpunktion (einschließlich Anführungszeichen oder Klammern) mit Ausnahme von Unterstrichen. Folgende Zeichen sind nicht zulässig: ,: / ' \ " = < > + | - * % ; \t [ ] ( ) \r \n $ ] + ● Sie können Namen direkt in Felder, Spaltenzuordnungen, Transformationsoptionen usw. eingeben. Sie müssen jedoch in eckige Klammern gesetzt werden, z.B. [$$BeispieleInstall]. ● Namen dürfen alphanumerische oder numerische Zeichen oder Unterstriche, jedoch keine Leerzeichen, enthalten. ● Bei Namen wird nicht zwischen Groß- und Kleinschreibung unterschieden. ● Bei den meisten Repository-Typen beträgt die Maximallänge 256 (bei MySQL 64 und bei MS SQL Server 128 Zeichen). ● Namen müssen eindeutig innerhalb des Repositorys sein. 14.7.2.2 Hinzufügen und Definieren von Ersatzparametern 1. Öffnen Sie im Designer den Editor für Ersatzparameter, indem Sie Ersatzparameterkonfigurationen Extras auswählen. 2. In der ersten Spalte werden die im Repository verfügbaren Ersatzparameter aufgelistet. Um einen neuen Ersatzparameter anzulegen, doppelklicken Sie in einer leeren Zelle (links wird ein Stiftsymbol angezeigt), und geben Sie einen Namen ein. Wenn Sie von der Zelle wegnavigieren, wird dem Namen automatisch ein doppeltes Dollarzeichen vorangestellt. 3. In der zweiten Spalte wird standardmäßig der Name der ersten Konfiguration identifiziert Konfiguration1 (Sie können Konfigurationsnamen ändern, indem Sie in der Zelle einen Doppelklick ausführen und den Namen erneut eingeben). Doppelklicken Sie auf die leere Zelle neben dem Namen des Ersatzparameters und geben Sie die Konstante ein, die der Parameter in dieser Konfiguration repräsentiert. Dieser Wert wird beim Ausführen des Jobs angewendet. 4. Um eine weitere Konfiguration zum Definieren eines zweiten Werts für den Ersatzparameter hinzuzufügen, klicken Sie auf das Symbol Neue Ersatzparameterkonfiguration anlegen in der Symbolleiste. 5. Geben Sie einen eindeutigen Namen für die neue Ersatzparameterkonfiguration ein. 6. Geben Sie den Wert ein, den der Ersatzparameter für diese Konfiguration verwendet. Sie können nun eine der beiden Ersatzparameterkonfigurationen auswählen. 306 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Variablen und Parameter Um die beim Ausführen von Jobs anwendbare Standardkonfiguration zu ändern, wählen Sie sie unten im Fenster im Drop-Down-Listenfeld aus. Sie können diese Ersatzparameterkonfigurationen auch zur Verwendung in anderen Umgebungen exportieren. Beispiel Im folgenden Beispiel hat der Ersatzparameter $$NetworkDir den Wert D:/Data/Staging in der Konfiguration namens Windows_Subst_Param_Conf und den Wert /usr/data/staging in der Konfiguration UNIX_Subst_Param_Conf. Beachten Sie, dass jede Konfiguration mehrere Ersatzparameter enthalten kann. Weitere Informationen Benennen von Ersatzparametern [Seite 306] Exportieren und Importieren von Ersatzparametern [Seite 310] 14.7.3 Zuordnen von Ersatzparameterkonfigurationen zu Systemkonfigurationen In einer Systemkonfiguration sind mehrere Datastore-Konfigurationen und eine Ersatzparameterkonfiguration gruppiert. Eine Ersatzparameterkonfiguration kann einer oder mehreren Systemkonfigurationen zugeordnet werden. So könnten Sie eine Systemkonfiguration für das lokale System und eine weitere Systemkonfiguration für ein anderes System anlegen. Je nach Umgebung zeigen beide Systemkonfigurationen unter Umständen auf Designer-Handbuch Variablen und Parameter PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 307 dieselbe Ersatzparameterkonfiguration, oder jede Systemkonfiguration benötigt eine eigene Ersatzparameterkonfiguration. Zum Zeitpunkt der Jobausführung können Sie die Systemkonfiguration festlegen, sodass der Job mit den Werten für die zugeordnete Ersatzparameterkonfiguration ausgeführt wird. So ordnen Sie eine Ersatzparameterkonfiguration einer neuen oder vorhandenen Systemkonfiguration zu: 1. Öffnen Sie im Designer den Editor für Systemkonfigurationen, indem Sie auswählen. Extras Systemkonfigurationen 2. Legen Sie optional eine neue Systemkonfiguration an. 3. Wählen Sie unter dem Namen der gewünschten Systemkonfiguration eine Ersatzparameterkonfiguration aus, die der Systemkonfiguration zugeordnet werden soll. 4. Klicken Sie auf OK. Beispiel Im folgenden Beispiel sind zwei Systemkonfigurationen zu sehen, eine für Amerika und eine für Europa. In diesem Fall liegen Ersatzparameterkonfigurationen für jede Region vor (Europe_Subst_Parm_Conf und Americas_Subst_Parm_Conf). In jeder Ersatzparameterkonfiguration ist definiert, wo sich die Datenquelldateien für die jeweilige Region befinden, zum Beispiel D:/Daten/Amerika and D:/Daten/Europa. Wählen Sie die entsprechende Ersatzparameterkonfiguration und die Datastore-Konfigurationen für jede Systemkonfiguration aus. 308 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Variablen und Parameter Weitere Informationen Definieren einer Systemkonfiguration [Seite 109] 14.7.4 Überschreiben eines Ersatzparameters im Administrator Im Administrator können Sie die Ersatzparameter überschreiben oder auf vier Seiten eine Systemkonfiguration auswählen, um eine Ersatzparameterkonfiguration anzugeben: ● Batch-Job ausführen ● Batch-Job einplanen ● Ausgeführten Befehl exportieren ● Echtzeitdienst-Konfiguration Auf der Seite "Batch-Job ausführen" werden beispielsweise der Name der ausgewählten Systemkonfiguration, die Ersatzparameterkonfiguration und der Name jedes Ersatzparameters und dessen Wert angezeigt. So überschreiben Sie einen Ersatzparameter: 1. Wählen Sie die betreffende Systemkonfiguration aus. 2. Klicken Sie unter Ersatzparameter auf die Option Überschriebenen Parameter hinzufügen, woraufhin die verfügbaren Ersatzparameter angezeigt werden. 3. Wählen Sie aus der Drop-Down-Liste den zu überschreibenden Ersatzparameter aus. 4. Geben Sie in der zweiten Spalte den neuen Wert ein. Geben Sie den Wert als Zeichenfolge ohne Anführungszeichen ein (im Gegensatz zu globalen Variablen). 5. Führen Sie den Job aus. 14.7.5 Ausführen eines Jobs mit Ersatzparametern Gehen Sie wie folgt vor, um Details zur Verwendung von Ersatzparametern in dem Job während der Ausführung im Trace-Protokoll des Designers anzuzeigen: 1. Klicken Sie mit der rechten Maustaste auf den Jobnamen, und klicken Sie auf Eigenschaften. 2. Klicken Sie auf den Tab Trace. 3. Setzen Sie den Wert für die Option Assembler verfolgen auf Ja. 4. Klicken Sie auf OK. Wenn Sie einen Job über den Designer ausführen, wird das Fenster "Ausführungseigenschaften" angezeigt. Folgende Optionen stehen zur Verfügung: ● Wählen Sie auf dem Tab Ausführungsoptionen im Drop-Down-Menü Systemkonfiguration optional die Systemkonfiguration aus, mit der Sie den Job ausführen möchten. Wenn Sie keine Systemkonfiguration auswählen, wendet die Software die Standard-Ersatzparameterkonfiguration an, die im Editor für Ersatzparameter definiert ist. Sie können auf Durchsuchen klicken, um das Fenster Systemkonfiguration wählen anzuzeigen. Diesem Fenster können Sie entnehmen, welche Ersatzparameterkonfiguration jeder Systemkonfiguration zugewiesen Designer-Handbuch Variablen und Parameter PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 309 ist. Das Fenster Systemkonfiguration wählen ist schreibgeschützt. Wenn Sie eine Systemkonfiguration ändern möchten, klicken Sie auf Extras Systemkonfigurationen . ● Sie können den Wert bestimmter Ersatzparameter zur Laufzeit außer Kraft setzen. Klicken Sie auf den Tab Ersatzparameter, wählen Sie einen Ersatzparameter in der Spalte „Name“ aus, und geben Sie einen Wert ein, indem Sie in der Zelle „Wert“ doppelklicken. Informationen zur Außerkraftsetzung von Ersatzparameterwerten beim Starten eines Jobs über einen WebService finden Sie im Integrator's Guide. Weitere Informationen Zuordnen von Ersatzparameterkonfigurationen zu Systemkonfigurationen [Seite 307] Überschreiben eines Ersatzparameters im Administrator [Seite 309] 14.7.6 Exportieren und Importieren von Ersatzparametern Ersatzparameter werden zusammen mit ihren konfigurierten Werten in einem lokalen Repository gespeichert. Bei einem regulären Exportvorgang sind keine Ersatzparameter enthalten. Sie können Ersatzparameter und Konfigurationen jedoch in andere Repositorys exportieren, indem Sie sie in eine Datei exportieren und die Datei anschließend in ein anderes Repository importieren. 14.7.6.1 Exportieren von Ersatzparametern 1. Klicken Sie mit der rechten Maustaste in die lokale Objektbibliothek, und wählen Sie Ersatzparameterkonfigurationen exportieren Repository aus. 2. Wählen Sie das Kontrollkästchen in der Spalte Exportieren für die Ersatzparameterkonfigurationen aus, die exportiert werden sollen. 3. Speichern Sie die Datei. Die Software speichert die Datei als Textdatei mit der Erweiterung .atl. 14.7.6.2 Importieren von Ersatzparametern Die Ersatzparameter müssen zuerst in eine ATL-Datei exportiert worden sein. Achten Sie beim Importieren von Ersatzparametern auf folgende Verhaltensweisen: ● Dem lokalen Ziel-Repository werden von der Software alle neuen Parameter und Konfigurationen hinzugefügt. ● Wenn das Repository einen Ersatzparameter mit dem gleichen Namen wie in der exportierten Datei enthält, wird der Parameterwert beim Importieren überschrieben. Wenn das Repository eine Ersatzparameterkonfiguration mit dem gleichen Namen wie in der exportierten Konfiguration enthält, werden beim Importieren ebenfalls alle Parameterwerte für diese Konfiguration überschrieben. 310 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Variablen und Parameter 1. Klicken Sie im Designer mit der rechten Maustaste in die Objektbibliothek, und wählen Sie Datei importieren Repository Aus PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 311 aus. 2. Navigieren Sie zu der Datei, die importiert werden soll. 3. Klicken Sie auf OK. Weitere Informationen Exportieren von Ersatzparametern [Seite 310] Designer-Handbuch Variablen und Parameter 15 Ausführen von Jobs Dieser Abschnitt enthält eine Übersicht über die Jobausführung durch die Software, die Schritte beim Ausführen von Jobs, Debug-Fehler und das Ändern von Jobserveroptionen. 15.1 Übersicht über die Jobausführung Sie können Jobs auf drei verschiedene Arten ausführen. Abhängig von Ihren Anforderungen können Sie folgende Jobs konfigurieren: Tabelle 95: Job Beschreibung Sofortige Jobs Es werden sowohl Batch- als auch Echtzeitjobs initiiert und umgehend aus dem Designer ausgeführt. Für diese Jobs müssen sowohl der Designer als auch der desig nierte Jobserver (auf dem der Job ausgeführt wird, üblicherweise häufig auf demselben Rechner) ausgeführt werden. Höchstwahrscheinlich werden Sie sofortige Jobs nur während des Entwicklungszyklus ausführen. Geplante Jobs Batch-Jobs werden geplant. Um einen Job zu planen, verwenden Sie den Administrator oder den Scheduler eines Drittherstellers. Wenn Jobs durch Drittherstellersoftware geplant werden: ● wird der Job außerhalb der Software initiiert. ● wird der Job in einem Batch-Job (oder Shell-Skript für UNIX) ausgeführt, der aus der Software exportiert wurde. Wenn ein Job durch den Scheduler eines Drittherstellers aufgerufen wird: Dienste ● muss der entsprechende Jobserver ausgeführt werden. ● Der Designer muss nicht ausgeführt werden. Echtzeitjobs sind als Dienste eingerichtet, die fortlaufend auf Anforderungen von einem Zugriffsserver warten und Anforderungen nach Empfang auf Abruf verarbeiten. Ver wenden Sie den Administrator, um einen Dienst aus einem Echtzeitjob anzulegen. 15.2 Vorbereiten der Jobausführung 15.2.1 Validieren von Jobs und Jobkomponenten Sie können Jobs und deren Komponenten beim Anlegen auch explizit validieren, indem Sie folgendermaßen vorgehen: 312 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Ausführen von Jobs Tabelle 96: Klicken Sie auf die Schaltfläche Alle validieren in der Symbolleiste (oder wählen Sie Alle Objekte in Sicht Validieren im Menü Debuggen). Mit diesem Befehl wird die Syntax der Objektdefinition für den aktiven Arbeitsbereich und für alle Objekte geprüft, die aus der aktiven Arbeitsbereichssicht rekursiv aufgerufen werden. Klicken Sie auf die Schaltfläche Aktuelle Sicht validieren in der Symbolleiste (oder wählen Sie Validieren Aktuelle Sicht im Menü Debuggen). Mit diesem Befehl wird die Syntax der Objekt definition für den aktiven Arbeitsbereich geprüft. Sie können die Designer-Optionen ( Extras Optionen Designer Allgemein ) festlegen, um die im Designer gestarteten Jobs vor der Jobausführung zu validieren. Standardmäßig werden die Jobs nicht validiert. Die Jobs werden vor dem Export auch validiert. Wenn während der Validierung ein Fehler in einer Objektdefinition festgestellt wird, öffnet sich ein Dialogfenster, das das Auftreten eines Fehlers anzeigt; anschließend wird das Fenster "Ausgabe" geöffnet, in dem der Fehler angezeigt wird. Wenn Fehler vorhanden sind, doppelklicken Sie auf den Fehler im Fenster "Ausgabe", um den Editor des Objekts, in dem der Fehler aufgetreten ist, zu öffnen. Wenn Sie nicht den gesamten Fehlertext im Fenster lesen können, können Sie auf zusätzliche Informationen zugreifen, indem Sie mit der rechten Maustaste auf die Fehlerliste klicken und im Kontextmenü die Option Sicht wählen. Fehlermeldungen haben folgende Schweregrade: Tabelle 97: Schweregrad Beschreibung Informationen Rein informative Meldung – verhindert nicht die Ausführung des Jobs. Es ist keine Aktion erforder lich. Warnung Der Fehler ist nicht schwerwiegend genug, um die Jobausführung anzuhalten, möglicherweise erhal ten Sie jedoch unerwartete Ergebnisse. Wenn beispielswiese der Datentyp einer Quellspalte in einer Transformation innerhalb eines Datenflusses nicht mit dem Datentyp der Zielspalte in der Transfor mation übereinstimmt, werden Sie über einen Alert darauf hingewiesen. Fehler Der Fehler ist schwerwiegend genug, um die Jobausführung zu stoppen. Der Fehler muss behoben werden, bevor der Job ausgeführt wird. 15.2.2 Sicherstellen der Jobserverausführung Stellen Sie sicher, dass der Jobserver mit dem Repository verknüpft ist, in dem der Client ausgeführt wird, bevor Sie einen Job ausführen (entweder als sofortige oder geplante Aufgabe). Wenn der Designer startet, wird der Status des Jobservers für das Repository angezeigt, mit dem Sie verbunden sind. Designer-Handbuch Ausführen von Jobs PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 313 Tabelle 98: Symbol Beschreibung Jobserver wird ausgeführt Jobserver ist nicht aktiv Der Name des aktiven Jobservers und die Portnummer werden in der Statusleiste angezeigt, wenn sich der Cursor über dem Symbol befindet. 15.2.3 Festlegen von Optionen für die Jobausführung Zu den Optionen für Jobs gehören "Debuggen" und "Verfolgen". Obwohl es sich hierbei um Objektoptionen handelt, die sich auf die Funktionsweise von Objekten auswirken, befinden sie sich entweder in dem mit dem Job verknüpften Eigenschafts- oder Ausführungsfenster. Ausführungsoptionen für Jobs können entweder für eine einzelne Instanz oder als Standardwert festgelegt werden. ● Im Kontextmenü Ausführen werden Optionen festgelegt, die nur für eine einzige Ausführung gelten und die Standardeinstellungen außer Kraft setzen. ● Im Kontextmenü Eigenschaften werden die Standardeinstellungen festgelegt. 15.2.3.1 Festlegen von Ausführungsoptionen für jede Ausführung des Jobs 1. Klicken Sie im Bereich Projekt mit der rechten Maustaste auf den Jobnamen, und wählen Sie Eigenschaften. 2. Wählen Sie Optionen im Fenster „Eigenschaften“ aus. Weitere Informationen Hinzufügen, Ändern und Anzeigen von Objekteigenschaften [Seite 44] Referenzhandbuch: Objekte, Beschreibung von Objekten, Batch-Eigenschaften, Ausführungsoptionen Referenzhandbuch: Objekte, Beschreibung von Objekten, Batch-Eigenschaften, Trace-Eigenschaften Festlegen globaler Variablenwerte [Seite 296] 314 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Ausführen von Jobs 15.3 Ausführen von Jobs als sofortige Aufgaben Aufgaben, die sofort oder "auf Abruf" ausgeführt werden, werden vom Designer initiiert. Sowohl der Designer als auch der Jobserver müssen aktiv sein, damit der Job ausgeführt wird. 15.3.1 Ausführen eines Jobs als sofortige Aufgabe 1. Wählen Sie im Projektbereich den Jobnamen aus. 2. Klicken Sie mit der rechten Maustaste, und wählen Sie Ausführen aus. Sie werden dazu aufgefordert, alle Objekte mit noch nicht gespeicherten Änderungen zu speichern. 3. Der nächste Schritt ist davon abhängig, ob Sie das Kontrollkästchen Job vor Jobausführung vollständig validieren in den Designer-Optionen aktiviert haben: ○ Wenn Sie dieses Kontrollkästchen nicht aktiviert haben, wird ein Fenster mit Ausführungseigenschaften (Debuggen und Verfolgen) für den Job geöffnet. Fahren Sie mit dem nächsten Schritt fort. ○ Wenn Sie dieses Kontrollkästchen aktiviert haben, wird der Job vor der Ausführung validiert. Vor der Ausführung des Jobs müssen jegliche schwerwiegende Fehler behoben werden. Darüber hinaus können Warnmeldungen auftreten – beispielsweise Meldungen, die angeben, dass Datumswerte in DateTimeWerte konvertiert werden. Korrigieren Sie dies ggf. (die Jobausführung wird durch die Meldungen nicht verhindert), oder klicken Sie auf OK, um fortzufahren. Nachdem der Job validiert wurde, wird ein Fenster geöffnet, in dem die Ausführungseigenschaften (Debuggen und Verfolgen) für den Job angezeigt werden. 4. Legen Sie die Ausführungseigenschaften fest. Sie können den Jobserver wählen, der diesen Job verarbeiten soll, ggf. die Datastore-Profile für Quellen und Ziele, die automatische Wiederherstellung aktivieren, die standardmäßigen Trace-Eigenschaften überschreiben oder globale Variablen zur Laufzeit wählen. Hinweis Das Festlegen der Ausführungseigenschaften an dieser Stelle bewirkt lediglich eine temporäre Änderung der derzeitigen Ausführung. 5. Klicken Sie auf OK. Wenn die Ausführung beginnt, wird das Ausführungsfenster mit der aktiven Schaltfläche "Trace-Protokoll" geöffnet. Verwenden Sie die Schaltflächen oben im Protokollfenster zum Anzeigen von Trace-Protokoll, Überwachungsprotokoll und Fehlerprotokoll (falls Fehler aufgetreten sind). Nachdem der Job abgeschlossen ist, verwenden Sie ein RDBMS-Abfragetool, um den Inhalt der Zieltabelle oder -datei zu prüfen. Weitere Informationen Designer – Allgemein [Seite 54] Designer-Handbuch Ausführen von Jobs PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 315 Referenzhandbuch: Objekte, Beschreibung von Objekten, Batch-Jobs, Ausführungsoptionen Referenzhandbuch: Objekte, Beschreibung von Objekten, Batch-Jobs, Trace-Eigenschaften Festlegen globaler Variablenwerte [Seite 296] Debuggen von Ausführungsfehlern [Seite 316] Untersuchen von Zieldaten [Seite 319] 15.3.2 Überwachen (Tab) Auf dem Tab Überwachen werden die Trace-Protokolle von allen aktuellen und jüngsten Ausführungen eines Jobs aufgeführt. Die Ampelsymbole auf dem Tab Überwachen haben folgende Bedeutung: ● Eine grüne Ampel zeigt an, dass der Job gerade ausgeführt wird. Sie können mit der rechten Maustaste klicken und "Job beenden" auswählen, um einen in Ausführung befindlichen Job anzuhalten. ● Eine rote Ampel zeigt an, dass der Job beendet wurde. Sie können mit der rechten Maustaste klicken und "Eigenschaften" auswählen, um eine Beschreibung für ein bestimmtes Trace-Protokoll hinzuzufügen. Diese Beschreibung wird mit dem Protokoll gespeichert und kann später über den Tab "Protokoll" abgerufen werden. ● Eine rotes Kreuz zeigt an, dass beim Job ein Fehler aufgetreten ist. 15.3.3 Protokoll (Tab) Sie können auf dem Tab Protokoll auch den Trace-Protokollverlauf eines Jobs anzeigen. Klicken Sie auf ein Trace-Protokoll, um es im Arbeitsbereich zu öffnen. Verwenden Sie die Trace-, Überwachungs- und Fehlerprotokollsymbole (von links nach rechts oben im JobAusführungsfenster des Arbeitsbereichs), um alle verfügbaren Protokollarten für den Zeitpunkt (Datum und Uhrzeit) der Jobausführung anzuzeigen. 15.4 Debuggen von Ausführungsfehlern In der nachstehenden Tabelle werden die Tools aufgelistet, die Ihnen helfen können, Ausführungsfehler zu verstehen: 316 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Ausführen von Jobs Tabelle 99: Tool Definition Debug-Paket Legt ein Job-Debug-Paket an, das die ATL- und Trace-, Überwachungs- und Protokolldateien enthält. Dies ist hilfreich für Sie und den SAP-Kundensupport, um ausführungsbezogene Probleme zu behe ben. Fehlerprotokoll Zeigt den Namen des Objekts, das beim Auftreten eines Fehlers ausgeführt wurde, und den Text der resultierenden Fehlermeldung an. Wenn der Job mit SAP-Daten ausgeführt wurde, sind einige der ABAP-Fehler auch im Fehlerprotokoll verfügbar. Überwachungsproto koll Zeigt die einzelnen Schritte aller Datenflüsse im Job, die Anzahl der mit jedem Schritt per Streaming übertragenen Zeilen und die Dauer jedes Schritts an. Zieldaten Prüfen Sie stets Ihre Zieldaten, um festzustellen, ob mit Ihrem Job die erwarteten Ergebnisse erzielt wurden. Trace-Protokoll Führt die einzelnen im Job aufgeführten Schritte und den Zeitpunkt des Auführungsbeginns und -en des auf. Weitere Informationen Verwenden von Protokollen [Seite 317] Untersuchen von Trace-Protokollen [Seite 319] Untersuchen von Überwachungsprotokollen [Seite 319] Prüfen von Fehlerprotokollen [Seite 319] Untersuchen von Zieldaten [Seite 319] Anlegen von Debug-Paketen [Seite 319] 15.4.1 Verwenden von Protokollen In diesem Abschnitt wird die Verwendung von Protokollen im Designer beschrieben. ● Um das Trace-Protokoll bei der Jobausführung zu öffnen, wählen Sie Allgemein Extras Optionen Designer Überwachungsansicht bei Jobausführung öffnen . ● Um den Protokollinhalt aus einem geöffneten Protokoll zu kopieren, wählen Sie eine oder mehrere Zeilen, und verwenden Sie die Tastaturbefehle [Strg+C]. 15.4.1.1 Aufrufen eines Protokolls während der Jobausführung Wenn Ihr Designer beim Start der Jobausführung ausgeführt wird, wird das Ausführungsfenster automatisch geöffnet und die Trace-ProtokollInformationen werden angezeigt. Verwenden Sie die Überwachungs- und Fehlerprotokollsymbole (mittleres und rechtes Symbol oben im Ausführungsfenster), um diese Protokolle anzuzeigen. Designer-Handbuch Ausführen von Jobs PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 317 Das Ausführungsfenster bleibt so lange geöffnet, bis Sie es schließen. 15.4.1.2 Aufrufen eines Protokolls nach dem Schließen des Ausführungsfensters 1. Klicken Sie im Projektbereich auf den Tab Protokoll. 2. Klicken Sie auf einen Jobnamen, um alle Trace-, Überwachungs- und Fehlerprotokolldateien im Arbeitsbereich anzuzeigen. Sie können den gewünschten Job auch aufklappen, um die Liste der TraceProtokolldateien anzuzeigen und auf eine Datei zu klicken. Die Protokollindikatoren zeigen Folgendes an: Tabelle 100: Jobprotokollindikator N_ Beschreibung Zeigt an, dass der Job erfolgreich auf diesem explizit ausgewählten Jobserver ausgeführt wurde. Zeigt an, dass der Job erfolgreich durch eine Servergruppe ausgeführt wurde. Der aufgelis tete Jobserver hat den Job ausgeführt. Zeigt an, dass bei der Jobausführung auf diesem explizit ausgewählten Jobserver ein Feh ler aufgetreten ist. Zeigt an, dass bei der Jobausführung durch eine Servergruppe ein Fehler aufgetreten ist. Der aufgelistete Jobserver hat den Job ausgeführt. 3. Klicken Sie auf das Protokollsymbol für die Ausführung des gewünschten Jobs. (Ermitteln Sie die Ausführung anhand der Position in der Reihenfolge oder des DatumUhrzeit-Stempels.) 4. Wechseln Sie über das Listenfeld zwischen Protokolltypen oder zeigen Sie Keine Protokolle oder Alle Protokolle an. 15.4.1.3 Löschen von Protokollen Im Administrator können Sie festlegen, wie lange Protokolle beibehalten werden sollen. Führen Sie folgende Schritte aus, um Protokolle manuell aus dem Designer zu löschen: 1. Klicken Sie im Projektbereich auf den Tab Protokoll. 2. Klicken Sie mit der rechten Maustaste auf das zu löschende Protokoll und wählen Protokoll löschen. 318 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Ausführen von Jobs Weitere Informationen Administratorhandbuch: Festlegen der Protokollaufbewahrungsfrist 15.4.1.4 Untersuchen von Trace-Protokollen Anhand der Trace-Protokolle können Sie feststellen, welche Ausführungen fehlgeschlagen sind, ob die Ausführungsschritte in der erwarteten Reihenfolge auftreten und welche Teile der Ausführung am längsten dauern. 15.4.1.5 Untersuchen von Überwachungsprotokollen Im Überwachungsprotokoll werden die Aktivitäten der Komponenten des Jobs quantifiziert. Aufgeführt wird die Zeit, die in einer bestimmten Komponente eines Jobs verbracht wurde, und die Anzahl der Datenzeilen, die die Komponente durchlaufen haben. 15.4.1.6 Prüfen von Fehlerprotokollen In der Software wird für jede Jobausführung ein Fehlerprotokoll angelegt. Stellen Sie anhand der Fehlerprotokolle fest, auf welche Weise eine Ausführung fehlgeschlagen ist. Wenn die Ausführung ohne Fehler abgeschlossen wurde, ist das Fehlerprotokoll leer. 15.4.2 Untersuchen von Zieldaten Ob ein Job erfolgreich war, lässt sich am besten am Zustand der Zieldaten ablesen. Untersuchen Sie immer die Daten, damit Sie sicher sein können, dass die Datenverschiebungsoperation zu den erwarteten Ergebnissen geführt hat. Stellen Sie Folgendes sicher: ● Keine Daten wurden in inkompatible Typen konvertiert oder abgeschnitten. ● Im Ziel wurden keine Datendubletten angelegt. ● Zwischen Aktualisierungen des Ziels sind keine Daten verloren gegangen. ● Generierte Schlüssel wurde richtig inkrementiert. ● Aktualisierte Werte wurden korrekt verarbeitet. 15.4.3 Anlegen von Debug-Paketen Anlegen eines Job-Debug-Pakets, das die ATL- und Trace-, Überwachungs- und Protokolldateien enthält. Designer-Handbuch Ausführen von Jobs PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 319 Sie können ein Job-Debug-Paket anlegen, das die ATL- und Trace-, Überwachungs- und Protokolldateien enthält. Senden Sie die generierte .zip- oder .tar-Datei an den SAP-Kundensupport, um Unterstützung bei der Behebung ausführungsbezogener Probleme zu erhalten. Sie können das Debug-Paket generieren, während Sie den Job aus dem Fenster „Ausführungseigenschaften“ des Designers oder auf der Seite „Ausführungsoptionen“ des Administrators der Management Console ausführen. 1. Klicken Sie im Designer-Projektbereich mit der rechten Maustaste auf den Jobnamen, und wählen Sie Ausführen. Sie werden dazu aufgefordert, alle Objekte mit noch nicht gespeicherten Änderungen zu speichern. 2. Wählen Sie im Fenster Ausführungseigenschaften den Tab Trace aus. 3. Wählen Sie Debug-Paket anlegen, und ändern Sie den Wert auf Ja. 4. Klicken Sie auf OK. Die zip- oder tar-Debug-Paketdatei wird an folgendem Speicherort generiert: <DS_GEMEINSAMES_VERZ> \log\<Jobservername>\<Repository-Name>, auf dem Rechner, auf dem der Jobserver installiert ist. 15.5 Ändern von Jobserveroptionen Machen Sie sich mit den technischeren Aspekten der Datenverarbeitung durch die Software (mithilfe des Referenzhandbuchs) und mit einigen ihrer Schnittstellen vertraut, z.B. den Schnittstellen für Adapter und SAPAnwendungen. Die Software bietet viele Optionen für die Fehlerbehebung und Optimierung bei einem Job. Tabelle 101: Option Optionsbeschreibung Adapter Data Exchange Time- (Für Adapter) Definiert die Zeit, während der ein Funktions out aufruf oder eine ausgehende Meldung auf die Antwort von der Adapteroperation wartet. Adapter Start Time-out (Für Adapter) Definiert die Zeit, während der der Administra Standardwert 10800000 (3 Stunden) 90000 (90 Sekunden) tor oder der Designer auf eine Antwort von dem Jobserver wartet, der Adapter verwaltet (Start/Stopp/Status). AL_JobServerLoadBalance Ermöglicht einem Jobserver die Protokollierung von Informa Debug tionen zur Servergruppe, wenn der Wert auf TRUE gesetzt ist. FALSE Die Informationen finden Sie unter < $VERKNÜPFUNGSVERZ>/Log/ <Jobservername>/ server_eventlog.txt. AL_JobServerLoadOSPolling Legt das Abfrageintervall (in Sekunden) fest, das die Software 60 verwendet, um Statusinformationen abzurufen. Mit diesen In formationen wird der Index für den Lastausgleich berechnet. Dieser Index wird von Servergruppen verwendet. 320 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Ausführen von Jobs Option Optionsbeschreibung Standardwert Display DI Internal Jobs Zeigt den internen Datastore der Software, CD_DS_d0cafae2, FALSE und die zugehörigen Jobs in der Objektbibliothek an. Der Da tastore CD_DS_d0cafae2 unterstützt zwei interne Jobs. Der erste Job berechnet Verwendungsabhängigkeiten von Reposi tory-Tabellen, und der zweite Job aktualisiert Servergruppen konfigurationen. Wenn Sie das Kennwort oder den Benutzernamen für das Re pository oder andere Verbindungsinformationen ändern, än dern Sie den Standardwert dieser Option in TRUE, schließen Sie den Designer und öffnen ihn erneut, und aktualisieren Sie anschließend die Konfiguration des Datastores CD_DS_d0ca fae2 so, dass er mit der neuen Repository-Konfiguration über einstimmt. Damit können der Job für die Berechnung der Ver wendungsabhängigkeiten (CD_JOBd0cafae2) und der Job für Servergruppen (di_job_al_mach_info) ohne Verbindungsfeh ler ausgeführt werden. FTP Number of Retry Legt die Anzahl der Wiederholungen für die Herstellung einer 0 FTP-Verbindung fest, wenn der erste Versuch fehlschlägt. FTP Retry Interval Legt das Wiederholungsintervall in Millisekunden für die Her 1000 stellung einer FTP-Verbindung fest. Global_DOP Legt den Parallelitätsgrad für alle Datenflüsse fest, die von ei 2 nem Jobserver ausgeführt werden. Sie können den Parallelitätsgrad für einzelne Datenflüsse auch über das Fens ter „Eigenschaften“ jedes Datenflusses festlegen. Wenn der Wert für Parallelitätsgrad eines Datenflusses 0 beträgt, ver wendet der Jobserver den Wert Global_DOP. Der Jobserver verwendet den Wert für Parallelitätsgrad eines Datenflusses, wenn er ungleich null ist, da dieser den Global_DOP-Wert au ßer Kraft setzt. Ignore Reduced Msg Type (Für SAP-Anwendungen) Deaktiviert die Verarbeitung redu FALSE zierter Meldungen des Typs IDoc für alle Meldungstypen, für die der Wert auf TRUE gesetzt ist. Ignore Reduced Msg (Für SAP-Anwendung) Deaktiviert die Verarbeitung reduzier Type_foo ter Meldungen des Typs IDoc für einen bestimmten Meldungs FALSE typ (wie <foo>), wenn der Wert auf TRUE gesetzt ist. OCI Server Attach Retry Die Engine ruft bei jeder Herstellung einer Verbindung mit 3 Oracle die Oracle-Funktion OCIServerAttach auf. Wenn die Engine diese Funktion zu schnell aufruft (beispielsweise bei der Verarbeitung paralleler Datenflüsse), kann die Funk tion fehlschlagen. Erhöhen Sie den Wiederholungswert auf 5, um dies zu vermeiden. Designer-Handbuch Ausführen von Jobs PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 321 Option Optionsbeschreibung Standardwert Splitter Optimization Die Software kann blockiert werden, wenn Sie einen Job anle FALSE gen, in dem eine Dateiquelle in zwei Abfragen fließt. Wird diese Option auf TRUE gesetzt, legt die Engine intern zwei Quelldateien an, die in die beiden Abfragen fließen, anstelle ei nes Splitters, der in beide Abfragen fließt. Use Explicit Database Links Jobs mit importierten Datenbankverknüpfungen weisen nor TRUE malerweise eine höhere Leistung auf, da die Software diese Verknüpfungen verwendet, um Verarbeitungsoperationen an eine Datenbank weiterzugeben. Wenn Sie diese Option auf FALSE setzen, verwenden die Datenflüsse keine verknüpften Datastores. Die Verwendung verknüpfter Datastores kann auch über das Eigenschaftenfenster für jeden Datenfluss deaktiviert werden. Die Option auf der Datenflussebene hat Vorrang gegenüber der Option auf der Jobserverebene. Use Domain Name Fügt einem Jobservernamen im Repository einen Domänen TRUE namen hinzu. Dadurch wird ein vollständig qualifizierter Ser vername angelegt, mit dem der Designer einen Jobserver in einer anderen Domäne lokalisieren kann. Wenn der vollständig qualifizierte Hostname (einschließlich Domäne) nicht ordnungsgemäß gespeichert wird, können bei der Verbindung zwischen dem Designer oder dem Jobserver und dem Repository Fehler auftreten. Wenn dieses Problem auftritt, ändern Sie diese Option in FALSE, bevor Sie Reposito rys hinzufügen. Weitere Informationen Performance Optimization Guide: Using parallel Execution, Degree of parallelism Performance Optimization Guide: Maximizing Push-Down Operations, Database link support for push-down operations across datastores 15.5.1 Ändern von Optionswerten für einen einzelnen Jobserver 1. Wählen Sie den Jobserver aus, mit dem Sie arbeiten wollen, indem Sie ihn als Standardjobserver definieren. a. Wählen Sie Tools Optionen Designer Umgebung . b. Wählen Sie einen Jobserver im Abschnitt Standardjobserver aus. 322 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Ausführen von Jobs c. Klicken Sie auf OK. 2. Wählen Sie Tools Optionen Jobserver Allgemein . 3. Wählen Sie die gewünschten Abschnitte und Schlüssel in der folgenden Liste der Wertpaare aus: Tabelle 102: Abschnitt Schlüssel int AdapterDataExchangeTimeout int AdapterStartTimeout AL_JobServer AL_JobServerLoadBalanceDebug AL_JobServer AL_JobServerLoadOSPolling string DisplayDIInternalJobs AL_Engine FTPNumberOfRetry AL_Engine FTPRetryInterval AL_Engine Global_DOP AL_Engine IgnoreReducedMsgType AL_Engine IgnoreReducedMsgType_foo AL_Engine OCIServerAttach_Retry AL_Engine SPLITTER_OPTIMIZATION AL_Engine UseExplicitDatabaseLinks Repository UseDomainName 4. Geben Sie einen Wert ein. Geben Sie z.B. Folgendes ein, um den Standardwert für die Anzahl der erneuten Versuche zu ändern, die ein Jobserver unternimmt, um eine FTP-Verbindung herzustellen, wenn der erste Versuch fehlschlägt. Designer-Handbuch Ausführen von Jobs PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 323 Tabelle 103: Option Beispielwert Abschnitt AL_Engine Schlüssel FTPNumberOfRetry Wert 2 Mit diesen Einstellungen wird der Standardwert für die Option FTPNumberOfRetry von null in zwei geändert. 5. Zum Speichern der Einstellungen und Schließen des Fensters "Optionen" klicken Sie auf OK. 6. Wählen Sie bei Bedarf erneut einen Standardjobserver aus, indem Sie Schritt 1 wiederholen. 15.5.2 Verwenden zugeordneter Laufwerksnamen in einem Pfad Die Software unterstützt nur UNC-Pfade (Universal Naming Convention) zu Verzeichnissen. Wenn Sie einen Pfad zu einem zugeordneten Laufwerk einrichten, wird dieses zugeordnete Laufwerk in den entsprechenden UNC-Pfad konvertiert. Um sicherzustellen, dass das von Ihnen zugeordnete Laufwerk nicht in den UNC-Pfad zurückkonvertiert wird, müssen Sie den Laufwerksnamen im Fenster Optionen des Designers hinzufügen. 1. Wählen Sie Extras Optionen . 2. Klappen Sie im Fenster Optionen die Option Jobserver auf, und wählen Sie dann Allgemein aus. 3. Geben Sie in das Bearbeitungsfeld Bereich den Text MappedNetworkDrives ein. 4. Geben Sie in das Bearbeitungsfeld Schlüssel den Text LokalesLaufwerk1 ein, um ein lokales Laufwerk zuzuordnen, oder RemoteLaufwerk1, um ein Remote-Laufwerk zuzuordnen. 5. Geben Sie in das Bearbeitungsfeld Wert einen Laufwerksbuchstaben ein, beispielsweise M:\ für ein lokales Laufwerk oder \\<Rechnername>>\<Freigabename> für ein Remote-Laufwerk. 6. Klicken Sie auf "OK", um das Fenster zu schließen. Wenn Sie ein weiteres zugeordnetes Laufwerk hinzufügen möchten, müssen Sie das Fenster Optionen schließen und die Eingabe wiederholen. Stellen Sie sicher, dass jeder Eintrag in das Bearbeitungsfeld Schlüssel ein eindeutiger Name ist. 324 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Ausführen von Jobs 16 Datenbewertung Bei sich häufig ändernden Betriebssystemen wird die Datenqualitätskontrolle bei Extraktions-, Transformationsund Ladejobs (ETL) schwierig. Der Designer ist mit Datenqualitätskontrollfunktionen ausgestattet, die als Firewall dienen, um Fehler in Ihren Daten zu ermitteln und zu beheben. Mithilfe dieser Funktionen können Sie sicherstellen, dass Sie vertrauenswürdige Informationen haben. Der Designer ist mit folgenden Funktionen ausgestattet, anhand derer Sie die Qualität und Struktur Ihrer Quelldaten ermitteln und verbessern können: Tabelle 104: Funktion Beschreibung Daten-Profiler Der Daten-Profiler wird verwendet, um Folgendes zu ermitteln: ● Die Qualität der Quelldaten vor der Extraktion. Der Daten-Profiler kann Unregelmäßigkeiten in den Quelldaten ermitteln, so dass Sie in der Vali dation-Transformation, der Data-Quality-Transformation oder anderen Transformationen Korrekturmaßnahmen definieren können. ● Die Verteilung, Beziehung und Struktur Ihrer Quelldaten, um den Aufbau Ihrer Jobs und Datenflüsse sowie Ihres Ziel-Data-Warehouse zu optimie ren. ● Den Inhalt Ihrer Quell- und Zieldaten, so dass Sie überprüfen können, ob Ihre Datenextraktionsjobs die erwarteten Ergebnisse zurückgeben. Daten anzeigen Mit der Funktion "Daten anzeigen" können Sie Folgendes tun: ● Die Quelldaten vor der Ausführung eines Jobs anzeigen, um Jobent würfe von besserer Qualität anzulegen. ● Vergleichen von Beispieldaten aus verschiedenen Schritten Ihres Jobs, um sicherzustellen, dass mit Ihrem Datenextraktionsjob die von Ihnen gewünschten Ergebnisse erzielt werden. Entwurfszeit-Daten-Viewer Verwenden Sie die Funktion "Entwurfszeit-Daten-Viewer" zum Anzeigen und Analysieren der Eingabe und Ausgabe für einen Datensatz in Echtzeit beim Entwurf einer Transformation sogar bevor der Datenfluss fertig gestellt oder gültig ist. Validation-Transformation Mit der Validation-Transformation können Sie Folgendes tun: ● Sicherstellen, dass die Quelldaten den Business-Regeln entsprechen. ● Entsprechende Maßnahmen ergreifen, falls die Daten die Geschäftsre geln nicht erfüllen. Auditdatenfluss Mit der Funktion für Datenfluss-Audits können Sie Folgendes tun: ● Regeln definieren, mit denen ermittelt wird, ob eine Quelle, eine Trans formation oder ein Zielobjekt die richtigen Daten enthält. ● Maßnahmen festlegen, die ergriffen werden sollen, wenn eine Auditregel fehlschlägt. Designer-Handbuch Datenbewertung PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 325 Funktion Beschreibung Data-Quality-Transformationen Data-Quality-Transformationen zur Verbesserung der Datenqualität verwen den. Datenvalidierungs-Dashboards Mit den Datenvalidierungs-Dashboards im Metadaten-Reporting-Tool kön nen Sie die Zuverlässigkeit Ihrer Zieldaten basierend auf den in Ihren BatchJobs angelegten Validierungsregeln bewerten. Dieses Feedback ermöglicht Geschäftsbenutzern, potenzielle Inkonsistenzen oder Fehler in Quelldaten schnell zu überprüfen, zu bewerten und zu kennzeichnen. Weitere Informationen Verwenden des Daten-Profilers [Seite 326] Verwenden von "Daten anzeigen" zur Ermittlung der Datenqualität [Seite 343] Verwenden des Entwurfszeit-Daten-Viewers [Seite 624] Verwenden der Validation-Transformation [Seite 345] Verwenden von Audits [Seite 348] Überblick über die Datenqualität [Seite 361] Management-Console-Handbuch: Datenvalidierungs-Dashboard-Berichte 16.1 Verwenden des Daten-Profilers Der Daten-Profiler wird auf einem Profiler-Server ausgeführt, um die folgenden Daten-Profiler-Informationen bereitzustellen, die mehrere Benutzer anzeigen können: Tabelle 105: Analyse Beschreibung Spaltenanalyse Der Daten-Profiler stellt zwei Typen von Spaltenprofilen zur Verfügung: ● Basisprofil – Diese Informationen umfassen Mindestwert, Maximalwert, Durch schnittswert, Mindest- und Maximallänge der Zeichenfolge. ● Detailliertes Profil – Die detaillierte Spaltenanalyse umfasst Anzahl der eindeuti gen Werte, Prozentsatz der eindeutigen Werte, Medianwert, Medianwert der Zei chenfolgenlänge, Anzahl der Muster und Prozentsatz der Muster. Beziehungsanalyse 326 Diesen Informationen können Sie Datenkonflikte zwischen zwei beliebigen Spalten ent nehmen, für die Sie eine Beziehung definieren. Dazu gehören auch Spalten, für die eine Primärschlüssel-Fremdschlüssel-Beziehung vorhanden ist. Sie können zwei Stufen von Daten speichern: ● Die Daten nur in den Spalten speichern, die Sie für die Beziehung auswählen. ● Die Werte in allen Spalten in jeder Zeile speichern. PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenbewertung 16.1.1 Analysierbare Datenquellen Sie können den Daten-Profiler für Daten aus den folgenden Quellen ausführen. In den Versionshinweisen finden Sie die vollständige Liste der Quellen, die vom Daten-Profiler unterstützt werden. Tabelle 106: Quelle Umfasst Datenbanken Anwendungen Flatfiles 16.1.2 ● Attunity Connector für Großrechner-Datenbanken ● DB2 ● Oracle ● SQL Server ● SAP Sybase IQ ● SAP Sybase SQL Anywhere ● Teradata ● JDE One World ● JDE World ● Oracle Applications ● PeopleSoft ● SAP Applications ● SAP NetWeaver Business Warehouse ● Siebel Beispiele: Nur Text, Binärdatei, durch Komma getrennte Werte und durch Trennzeichen getrennte Werte. Herstellen einer Verbindung mit dem Profiler-Server Sie müssen zuerst den Profiler-Server installieren und konfigurieren, bevor Sie den Daten-Profiler verwenden können. Der Designer muss eine Verbindung zum Profiler-Server herstellen, um den Daten-Profiler ausführen und die Profiler-Ergebnisse anzeigen zu können. Sie geben diese Verbindungsinformationen im Fenster "Anmeldung am Profiler-Server" ein. 1. Das Fenster "Anmeldung am Profiler-Server" kann wie folgt aufgerufen werden: ○ Wählen Sie im Symbolleistenmenü Tools Anmeldung am Profiler-Server . ○ Doppelklicken Sie auf der unteren Statusleiste auf das Profiler-Server-Symbol rechts neben dem Jobserver-Symbol. 2. Geben Sie die Benutzeranmeldedaten für den CMS ein. Option Bezeichnung System Geben Sie den Servernamen und optional den Port für den CMS ein. Benutzername Geben Sie den für die Anmeldung am CMS zu verwendenden Benutzernamen ein. Kennwort Geben Sie das für die Anmeldung am CMS zu verwendende Kennwort ein. Authentifizierung Geben Sie den vom CMS verwendeten Authentifizierungstyp an. Designer-Handbuch Datenbewertung PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 327 3. Klicken Sie auf Anmelden. Es wird versucht, mit den angegebenen Informationen eine Verbindung zum CMS herzustellen. Nach einer erfolgreichen Anmeldung wird die Liste der verfügbaren Profiler-Repositorys angezeigt. 4. Wählen Sie das zu verwendende Repository aus. 5. Klicken Sie auf OK, um mit dem ausgewählten Repository eine Verbindung herzustellen. Bei erfolgreicher Anmeldung am Profiler-Server, wird auf dem Profiler-Server-Symbol in der unteren Statusleiste kein rotes X mehr angezeigt. Wenn Sie den Mauszeiger über das Symbol bewegen zeigt die Statusleiste außerdem den Speicherort des Profiler-Servers an. Weitere Informationen Management-Console-Handbuch: Profiler-Server-Verwaltung Administratorhandbuch: Benutzer- und Rechteverwaltung 16.1.3 Profiler-Statistiken 16.1.3.1 Spalten-Profiling Sie können Statistiken für eine oder mehrere Spalten generieren. Die Spalten können alle aus derselben Datenquelle oder aus mehreren Datenquellen stammen. Wenn Sie Statistiken für mehrere Quellen in einer Profiler-Aufgabe generieren, müssen sich alle Quellen in demselben Datastore befinden. Weitere Informationen Einfaches Profiling [Seite 328] Detailliertes Profiling [Seite 329] Beispiele [Seite 330] Anzeigen der vom Daten-Profiler generierten Spaltenattribute [Seite 338] Senden von Spalten-Profiler-Aufgaben [Seite 332] 16.1.3.1.1 Einfaches Profiling Standardmäßig generiert der Daten-Profiler folgende einfache Profiler-Attribute für jede von Ihnen ausgewählte Spalte. Die folgende Tabelle beschreibt die einfachen Profiler-Attribute für jedes Attribut. 328 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenbewertung Tabelle 107: Einfaches Attribut Beschreibung Min. Der niedrigste aller Werte in dieser Spalte. Min. Anzahl Anzahl an Zeilen, die diesen niedrigsten Wert in dieser Spalte enthalten. Max. Der höchste aller Werte in dieser Spalte. Max. Anzahl Anzahl an Zeilen, die diesen höchsten Wert in dieser Spalte enthalten. Durchschnitt Für numerische Spalten der Durchschnittswert in dieser Spalte. Min. Zeichenfolgenlänge Für Zeichenspalten die Länge des niedrigsten Zeichenfolgenwerts in dieser Spalte. Max. Zeichenfolgenlänge Für Zeichenspalten die Länge des höchsten Zeichenfolgenwerts in dieser Spalte. Durchschnittliche Zeichen folgenlänge Für Zeichenspalten die durchschnittliche Länge der Zeichenfolgenwerte in dieser Spalte. NULL-Werte Anzahl an NULL-Werten in dieser Spalte. NULL-Werte % Prozentsatz der Zeilen, die einen NULL-Wert in dieser Spalte enthalten. Nullen Anzahl an 0-Werten in dieser Spalte. Nullen % Prozentsatz der Zeilen, die einen 0-Wert in dieser Spalte enthalten. Leerstellen Für Zeichenspalten die Anzahl an Zeilen, die eine Leerstelle in dieser Spalte enthalten. Leerstellen % Prozentsatz der Zeilen, die eine Leerstelle in dieser Spalte enthalten. 16.1.3.1.2 Detailliertes Profiling Da die Generierung detaillierter Attribute mehr Zeit und Computerressourcen beansprucht, sollte sie für spezifische Attribute verwendet werden. Sie können zusätzlich zu obigen Attributen weitere detaillierte Attribute generieren, doch für die Generierung detaillierter Attribute ist ein höherer Zeit- und Rechnerressourcenbedarf erforderlich. Daher wird empfohlen, das detaillierte Profiling nur dann auszuwählen, wenn folgende Attribute benötigt werden: Tabelle 108: Detailliertes Attribut Beschreibung Medianwert Der Wert, der sich in der mittleren Zeile der Quelltabelle befindet. Medianwert Zeichenfolgen länge Für Zeichenspalten der Wert, der sich in der mittleren Zeile der Quelltabelle befindet. Eindeutige Werte Anzahl eindeutiger Werte in dieser Spalte. Eindeutige Werte % Prozentsatz der Zeilen, die jeden eindeutigen Wert in dieser Spalte enthalten. Muster Anzahl der verschiedenen Muster in dieser Spalte. Muster % Prozentsatz der Zeilen, die ein Muster in dieser Spalte enthalten. Designer-Handbuch Datenbewertung PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 329 16.1.3.1.3 Beispiele Beispiele für die Verwendung von Spaltenprofilstatistiken zur Verbesserung der Datenqualität Sie können die Spaltenprofilattribute für verschiedene Aufgaben verwenden, einschließlich der folgenden: ● Abrufen einfacher Statistiken, Häufigkeiten, Bereiche und Ausreißer. Diese Profilstatistiken zeigen beispielsweise an, dass ein Spaltenwert bedeutend höher als die anderen Werte in einer Datenquelle ist. Anschließend können Sie sich dazu entscheiden, eine Validation-Transformation zu definieren, um ein Kennzeichen in einer anderen Tabelle zu setzen, wenn Sie diesen Ausreißer in die Zieltabelle laden. ● Identifizieren von Variationen desselben Inhalts. Beispielsweise ist die Teilenummer in einer Datenquelle möglicherweise ein Integer-Datentyp und in einer anderen Datenquelle ein Varchar-Datentyp. Anschließend können Sie festlegen, welchen Datentyp Sie in Ihrem Ziel-Data-Warehouse verwenden möchten. ● Ermitteln von Datenmustern und -formaten. Beispielsweise zeigen die Profilstatistiken an, dass die Telefonnummer verschiedene Formate aufweist. Mit diesen Profilinformationen können Sie sich ggf. dazu entschließen, eine Validation-Transformation zu definieren, so dass immer dasselbe Zielformat verwendet wird. ● Analysieren des numerischen Bereichs. Beispielsweise hat die Kundennummer möglicherweise in einer Quelle einen Bereich von Nummern und einen anderen Bereich in einer anderen Quelle. Für das Ziel ist ein Datentyp erforderlich, der den maximalen Bereich erfüllen kann. ● Identifizieren fehlender Informationen, Nullen und Leerstellen im Quellsystem. Beispielsweise wird in den Profilstatistiken angezeigt, dass für die Faxnummer Nullen vorkommen. Nun können Sie eine ValidationTransformation definieren, um den Nullwert in der Zieltabelle durch ein Wort, wie z.B. „Unbekannt“, zu ersetzen. 16.1.3.2 Beziehungsprofil Das Beziehungs-Profiling zeigt den Prozentsatz der nicht übereinstimmenden Werte in Spalten von zwei Quellen. Dabei kann es sich um folgende Quellen handeln: ● Tabellen ● Flatfiles ● Kombination aus Tabelle und Flatfile Die Schlüsselspalten können eine definierte Beziehung aus Primärschlüssel und Fremdschlüssel aufweisen oder nicht miteinander in Beziehung stehen (beispielsweise wenn einer von einem Datastore stammt und der andere von einem Dateiformat). Sie haben die Auswahl aus zwei Beziehungsprofilebenen, um Folgendes zu speichern: 330 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenbewertung Tabelle 109: Option Beschreibung Nur Schlüsselspaltendaten speichern Standardmäßig speichert der Daten-Profiler die Daten nur in den Spalten, die Sie für die Beziehung auswählen. Hinweis Die Ebene "Nur Schlüsselspaltendaten speichern" steht nicht zur Verfügung, wenn Oracle-Datastores verwendet werden. Alle Spaltendaten speichern Sie können die Werte in den anderen Spalten in jeder Zeile speichern. Diese Verarbeitung dauert jedoch länger und ver braucht mehr Rechnerressourcen. Wenn Sie die Ergebnisse des Beziehungsprofils anzeigen, können Sie einen Drill-Down ausführen, um die nicht übereinstimmenden Istdaten anzuzeigen. Das Beziehungsprofil kann Sie bei der Ausführung verschiedener Aufgaben unterstützen, einschließlich folgender Aufgaben: ● Fehlende Daten im Quellsystem identifizieren. Eine Datenquelle kann beispielsweise die Region beinhalten, eine andere hingegen nicht. ● Redundante Daten in mehreren Datenquellen identifizieren. Zwischen zwei Quellen können beispielsweise doppelte Namen und Adressen vorhanden sein, oder eine Adresse in einer Quelle hat möglicherweise keinen Namen. ● Beziehungen zwischen Datenquellen validieren. Zwei verschiedene Problemverfolgungssysteme umfassen beispielsweise eine Teilmenge häufig auftretender, vom Kunden gemeldeter Probleme, manche Probleme kommen hingegen nur in dem einen oder anderen System vor. Weitere Informationen Senden von Beziehungs-Profiler-Aufgaben [Seite 334] Anzeigen der Profiler-Ergebnisse [Seite 338] 16.1.4 Ausführen von Profiler-Aufgaben Mit dem Daten-Profiler können Sie Profiler-Statistiken für die von Ihnen ausgewählte Gruppe von Spalten aufstellen. Hinweis Diese optionale Funktion steht nicht für Spalten mit verschachtelten Schemas und den Datentypen LONG oder TEXT zur Verfügung. Sie können keine Spalten-Profiler-Aufgabe mit einer Beziehungs-Profiler-Aufgabe ausführen. Designer-Handbuch Datenbewertung PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 331 16.1.4.1 Senden von Spalten-Profiler-Aufgaben 1. In der Objektbibliothek von Designer können Sie entweder eine Tabelle oder eine Flatfile auswählen. Wechseln Sie für eine Tabelle zum Tab Datastores, und wählen Sie eine Tabelle aus. Wenn Sie alle Tabellen innerhalb eines Datastores analysieren möchten, wählen Sie den Namen des Datastores aus. Um eine Teilmenge der Tabellen auf dem Tab Datastores auszuwählen, halten Sie beim Auswählen der einzelnen Tabellen die Strg-Taste gedrückt. Wechseln Sie für ein Flatfile zum Tab Formate, und wählen Sie eine Datei aus. 2. Nachdem Sie die Datenquelle ausgewählt haben, können Sie auf eine der folgenden Arten Spaltenprofilstatistiken anlegen: ○ Klicken Sie mit der rechten Maustaste, und wählen Sie Anforderung für Spalten-Profiling senden aus. Bei einigen der Profilstatistiken kann die Berechnung sehr viel Zeit in Anspruch nehmen. Wählen Sie diese Methode aus, damit die Profiling-Aufgabe asynchron ausgeführt wird und Sie zeitgleich andere DesignerAufgaben ausführen können. Außerdem können bei dieser Methode mehrere Quellen in einer Profiler-Aufgabe analysiert werden. ○ Klicken Sie mit der rechten Maustaste, und wählen Sie Daten anzeigen aus. Klicken Sie auf den Tab Profiling und dann auf Aktualisieren. Mit dieser Option wird eine synchrone Profiling-Aufgabe gesendet, und Sie müssen warten, bis die Aufgabe abgeschlossen ist, bevor Sie andere Aufgaben im Designer ausführen können. Diese Option kann nützlich sein, wenn Sie bereits das Fenster Daten anzeigen aufgerufen haben und feststellen, dass entweder die Profilstatistiken noch nicht generiert wurden oder die Daten, mit denen die Profilstatistiken angelegt wurden, älter als gewünscht sind. 3. (Optional) Bearbeiten Sie den Namen der Profiler-Aufgabe. Der Daten-Profiler generiert einen Standardnamen für jede Profiler-Aufgabe. Sie können den Aufgabennamen bearbeiten, um einen aussagekräftigeren oder einen eindeutigen Namen anzulegen oder um Bindestriche zu entfernen, die zwar in Spaltennamen, nicht aber in Aufgabennamen zulässig sind. Wenn Sie nur eine Quelle auswählen, muss der Standardname folgendes Format haben: <Benutzername_t_Quellenname> Wenn Sie mehrere Quellen auswählen, hat der Standardname folgendes Format: <Benutzername_t_NameDerErstenQuelle_NameDerLetztenQuelle> Tabelle 110: Spalte Beschreibung Benutzername Name des Benutzers, der verwendet wird, um auf Systemdienste zuzugreifen. t Profiltyp. Der Wert ist C für ein Spaltenprofil, das für jede ausgewählte Spalte Attribute (wie niedriger Wert und hoher Wert) abruft. NameDerErstenQuelle Name der ersten Quelle in alphabetischer Reihenfolge. NameDerLetztenQuelle Name der letzten Quelle in alphabetischer Reihenfolge, wenn Sie mehrere Quellen auswäh len. 4. Wenn Sie nur eine Quelle auswählen, werden im Fenster Anforderung für Spalten-Profiling senden die Spaltenund Datentypen aufgelistet. Behalten Sie das Häkchen vor allen Spalten bei, die analysiert werden sollen. Entfernen Sie das Häkchen vor allen Spalten, die nicht analysiert werden sollen. 332 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenbewertung Alternativ können Sie am oberen Rand auf das Kontrollkästchen vor Name klicken, um die Auswahl aller Spalten aufzuheben und anschließend die gewünschten Kontrollkästchen zu aktivieren. 5. Wenn Sie mehrere Quellen ausgewählt haben, werden im Fenster Anforderung für Spalten-Profiling senden die Quellen auf der linken Seite aufgelistet. a. Wählen Sie eine Datenquelle aus, um ihre Spalten auf der rechten Seite anzuzeigen. b. Wählen Sie auf der rechten Seite des Fensters Anforderung für Spalten-Profiling senden alle Spalten aus, die analysiert werden sollen. Heben Sie die Auswahl bei allen Spalten auf, die Sie nicht analysieren möchten. Alternativ können Sie am oberen Rand auf das Kontrollkästchen vor "Name" klicken, um die Auswahl aller Spalten aufzuheben und anschließend die Kontrollkästchen für die zu analysierenden Spalten zu aktivieren. c. Wiederholen Sie die Schritte 1 und 2 für alle Datenquellen. 6. (Optional) Wählen Sie Detailliertes Profiling für eine Spalte aus. Hinweis Der Daten-Profiler hat bei der Anlage detaillierter Profilstatistiken einen hohen Ressourcenbedarf. Wählen Sie "Detailliertes Profiling" nur dann aus, wenn Sie die folgenden Attribute benötigen: Anzahl eindeutiger Werte, eindeutiger Prozentwert, Median, Medianwert Zeichenfolgenlänge, Muster, Musteranzahl. Wenn Sie "Detailliertes Profiling" auswählen, müssen Sie ein Verzeichnis für den auslagerbaren Cache angeben, das ausreichend freien Speicherplatz für die von Ihnen analysierte Datenmenge bietet. Wenn die detaillierten Attribute für alle Spalten in allen Quellen aufgelistet werden sollen, klicken Sie auf Detailliertes Profiling, und wählen Sie für alle Spalten aller Quellen Anwenden aus. Wenn Sie das detaillierte Profiling für alle Spalten entfernen möchten, klicken Sie auf Detailliertes Profiling, und wählen Sie für alle Spalten aller Quellen Entfernen aus. 7. Klicken Sie auf Senden, um die Profiling-Aufgabe auszuführen. Hinweis Wenn sich die Metadaten der Tabelle seit dem Import geändert haben (beispielsweise beim Hinzufügen einer neuen Spalte), müssen Sie die Quelltabelle vor der Ausführung der Profiling-Aufgabe erneut importieren. Wenn Sie auf die Option Anforderung für Spalten-Profiling senden geklickt haben, um das Fenster Anforderung für Spalten-Profiling senden aufzurufen, wird automatisch der Überwachungsbereich „Profiler“ angezeigt, wenn Sie auf Senden klicken. Wenn Sie auf Aktualisieren auf dem Tab Profiling des Fensters Daten anzeigen geklickt haben, wird das Überwachungsfenster Profiler nicht angezeigt, wenn Sie auf Senden klicken. Stattdessen wird asynchron eine Profiling-Aufgabe gesendet und Sie müssen warten, bis die Aufgabe abgeschlossen ist, bevor Sie andere Aufgaben im Designer ausführen können. Sie können ferner die Profiling-Aufgabe anhand des Namens im Administrator überwachen. 8. Wenn die Profiling-Aufgabe abgeschlossen ist, können Sie mit der Option Daten anzeigen die ProfilingErgebnisse anzeigen. Designer-Handbuch Datenbewertung PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 333 Weitere Informationen Spalten-Profiling [Seite 328] Überwachen der Profiler-Aufgaben mit dem Designer [Seite 336] Anzeigen der Profiler-Ergebnisse [Seite 338] Administratorhandbuch: Konfigurieren von Laufzeitressourcen Management-Console-Handbuch: Überwachen von Profiling-Aufgaben mit dem Administrator 16.1.4.2 Senden von Beziehungs-Profiler-Aufgaben Ein Beziehungs-Profiling zeigt den Prozentsatz nicht übereinstimmender Werte in Spalten von zwei Quellen an. Dabei kann es sich um folgende Quellen handeln: ● Tabellen ● Flatfiles ● Kombination aus Tabelle und Flatfile Die Spalten können über einen Primärschlüssel und einen Fremdschlüssel verfügen oder nicht in Beziehung stehen (wenn beispielsweise eine Spalte aus einem Datastore und die andere aus einem Dateiformat stammt). Die beiden Spalten müssen nicht denselben Datentyp aufweisen, sie müssen jedoch konvertierbar sein. Wenn Sie beispielsweise eine Beziehungs-Profiler-Aufgabe für eine INTEGER-Spalte und eine VARCHAR-Spalte ausführen, konvertiert der Daten-Profiler zur Durchführung des Vergleichs den INTEGER-Wert in einen VARCHAR-Wert. Hinweis Der Daten-Profiler beansprucht beim Generieren von Beziehungswerten viele Ressourcen. Wenn Sie beabsichtigen, das Beziehungs-Profiling zu verwenden, müssen Sie ein auslagerbares Cacheverzeichnis angeben, das für die Menge der zu analysierenden Daten über ausreichend Speicherplatz verfügt. Weitere Informationen Analysierbare Datenquellen [Seite 327] Administratorhandbuch: Servermanager, Verwenden des Servermanagers unter Windows, Konfigurieren von Laufzeitressourcen 16.1.4.2.1 Generieren eines Beziehungs-Profilings für Spalten in zwei Quellen 1. Wählen Sie in der Designer-Objektbibliothek zwei Quellen aus. So wählen Sie zwei Quellen in demselben Datastore bzw. Dateiformat aus: 334 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenbewertung a. Öffnen Sie in der Objektbibliothek den Tab Datastore oder Format. b. Drücken Sie die Strg-Taste, und wählen Sie gleichzeitig die zweite Tabelle aus. c. Klicken Sie mit der rechten Maustaste, und wählen Sie Anforderung für Beziehungs-Profiling senden. So wählen Sie zwei Quellen aus verschiedenen Datastores bzw. Dateien aus: a. Öffnen Sie in der Objektbibliothek den Tab Datastore oder Format. b. Klicken Sie mit der rechten Maustaste auf die erste Quelle, und wählen Sie Profiling senden Anforderung für Beziehungs- Beziehung mit . c. Navigieren Sie zu einem anderen Datastore oder Format in der Objektbibliothek. d. Klicken Sie auf die zweite Quelle. Daraufhin wird das Fenster Anforderung für Beziehungs-Profiling senden angezeigt. Hinweis Sie können kein Beziehungs-Profiling für Spalten mit dem Datentyp LONG oder TEXT anlegen. 2. (Optional) Bearbeiten Sie den Namen der Profiler-Aufgabe. Sie können den Namen der Aufgabe bearbeiten, um einen aussagekräftigeren bzw. eindeutigen Namen anzulegen oder um Bindestriche zu entfernen, die zwar in Spaltennamen, aber nicht in Aufgabennamen zulässig sind. Der Standardname, den der Daten-Profiler für mehrere Quellen erzeugt, weist folgendes Format auf: <benutzername>_<t>_<nameerstequelle>_<nameletztequelle> Tabelle 111: Spalte Beschreibung Benutzername Name des Benutzers, der verwendet wird, um auf Systemdienste zuzugreifen. t Profiltyp. Bei einem Beziehungs-Profiling, das in den beiden ausgewählten Spalten nicht über einstimmende Werte erhält, lautet der Wert R. NameDerErstenQuelle Name der ersten ausgewählten Quelle. NameDerLetztenQuelle Name der letzten ausgewählten Quelle. 3. Standardmäßig wird im oberen Bereich des Fensters Anforderung für Beziehungs-Profiling senden zwischen der Spalte mit dem Primärschlüssel und der Spalte mit dem Fremdschlüssel der beiden Quellen eine Zeile angezeigt, wenn die Beziehung besteht. Sie können die Spalte in "Profiling" ändern. In der unteren Hälfte des Fensters Anforderung für Beziehungs-Profiling senden wird angezeigt, dass bei der Profiler-Aufgabe zum Vergleichen der beiden Spalten die Ist-gleich-Operation (=) verwendet wird. Der DatenProfiler legt fest, welche Werte nicht gleich sind, und berechnet den Prozentsatz nicht übereinstimmender Werte. 4. Um eine bestehende Beziehung zwischen zwei Spalten zu löschen, wählen Sie die betreffende Zeile, klicken Sie mit der rechten Maustaste, und wählen Sie dann die Option Ausgewählte Beziehung löschen aus. Um alle bestehenden Beziehungen zwischen den beiden Quellen zu löschen, haben Sie zwei Möglichkeiten: ○ Klicken Sie mit der rechten Maustaste in den oberen Fensterbereich, und klicken Sie dann auf Alle Beziehungen löschen. ○ Klicken Sie unten im Fenster Anforderung für Beziehungs-Profiling senden auf die Option Alle Beziehungen löschen. Designer-Handbuch Datenbewertung PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 335 5. Wenn zwischen den beiden Datenquellen keine Primärschlüssel- und Fremdschlüsselbeziehung besteht, geben Sie die zu analysierenden Spalten an. Sie können die Größe jeder Datenquelle so ändern, dass alle Spalten angezeigt werden. So können Sie die Spalten, für die Beziehungswerte angezeigt werden sollen, angeben oder ändern: a. Führen Sie den Cursor in die erste auszuwählende Spalte. Halten Sie die Maustaste gedrückt, und zeichnen Sie eine Linie zur anderen auszuwählenden Spalte. b. Wenn Sie alle Beziehungen gelöscht haben und der Daten-Profiler eine bestehende Primärschlüssel- und Fremdschlüsselbeziehung auswählen soll, klicken Sie entweder mit der rechten Maustaste in den oberen Fensterbereich und klicken dann auf Beziehung vorschlagen, oder klicken Sie unten im Fenster Anforderung für Beziehungs-Profiling senden auf die Option Beziehung vorschlagen. 6. Die Option Nur Schlüsselspaltendaten speichern ist standardmäßig ausgewählt. Diese Option weist darauf hin, dass der Daten-Profiler die Daten nur in den Spalten speichert, die Sie für die Beziehung auswählen. Wenn Sie das Beziehungs-Profiling aufrufen, werden in den anderen Spalten keine Beispieldaten angezeigt. Wenn Sie Werte in den anderen Spalten des Beziehungs-Profilings sehen möchten, wählen Sie die Option Alle Spaltendaten speichern. 7. Klicken Sie auf Senden, um die Profiler-Aufgabe auszuführen. Hinweis Wenn sich die Metadaten der Tabelle seit dem Import geändert haben (beispielsweise beim Hinzufügen einer neuen Spalte), müssen Sie die Quelltabelle vor der Ausführung der Profiling-Aufgabe erneut importieren. 8. Der Überwachungsbereich des Profiler wird automatisch angezeigt, wenn Sie auf Senden klicken. Sie können ferner die Profiling-Aufgabe anhand des Namens im Administrator überwachen. 9. Wenn die Profiler-Aufgabe abgeschlossen ist, können Sie die Profiling-Ergebnisse mit der Option Daten anzeigen aufrufen, wenn Sie mit der rechten Maustaste in der Objektbibliothek auf eine Tabelle klicken. Weitere Informationen Anzeigen der vom Daten-Profiler generierten Beziehungs-Profiling-Daten [Seite 341] Überwachen der Profiler-Aufgaben mit dem Designer [Seite 336] Anzeigen der Profiler-Ergebnisse [Seite 338] Management-Console-Handbuch: Überwachen von Profiler-Aufgaben mit dem Administrator 16.1.5 Überwachen der Profiler-Aufgaben mit dem Designer Das Profiler-Überwachungsfenster wird beim Senden einer Profiler-Aufgabe automatisch angezeigt, wenn Sie in die Menüleiste klicken, um das Überwachungsfenster Profiler anzuzeigen. Sie können diesen Überwachungsbereich im Designer verankern oder separat belassen. Im Profiler-Überwachungsbereich werden die derzeit ausgeführte Aufgabe und sämtliche Profiler-Aufgaben angezeigt, die innerhalb einer festgelegten Anzahl von Tagen ausgeführt wurden. 336 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenbewertung Die Symbole in der oberen linken Ecke der Profiler-Überwachung zeigen folgende Informationen an: ● Klicken Sie auf das Symbol Aktualisieren, um den Profiler-Überwachungsbereich zu aktualisieren und den aktuellen Status von Profiler-Aufgaben anzuzeigen. ● Klicken Sie auf das Symbol Informationen, um die Quellen anzuzeigen, für die die ausgewählte Aufgabe das Profiling durchführt. Wenn die Aufgabe fehlschlägt, zeigt das Fenster "Informationen" auch eine Fehlernachricht an. In der Profiler-Überwachung werden folgende Spalten angezeigt: Tabelle 112: Spalte Beschreibung Name Name der Profiler-Aufgabe, die vom Designer übertragen wurde. Wenn die Profiler-Aufgabe für eine einzelne Quelle ausgeführt wird, folgt der Standardname dem folgenden Format: <Benutzername_t_Quellenname> Wenn die Profiler-Aufgabe für mehrere Quellen ausgeführt wird, folgt der Standardname dem fol genden Format: <Benutzername_t_NameDerErstenQuelle_NameDerLetztenQuelle> Typ Status Der Typ der Profiler-Aufgabe kann folgender sein: ● Spalte ● Beziehung Der Status einer Profiler-Aufgabe kann folgender sein: ● Fertig – Die Aufgabe wurde erfolgreich abgeschlossen. ● Ausstehend – Die Aufgabe befindet sich in der Warteschlange, da die maximale Anzahl an gleichzeitigen Aufgaben erreicht wurde oder eine andere Aufgabe das Profiling für dieselbe Tabelle durchführt. ● Wird ausgeführt – Die Aufgabe wird gerade ausgeführt. ● Fehler – Die Aufgabe wurde mit einem Fehler beendet. Doppelklicken Sie auf den Wert in der Spalte "Status", um die Fehlermeldung anzuzeigen. Zeitstempel Datum und Uhrzeit der Profiler-Aufgabenausführung. Quellen Namen der Tabellen, für die Profiler-Aufgaben ausgeführt werden. Weitere Informationen Ausführen von Profiler-Aufgaben [Seite 331] Management-Console-Handbuch: Konfigurieren von Profiler-Aufgabenparametern Designer-Handbuch Datenbewertung PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 337 16.1.6 Anzeigen der Profiler-Ergebnisse Der Daten-Profiler berechnet und speichert die Profiler-Attribute in einem Profiler-Repository, das mehrere Benutzer anzeigen können. Weitere Informationen Anzeigen der vom Daten-Profiler generierten Spaltenattribute [Seite 338] Anzeigen der vom Daten-Profiler generierten Beziehungs-Profiling-Daten [Seite 341] 16.1.6.1 Anzeigen der vom Daten-Profiler generierten Spaltenattribute 1. Wählen Sie in der Objektbibliothek die Tabelle aus, für die die Profiler-Attribute angezeigt werden sollen. 2. Klicken Sie mit der rechten Maustaste, und wählen Sie Daten anzeigen aus. 3. Klicken Sie auf den (zweiten) Tab Profiling, um die Spalten-Profiling-Attribute anzuzeigen. a. Der Tab Profiling zeigt die Anzahl der physischen Datensätze an, die der Daten-Profiler verarbeitet hat, um die Werte in der Profiling-Tabelle zu generieren. b. Die Profiling-Tabelle enthält die Spaltennamen in den aktuellen Quell- und Profiling-Attributen für jede Spalte. Um die Profiling-Tabelle zu füllen, führen Sie eine Profiler-Aufgabe aus, oder wählen Sie die Namen in dieser Spalte aus und klicken auf Aktualisieren. c. Sie können die Werte in jeder Attributspalte sortieren, indem Sie auf den Spaltenkopf klicken. Der Wert in der Profiling-Tabelle zeigt an, dass ein Attribut nicht auf einen Datentyp anwendbar ist. Tabelle 113: 338 Profiling-Basisattri but Beschreibung Relevanter Datentyp Min. Der niedrigste aller Werte in dieser Spalte. Ja Ja Ja Min. Anzahl Anzahl an Zeilen, die diesen niedrigsten Wert in dieser Spalte enthalten. Ja Ja Ja Max. Der höchste aller Werte in dieser Spalte. Ja Ja Ja Max. Anzahl Anzahl an Zeilen, die diesen höchsten Wert in dieser Spalte enthalten. Ja Ja Ja Durchschnitt Für numerische Spalten der Durchschnittswert in dieser Spalte. - Ja - Min. Zeichenfolgen länge Für Zeichenspalten die Länge des niedrigsten Zeichenfol genwerts in dieser Spalte. Ja Nein Nein Max. Zeichenfolgen länge Für Zeichenspalten die Länge des höchsten Zeichenfol genwerts in dieser Spalte. Ja Nein Nein Character Numeric Datetime PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenbewertung Profiling-Basisattri but Beschreibung Relevanter Datentyp Durchschnittliche Zei chenfolgenlänge Für Zeichenspalten die durchschnittliche Länge der Zei chenfolgenwerte in dieser Spalte. Ja Nein Nein NULL-Werte Anzahl an NULL-Werten in dieser Spalte. Ja Ja Ja NULL-Werte % Prozentsatz der Zeilen, die einen NULL-Wert in dieser Ja Ja Ja Character Numeric Datetime Spalte enthalten. Nullen Anzahl an 0-Werten in dieser Spalte. Nein Ja Nein Nullen % Prozentsatz der Zeilen, die einen 0-Wert in dieser Spalte Nein Ja Nein enthalten. Leerstellen Für Zeichenspalten die Anzahl an Zeilen, die eine Leer stelle in dieser Spalte enthalten. Ja Nein Nein Leerstellen % Prozentsatz der Zeilen, die eine Leerstelle in dieser Spalte Ja enthalten. Nein Nein d. Wenn Sie die Option Detailliertes Profiling im Fenster Anforderung für Spalten-Profiling senden ausgewählt haben, werden im Tab Profiling außerdem die folgenden detaillierten Attributspalten angezeigt. Tabelle 114: Detailliertes ProfilingAttribut Beschreibung Relevanter Datentyp Eindeutige Werte Anzahl eindeutiger Werte in dieser Spalte. Ja Ja Ja Eindeutige Werte % Prozentsatz der Zeilen, die einen eindeutigen Wert in dieser Spalte enthalten. Ja Ja Ja Medianwert Der Wert, der sich in der mittleren Zeile der Quellta belle befindet. Ja Ja Ja Medianwert Zeichenfol genlänge Für Zeichenspalten der Wert, der sich in der mittleren Zeile der Quelltabelle befindet. Ja Nein Nein Muster % Prozentsatz der Zeilen, die jeden eindeutigen Wert in dieser Spalte enthalten. Das Format jedes eindeutigen Musters in dieser Spalte. Ja Nein Nein Muster Anzahl der verschiedenen Muster in dieser Spalte. Ja Nein Nein Zeichen Numerisch Datetime 4. Klicken Sie auf einen Attributwert, um die gesamte Zeile in der Quelltabelle anzuzeigen. Die untere Hälfte des Fenster Daten anzeigen zeigt die Zeilen an, die den Attributwert enthalten, auf den Sie geklickt haben. Sie können Spalten ausblenden, die nicht angezeigt werden sollen, indem Sie auf das Symbol "Spalten ein-/ ausblenden" klicken. Ihre ADRESS-Zielspalte enthält möglicherweise nur 45 Zeichen, aber die Profiling-Daten für diese Kundenquelltabelle zeigt an, dass die maximale Zeichenfolgelänge 46 ist. Klicken Sie auf den Wert 46, um die eigentlichen Daten anzuzeigen. Sie können die Breite der Spalte ändern, um die gesamte Zeichenfolge anzuzeigen. 5. (Optional) Klicken Sie auf Aktualisieren, wenn Sie die Profiling-Attribute aktualisieren möchten. Gründe für die Aktualisierung zu diesem Zeitpunkt sind: ○ Die Profiling-Attribute wurden noch nicht generiert. Designer-Handbuch Datenbewertung PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 339 ○ Das Datum, an dem die Profilattribute generiert wurden, liegt vor dem gewünschten Datum. Der Wert für „Letzte Aktualisierung“ unten links auf dem Tab Profiling ist der Zeitstempel, an dem die ProfilingAttribute zuletzt generiert wurden. Hinweis Über die Option "Aktualisieren" wird eine synchrone Profiler-Aufgabe gesendet, und Sie müssen warten, bis die Aufgabe abgeschlossen ist, bis Sie andere Aufgaben im Designer durchführen können. Das Fenster Anforderung für Spalten-Profiling senden wird angezeigt. Wählen Sie nur die Spaltennamen aus, die Sie für diese Profiling-Operation benötigen, da sich die Aktualisierungsberechnungen auf die Leistung auswirken. Sie können auch auf das Kontrollkästchen oben vor dem Namen klicken, um alle Spalten zu deaktivieren und anschließend die Kontrollkästchen vor jeder Spalte, für die ein Profiling angelegt werden soll, einzeln auswählen. 6. Klicken Sie entweder in "Eindeutige Werte" oder in "Muster" auf eine Statistik um den Prozentsatz jedes eindeutigen Werts oder Musterwerts in einer Spalte anzuzeigen. Die Musterwerte, die Anzahl der Datensätze für jeden Musterwert und die Prozentsätze werden auf der rechten Seite des Tabs Profiling angezeigt. Beispielsweise werden auf dem folgenden Tab Profiling für die Tabelle CUSTOMERS die Profilattribute für die Spalte REGION angezeigt. Das Attribut "Eindeutige Werte" für die Spalte REGION zeigt die Statistik 19, d.h. es gibt 19 eindeutige Werte für REGION. 7. Klicken Sie auf die Statistik in der Spalte "Eindeutige Werte", um jeden der 19 Werte sowie den Prozentsatz der Zeilen in der Tabelle CUSTOMERS anzuzeigen, die diesen Wert für die Spalte REGION enthalten. Außerdem zeigen die Balken in der rechten Spalte die relative Größe jedes Prozentsatzes. 8. Die Profiling-Daten auf der rechten Seite zeigen, dass ein sehr großer Prozentsatz von Werten für REGION Null ist. Klicken Sie entweder unterhalb von „Wert“ auf Null oder auf 60 unterhalb von „Records“, um die anderen Spalten in den Zeilen anzuzeigen, die einen NULL-Wert in der Spalte REGION aufweisen. 340 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenbewertung 9. Ihre Geschäftsregeln erfordern möglicherweise, dass REGION keine Nullwerte im Ziel-Data-Warehouse enthalten sollte. Daher müssen Sie sich bei der Definition einer Validation-Transformation entscheiden, durch welchen Wert Sie Nullwerte ersetzen möchten. Weitere Informationen Ausführen von Profiler-Aufgaben [Seite 331] Definieren einer Validierungsregel auf der Grundlage eines Spalten-Profilings [Seite 347] 16.1.6.2 Anzeigen der vom Daten-Profiler generierten Beziehungs-Profiling-Daten Beziehungs-Profiling-Daten zeigen den Prozentsatz der nicht übereinstimmenden Werte in Spalten von zwei Quellen. Bei den Quellen kann es sich um Tabellen, Flatfiles oder einer Kombination aus einer Tabelle und einem Flatfile handeln. Die Spalten können über einen Primärschlüssel und einen Fremdschlüssel verfügen oder nicht in Beziehung stehen (wenn beispielsweise eine Spalte aus einem Datastore und die andere aus einem Dateiformat stammt). 1. Wählen Sie in der Objektbibliothek die Tabelle oder Datei aus, für die Sie Beziehungs-Profiling-Daten anzeigen möchten. 2. Klicken Sie mit der rechten Maustaste, und wählen Sie Daten anzeigen aus. 3. Klicken Sie auf den (dritten) Tab Beziehung, um die Ergebnisse des Beziehungs-Profiling anzuzeigen. Hinweis Der Tab Beziehung ist nur sichtbar, wenn Sie eine Beziehungs-Profiler-Aufgabe ausgeführt haben. 4. Klicken Sie im Diagramm auf den Prozentsatz ungleich Null, um die Schlüsselwerte anzuzeigen, die nicht in der anderen Tabelle enthalten sind. Aus dem folgenden Tab "Daten anzeigen" geht beispielsweise hervor, dass 16,67 Prozent der Kunden keine Bestellung aufgegeben haben. Das Beziehungs-Profiling wurde für die Spalte CUST_ID in der Tabelle ODS_CUSTOMER und die Spalte CUST_ID in der Tabelle ODS_SALESORDER definiert. Der Wert im linken Oval zeigt an, dass 16,67 % der Zeilen in der Tabelle ODS_CUSTOMER über CUST_ID-Werte verfügen, die in der Tabelle ODS_SALESORDER nicht vorhanden sind. Designer-Handbuch Datenbewertung PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 341 Klicken Sie auf den Prozentsatz von 16,67 im Oval ODS_CUSTOMER, um die CUST_ID-Werte anzuzeigen, die in der Tabelle ODS_SALESORDER nicht existieren. Die nicht übereinstimmenden Werte KT03 und SA03 werden auf der rechten Seite des Tabs „Beziehung“ angezeigt. In jeder Zeile ist Folgendes enthalten: Ein nicht übereinstimmender CUST_ID-Wert, die Anzahl der zu diesem CUST_ID-Wert gehörenden Datensätze und der Prozentsatz, den dieser CUST_ID-Wert in Hinblick auf die Gesamtzahl der Kunden einnimmt. 5. Klicken Sie auf einen der Werte auf der rechten Seite, um die anderen Spalten in den Zeilen anzuzeigen, die diesen Wert enthalten. In der unteren Hälfte des Tabs Beziehungs-Profiling werden die Werte in den anderen Spalten der Zeile angezeigt, die den Wert KT03 in der Spalte CUST_ID aufweist. Hinweis Wenn Sie die Option „Alle Spaltendaten speichern“ im Fenster Anforderung für Beziehungs-Profiling senden nicht ausgewählt haben, können Sie die Daten in den anderen Spalten nicht anzeigen. Weitere Informationen Senden von Beziehungs-Profiler-Aufgaben [Seite 334] 342 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenbewertung 16.2 Verwenden von "Daten anzeigen" zur Ermittlung der Datenqualität Verwenden Sie "Daten anzeigen", um die Qualität Ihrer Quell- und Zieldaten zu ermitteln. "Daten anzeigen" bietet folgende Funktionen: ● Anzeigen von Beispielquelldaten vor der Jobausführung, um qualitativ hochwertigere Jobentwürfe anzulegen. ● Vergleichen von Beispieldaten aus verschiedenen Schritten Ihres Jobs, um sicherzustellen, dass mit Ihrem Datenextraktionsjob die von Ihnen gewünschten Ergebnisse erzielt werden. Hinweis Um "Daten anzeigen" für eine Datei zu verwenden, muss über den Designer auf die Datei zugegriffen werden können. Weitere Informationen Definieren einer Validierungsregel auf der Grundlage eines Spalten-Profilings [Seite 347] Verwenden von "Daten anzeigen" [Seite 612] 16.2.1 Daten (Tab) Der Tab Daten steht immer zur Verfügung und zeigt die Daten von Beispielzeilen an. Sie können eine Teilmenge von Spalten in jeder Zeile anzeigen und Filter definieren, um eine Teilmenge von Zeilen anzuzeigen. Beispielsweise können Ihre Business-Regeln vorgeben, dass alle Telefon- und Faxnummern für jedes Land ein und dasselbe Format aufweisen. Auf dem folgenden Tab Daten wird eine Teilmenge der Zeilen für die Kunden aus Frankreich angezeigt. Designer-Handbuch Datenbewertung PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 343 Beachten Sie, dass die Spalten PHONE (Telefon) und FAX Werte mit zwei unterschiedlichen Formaten enthalten. Sie können jetzt entscheiden, welches Format Sie im Ziel-Data-Warehouse verwenden möchten und eine Validation-Transformation entsprechend definieren. Weitere Informationen Eigenschaften von "Daten anzeigen" [Seite 616] Definieren einer Validierungsregel auf der Grundlage eines Spalten-Profilings [Seite 347] Daten (Tab) [Seite 621] 16.2.2 Profil (Tab) Auf dem Tab Profiling stehen zwei Ansichten zur Verfügung: ● Ohne den Daten-Profiler werden im Tab Profiling die folgenden Spaltenattribute angezeigt: eindeutige Werte, NULL-Werte, Mindestwert und Höchstwert. ● Wenn Sie den Daten-Profiler konfiguriert haben und verwenden, werden im Tab Profiling dieselben Attribute wie in der obigen Spalte sowie viele weitere berechnete Statistiken angezeigt, wie z.B. Durchschnittswert, Mindestzeichenfolgenlänge und maximale Zeichenfolgenlänge, Anzahl eindeutiger Werte, Prozentsatz eindeutiger Werte, Medianwert, Medianwert Zeichenfolgenlänge, Anzahl Muster und Prozentsatz Muster. Weitere Informationen Profiling (Tab) [Seite 622] Anzeigen der vom Daten-Profiler generierten Spaltenattribute [Seite 338] 16.2.3 Beziehungs-Profiling oder Spalten-Profiling (Tabs) Welcher Tab als dritter angezeigt wird, hängt davon ab, ob Sie den Daten-Profiler konfiguriert haben und verwenden. ● Wenn Sie den Daten-Profiler nicht verwenden, können Sie im Tab Spalten-Profiling statistische Informationen für eine einzelne Spalte berechnen. ● Wenn Sie den Daten-Profiler verwenden, werden im Tab Beziehung die zwischen zwei Spalten nicht übereinstimmenden Daten angezeigt, mit denen Sie die Integrität Ihrer Daten zwischen zwei Quellen ermitteln können. 344 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenbewertung Weitere Informationen Spalten-Profiling (Tab) [Seite 623] Anzeigen der vom Daten-Profiler generierten Beziehungs-Profiling-Daten [Seite 341] 16.3 Verwenden der Validation-Transformation Mit den Funktionen "Daten-Profiler" und "Daten anzeigen" können Anomalien in eingehenden Daten festgestellt werden. Anschließend können Sie mit einer Validation-Transformation die Regeln definieren, die fehlerfreie Daten und fehlerhafte Daten voneinander trennen. Die fehlerhaften Daten können zur späteren Überprüfung in eine Tabelle oder Datei geschrieben werden. Weitere Informationen zu der Validation-Transformation einschließlich einer Beschreibung der Implementierung von wiederverwendbaren Validierungsfunktionen finden Sie im SAP-Data-Services-Referenzhandbuch. Weitere Informationen Referenzhandbuch: Transformationen, Plattform-Transformationen, Validation 16.3.1 Analysieren des Spalten-Profilings Sie können Spalten-Profiling-Informationen abrufen, indem Sie Spalten-Profiler-Aufgaben senden. So besteht beispielsweise die Möglichkeit, die Daten in der Kundentabelle der Beispieldatenbank "Northwind" von Microsoft SQL Server zu analysieren. Weitere Informationen Senden von Spalten-Profiler-Aufgaben [Seite 332] 16.3.1.1 Analysieren von Spaltenprofilattributen 1. Klicken Sie in der Objektbibliothek mit der rechten Maustaste auf die analysierte Kundentabelle, und wählen Sie Daten anzeigen aus. 2. Wählen Sie den Tab Profiling im Fenster Daten anzeigen aus. Der Tab "Profiling" enthält die in der folgenden Abbildung gezeigten Spalten-Profiling-Attribute. Designer-Handbuch Datenbewertung PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 345 Im Attribut "Muster" wird für die Spalte PHONE (Telefon) der Wert 20 angezeigt. Dies bedeutet, dass 20 verschiedene Muster vorliegen. 3. Klicken Sie in der Attributspalte Muster auf den Wert 20. Im Bereich Profiling-Daten werden die einzelnen Muster für die Spalte PHONE (Telefon) und der Prozentsatz an Zeilen für jedes Muster angezeigt. 4. Beispiel: Gemäß Business-Regeln müssen alle Telefonnummern in Frankreich das Format 99.99.99.99 aufweisen. Aus den Profiling-Daten geht jedoch hervor, dass zwei Datensätze mit dem Format (9) 99.99.99.99 vorliegen. Um die Spalten für diese zwei Datensätze im unteren Bereich anzuzeigen, klicken Sie entweder auf (9) 99.99.99.99 unter „Wert“ oder auf 2 unter „Datensätze“. Sie sehen, dass einige Telefonnummern in Frankreich das Präfix "(1)" aufweisen. Mithilfe einer Validation-Transformation können Sie die Zeilen identifizieren, die das unerwünschte Präfix enthalten. Anschließend korrigieren Sie die Daten so, dass sie den Unternehmensrichtlinien entsprechen, und laden sie erneut. Im nächsten Abschnitt wird beschrieben, wie Sie die Validation-Transformation konfigurieren, um die fehlerhaften Zeilen zu identifizieren. Weitere Informationen Definieren einer Validierungsregel auf der Grundlage eines Spalten-Profilings [Seite 347] 346 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenbewertung 16.3.2 Definieren einer Validierungsregel auf der Grundlage eines Spalten-Profilings In diesem Abschnitt werden die Daten-Profiler-Ergebnisse verwendet und die Validation-Transformation entsprechend den Beispiel-Business-Regeln definiert. Auf der Grundlage des vorangegangenen Beispiels einer Telefonvorwahl (1) für Telefonnummern in Frankreich wird anhand des nachfolgenden Verfahrens beschrieben, wie ein Datenfluss und eine Validierungsregel, die dieses Muster identifiziert, definiert werden. Anschließend können Sie die fehlerhaften Daten anzeigen, Korrekturen vornehmen und die Daten erneut laden. 16.3.2.1 Definieren der Validierungsregel, die ein Muster identifiziert In dieser Prozedur wird erläutert, wie Sie einen Datenfluss und eine Validierungsregel zur Identifizierung der Zeilen definieren, die das im vorherigen Abschnitt beschriebene Präfix (1) enthalten. 1. Legen Sie einen Datenfluss an, der die Kundentabelle als Quelle enthält, fügen Sie eine ValidationTransformation und ein Ziel hinzu, und verbinden Sie die Objekte. 2. Öffnen Sie die Validation-Transformation, indem Sie auf ihren Namen klicken. 3. Im Transformationseditor klicken Sie auf Hinzufügen. Das Dialogfenster "Regeleditor" wird angezeigt. 4. Geben Sie einen Namen und optional eine Beschreibung für die Regel ein. 5. Überprüfen Sie, ob das Kontrollkästchen Aktiviert ausgewählt ist. 6. Für Aktion bei Fehler wählen Sie An Ausgabe "Fehlgeschlagen" senden aus. 7. Wählen Sie das Optionsfeld Spaltenvalidierung aus. a. Wählen Sie die Spalte CUSTOMERS.PHONE in der Drop-Down-Liste aus. b. Für Bedingung wählen Sie in der Drop-Down-Liste Übereinstimmungsmuster aus. c. Als Wert geben Sie den Ausdruck '99.99.99.99' ein. 8. Klicken Sie auf OK. Die Regel wird in der Liste "Regeln" angezeigt. Nach der Ausführung des Jobs sind die falsch formatierten Zeilen in der Ausgabe "Fehlgeschlagen" enthalten. Sie können jetzt die fehlerhaften Daten überprüfen, in vorgelagerten Operationen die erforderlichen Korrekturen vornehmen und die Daten erneut laden. Weitere Informationen Analysieren des Spalten-Profilings [Seite 345] Designer-Handbuch Datenbewertung PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 347 16.4 Verwenden von Audits Mit Audits kann sichergestellt werden, dass ein Datenfluss korrekte Daten in das Warehouse lädt. Verwenden Sie Audits für die folgenden Aufgaben: ● Auditpunkte definieren, um Laufzeitstatistiken für die Daten zu erfassen, die aus Objekten herausfließen. Durch Audits werden diese Statistiken im Repository gespeichert. ● Regeln mit diesen Auditstatistiken definieren, um sicherzustellen, dass die Daten an den folgenden Punkten im Datenfluss den Erwartungen entsprechen: ○ Nach der Extraktion aus Quellen ○ Nach der Verarbeitung durch Transformationen ○ Nach dem Laden in Ziele ● Eine Laufzeitbenachrichtigung generieren, die die fehlgeschlagene Auditregel und die Werte der Auditstatistiken zum Zeitpunkt des Fehlschlagens enthält. ● Die Auditstatistiken nach der Jobausführung anzeigen, um die Objekte im Datenfluss zu ermitteln, die möglicherweise falsche Daten angelegt haben. Hinweis Wenn Sie einen Auditpunkt vor einer Operation hinzufügen, die normalerweise an den Datenbankserver weitergegeben wird, kann die Leistung sich verschlechtern, da Push-down-Operationen nach einem Auditpunkt nicht zulässig sind. 16.4.1 Auditieren von Objekten in einem Datenfluss Sie können Auditstatistiken über die Daten erfassen, die aus einem Objekt kommen, z.B. einer Quelle, einer Transformation oder einem Ziel. Wenn eine Transformation mehrere eigene oder verschiedene Ausgaben hat (z.B. "Validation" oder "Case"), können Sie jede Ausgabe unabhängig auditieren. Um die Auditfunktion zu verwenden, definieren Sie im Fenster Audit folgende Objekte: Tabelle 115: Objektname Beschreibung Auditpunkt Das Objekt in einem Datenfluss, in dem Sie Auditstatistiken erfassen. Sie können eine Quelle, eine Transformation oder ein Ziel auditieren. Sie identifizieren das zu auditierende Objekt, wenn Sie eine Auditfunktion dafür definieren. 348 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenbewertung Objektname Beschreibung Auditfunktion Die Auditstatistik, die die Software für eine Tabelle, ein Ausgabeschema oder eine Spalte erfasst. In der folgenden Tabelle werden die Auditfunktionen aufgeführt, die Sie festlegen können. Tabelle 116: Datenobjekt Auditfunktion Beschreibung Tabellen- oder Ausga beschema Anzahl Mit dieser Funktion werden zwei Statistiken er fasst: ● Anzahl erfolgreich verarbeiteter Zeilen. ● Anzahl von Zeilen, für die bei der Aktivie rung der Fehlerbehandlung ein Fehler aus gegeben wurde. Spalte Summe Die Summe der numerischen Werte in der Spalte. Zu den zutreffenden Datentypen gehö ren DECIMAL, DOUBLE, INTEGER und REAL. Bei dieser Funktion werden nur die erfolgreich verarbeiteten Zeilen aufgenommen. Spalte Durchschnitt Der Durchschnitt der numerischen Werte in der Spalte. Zu den zutreffenden Datentypen gehören DECIMAL, DOUBLE, INTEGER und REAL. Bei dieser Funktion werden nur die er folgreich verarbeiteten Zeilen aufgenommen. Spalte Checksum Die Prüfsumme der Werte in der Spalte. Auditbezeichnung Der eindeutige Name im Datenfluss, den die Software für die Auditstatistik erzeugt, die für jede definierte Auditfunktion erfasst wird. Sie verwenden diese Bezeichnungen zum Definieren von Au ditregeln für den Datenfluss. Auditregel Ein Boolescher Ausdruck, in dem Sie den Job mit Auditbezeichnungen überprüfen. Wenn Sie in einem Datenfluss mehrere Regeln definieren, müssen alle Regeln erfolgreich sein, da der Audit sonst fehlschlägt. Maßnahmen bei fehlerhaf Mindestens eine von drei Möglichkeiten zum Generieren einer Benachrichtigung über das Fehl tem Audit schlagen einer Auditregel (bzw. -regeln): E-Mail, benutzerdefiniertes Skript, Auslösen einer Aus nahme. 16.4.1.1 Auditfunktion In diesem Abschnitt werden die Datentypen für die Auditfunktionen und die Fehleranzahlstatistiken beschrieben. Datentypen Die folgende Tabelle zeigt den Standarddatentyp für die einzelnen Auditfunktionen sowie die zulässigen Datentypen. Sie können den Datentyp im Fenster Eigenschaften für jede Auditfunktion im Designer ändern. Designer-Handbuch Datenbewertung PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 349 Tabelle 117: Auditfunktionen Standarddatentyp Zulässige Datentypen Anzahl Ganzzahl Ganzzahl Summe Typ der auditierten Spalte Integer, Decimal, Double, Real Durchschnitt Typ der auditierten Spalte Integer, Decimal, Double, Real Checksum Varchar(128) Varchar(128) Fehleranzahlstatistik Wenn Sie eine Count-Auditfunktion aktivieren, werden zwei Statistiktypen erfasst: ● Fehlerfreie Zeilenanzahl für Zeilen, die ohne Fehler verarbeitet wurden. ● Fehlerhafte Zeilenanzahl für Zeilen, die vom Job nicht verarbeitet werden konnten, wobei diese Zeilen jedoch ignoriert werden, damit die Verarbeitung fortgesetzt werden kann. Fehlerhafte Zeilen können beispielsweise generiert werden, wenn Sie die Option Überlaufdatei verwenden im Quell- oder Zieleditor angeben. 16.4.1.2 Auditbezeichnung Die Software generiert einen eindeutigen Namen für jede Auditfunktion, die Sie für einen Auditpunkt definieren. Sie können die Beschriftungsnamen bearbeiten. Dies könnte beispielsweise nötig sein, um einen kürzeren, aussagekräftigeren Namen anzulegen oder um Bindestriche zu entfernen, die zwar in Spaltennamen zulässig sind, nicht jedoch in Beschriftungsnamen. Generieren von Beschriftungsnamen Wenn der Auditpunkt für eine Tabelle oder ein Ausgabeschema gesetzt wurde, generiert die Software die folgenden zwei Beschriftungen für die Auditfunktion COUNT: $Count<_objectname> $CountError<_objectname> Wurde der Auditpunkt für eine Spalte gesetzt, generiert die Software einen Auditpunkt mit dem folgenden Format: $ <auditfunction_objectname> Wenn sich der Auditpunkt in einem eingebetteten Datenfluss befindet, weisen die Beschriftungen die folgenden Formate auf: $Count<_objectname_embeddedDFname> $CountError<_objectname_embeddedDFname> $<auditfunction_objectname_embeddedDFname> 350 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenbewertung Bearbeiten von Beschriftungsnamen Sie können den Auditbeschriftungsnamen bearbeiten, während Sie die Auditfunktion oder bevor Sie eine Auditregel anlegen, die die Beschriftung verwendet. Wenn Sie den Beschriftungsnamen bearbeiten, nachdem Sie ihn in einer Auditregel verwendet haben, übernimmt die Auditregel nicht automatisch den neuen Namen. Sie müssen die Regel mit dem neuen Namen neu definieren. 16.4.1.3 Auditregel Eine Auditregel ist ein Boolescher Ausdruck, der aus einer linken Seite und einer rechten Seite eines Booleschen Operators besteht. ● Die linke Seite kann eine einzelne Auditbezeichnung, mehrere Auditbezeichnungen die einen Ausdruck mit einem oder mehreren mathematischen Operatoren bilden oder eine Funktion mit Auditbezeichnungen als Parameter sein. ● Die rechte Seite kann eine einzelne Auditbezeichnung, mehrere Auditbezeichnungen die einen Ausdruck mit einem oder mehreren mathematischen Operatoren bilden oder eine Funktion mit Auditbezeichnung als Parameter oder eine Konstante sein. Die folgenden Booleschen Ausdrücke sind Beispiele für Auditregeln: $Count_CUSTOMER = $Count_CUSTDW $Sum_ORDER_US + $Sum_ORDER_EUROPE = $Sum_ORDER_DW round($Avg_ORDER_TOTAL) >= 10000 16.4.1.4 Auditbenachrichtigungen Sie können für eine Benachrichtigung bei einem fehlgeschlagenen Audit eine beliebige Kombination der folgenden Aktionen auswählen. Wenn Sie alle drei Aktionen auswählen, werden sie von der Software in der folgenden Reihenfolge ausgeführt: Tabelle 118: Aktion Beschreibung E-Mail an Liste Es wird eine Benachrichtigung über die fehlgeschlagene Auditregel an die von Ihnen in dieser Option aufgeführten E-Mail-Adressen gesendet. Trennen Sie die E-Mail-Adressen durch Kommata voneinander ab. Sie können eine Variable für die E-Mail-Liste angeben. Mit dieser Option wird die Funktion smtp_to verwendet, um E-Mails zu senden. Daher müssen Sie den Server und den Sender für das Simple Mail Transfer Protocol (SMTP) im Servermanager definieren. Skript Designer-Handbuch Datenbewertung Das in dieser Option angelegte benutzerdefinierte Skript wird ausgeführt. PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 351 Aktion Beschreibung Ausnahme auslösen Der Job schlägt fehl, wenn eine Auditregel fehlschlägt, und das Fehlerprotokoll zeigt an, welche Auditregel fehlgeschlagen ist. Der Job wird bei der ersten fehlschlagenden Audit regel angehalten. Diese Aktion ist die Standardeinstellung. Sie können diese Auditausnahme in einem Try/Catch-Block verwenden. Sie können die Jobausführung in einem Try/Catch-Block fortsetzen. Wenn Sie diese Option deaktivieren und die Auditregel fehlschlägt, wird der Job erfolg reich abgeschlossen und der Audit schreibt keine Meldungen in das Jobprotokoll. Im Au ditdetails-Bericht des Metadatenberichtstools können Sie sehen, welche Regel fehl schlug. Weitere Informationen Anzeigen von Auditergebnissen [Seite 359] 16.4.2 Zugreifen auf das Fenster "Audit" Im Designer können Sie von den folgenden Stellen aus auf das Fenster "Audit" zugreifen: ● Klicken Sie auf dem Tab "Datenflüsse" der Objektbibliothek mit der rechten Maustaste auf den Namen eines Datenflusses, und wählen Sie die Option Auditieren. ● Klicken Sie im Arbeitsbereich mit der rechten Maustaste auf ein Datenflusssymbol, und wählen Sie die Option Auditieren. ● Klicken Sie bei einem im Arbeitsbereich geöffneten Datenfluss auf das Symbol Audit in der Symbolleiste. Wenn Sie auf das Fenster Audit zugreifen, werden im Tab "Bezeichnung" zunächst die Quellen und Ziele im Datenfluss angezeigt. Falls der Datenfluss mehrere, aufeinanderfolgende Query-Transformationen enthält, wird im Fenster Audit die erste Abfrage angezeigt. Klicken Sie auf die Symbole in der oberen linken Ecke des Tabs "Bezeichnung", um die Anzeige zu ändern. Tabelle 119: Symbol 352 QuickInfo Beschreibung Alles zuklappen Klappt die Erweiterung der Quell-, Transformations- und Zielob jekte zu. Alle Objekte anzeigen Zeigt alle Objekte im Datenfluss an. Quelle, Ziel, Abfrage der ersten Ebene anzeigen Standardanzeige mit den Quell-, Ziel- und Abfrageobjekten der ers ten Ebene im Datenfluss. Falls der Datenfluss mehrere, aufeinan derfolgende Query-Transformationen enthält, wird nur die Abfrage auf erster Ebene angezeigt. Bezeichnete Objekte anzeigen Zeigt die Objekte an, für die Auditbezeichnungen definiert wurden. PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenbewertung 16.4.3 Definieren von Auditpunkten, -regeln und Maßnahmen bei Fehlern 1. Öffnen Sie das Fenster Auditieren. 2. Definieren Sie die Auditpunkte. Klicken Sie auf dem Tab "Bezeichnung" mit der rechten Maustaste auf ein zu auditierendes Objekt und wählen eine Auditfunktion oder Eigenschaften aus. Bei der Definition eines Auditpunkts generiert die Software Folgendes: ○ Ein Auditsymbol für das Objekt im Datenfluss im Arbeitsbereich ○ Eine Auditbezeichnung, die zur Definition von Auditregeln verwendet wird. Neben der Auswahl einer Auditfunktion kann im Fenster "Eigenschaften" die Auditbezeichnung bearbeitet und der Datentyp einer Auditfunktion bearbeitet werden. Beispielsweise enthält der Datenfluss Case_DF folgende Objekte und Sie möchten sicherstellen, dass alle Quellzeilen von der Case-Transformation verarbeitet werden. ○ Quelltabelle ODS_CUSTOMER ○ Vier Zieltabellen: R1 enthält Zeilen, in denen ODS_CUSTOMER.REGION_ID = 1 ist R2 enthält Zeilen, in denen ODS_CUSTOMER.REGION_ID = 2 ist R3 enthält Zeilen, in denen ODS_CUSTOMER.REGION_ID = 3 ist R123 enthält Zeilen, in denen ODS_CUSTOMER.REGION_ID IN (1, 2 oder 3) ist a. Klicken Sie mit der rechten Maustaste auf die Quelltabelle ODS_CUSTOMER und wählen Anzahl. Es werden die Auditbezeichnungen $Count_ODS_CUSTOMER und $CountError_ODS_CUSTOMER angelegt und ein Auditsymbol wird auf dem Quellobjekt im Arbeitsbereich angezeigt. b. Klicken Sie einfach mit der rechten Maustaste auf jede Zieltabelle und wählen Anzahl. Das Fenster "Auditieren" zeigt die folgenden Auditbezeichnungen. Designer-Handbuch Datenbewertung PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 353 Tabelle 120: Zieltabelle Auditfunktion Auditbezeichnung ODS_CUSTOMER Anzahl $Count_ODS_CUSTOMER R1 Anzahl $Count_ R1 R2 Anzahl $Count_ R2 R3 Anzahl $Count_ R3 R123 Anzahl $Count_ R123 c. Wenn Sie eine Auditbezeichnung entfernen möchten, klicken Sie mit der rechten Maustaste auf die Bezeichnung, die zuvor definierte Auditfunktion zeigt dann ein Häkchen davor an. Klicken Sie auf die Funktion, um das Kontrollkästchen zu entfernen und die zugehörige Auditbezeichnung zu löschen. Wenn Sie mit der rechten Maustaste auf die Bezeichnung klicken, können Sie auch „Eigenschaften“ auswählen und anschließend in der Drop-Down-Liste Auditfunktion den Wert (Kein Audit) auswählen. 3. Definieren Sie die Auditregeln. Klicken Sie auf dem Tab „Regeln“ auf das Fenster Auditieren, und klicken Sie auf Hinzufügen, um den Ausdruckseditor des Abschnitts „Auditregeln“ zu aktivieren. Wenn Sie Auditstatistiken für ein Objekt mit einem anderen Objekt vergleichen möchten, verwenden Sie den Ausdruckseditor, der aus drei Textfeldern mit Drop-Down-Listen besteht: a. Wählen Sie die Bezeichnung des ersten Auditpunkts in der ersten Drop-Down-Liste. b. Wählen Sie in der zweiten Drop-Down-Liste einen Booleschen Operator aus. Die Optionen im Editor enthalten gängige Boolesche Operatoren. Wenn Sie einen Booleschen Operator benötigen, der nicht in dieser Liste enthalten ist, verwenden Sie das Feld "Benutzerdefiniert" mit seinen Funktions- und Smart Editoren, um den Operator einzugeben. c. Wählen Sie in der dritten Drop-Down-Liste eine Bezeichnung für den zweiten Auditpunkt aus. Wenn Sie den ersten Auditwert mit einer Konstanten anstatt mit einem zweiten Auditwert vergleichen möchten, verwenden Sie das Feld mit den CUSTOMER-Ausdrücken. Um beispielsweise zu verifizieren, dass die Anzahl an Zeilen in der Quelltabelle gleich der Anzahl der Zeilen in der Zieltabelle ist, wählen Sie die Auditbezeichnungen und die Boolesche Operation im Ausdruckseditor wie folgt aus: Wenn Sie Auditstatistiken für ein oder mehr Objekte mit Statistiken für mehrere andere Objekte oder einer Konstante vergleichen möchten, wählen Sie das Feld "Benutzerdefiniert" aus. a. Klicken Sie auf die Ellipsenschaltfläche, um das Smart-Editor-Fenster in vollständiger Größe zu öffnen. b. Klicken Sie links auf den Tab Variablen, und klappen Sie den Knoten Bezeichnungen auf. c. Ziehen Sie die erste Auditbeschriftung des Objekts in den Editorbereich. d. Geben Sie einen Booleschen Operator ein. e. Ziehen Sie die Auditbezeichnungen der anderen Objekte, mit denen Sie die Auditstatistiken des ersten Objekts vergleichen möchten und fügen Sie die entsprechenden mathematischen Operatoren dazwischen ein. f. Klicken Sie auf OK, um Smart Editor zu schließen. g. Die Auditregel wird im Editor "Benutzerdefiniert" angezeigt. Um die Regel zu aktualisieren, klicken Sie im oberen Feld "Auditregel" auf den Titel "Auditregel" oder auf eine andere Option. 354 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenbewertung h. Klicken Sie im Fenster „Auditieren“ auf Schließen. Um beispielsweise zu verifizieren, dass die Anzahl an Zeilen aus der Quelltabelle gleich der Summe der Zeilen in den ersten drei Zieltabellen ist, ziehen Sie die Auditbezeichnungen, geben Sie die Boolesche Operation und die Pluszeichen wie folgt in den Smart Editor ein: Count_ODS_CUSTOMER = $Count_R1 + $Count_R2 + $Count_R3 4. Legen Sie die im Falle des Fehlschlagens des Audits durchzuführende Aktion fest. Sie können eine der folgenden Aktionen auswählen: Tabelle 121: Aktion Beschreibung Ausnahme auslösen Der Job schlägt fehl, wenn eine Auditregel fehlschlägt, und das Fehlerprotokoll zeigt an, welche Auditregel fehlgeschlagen ist. Diese Aktion ist die Standardeinstel lung. Wenn Sie diese Option deaktivieren und die Auditregel fehlschlägt, wird der Job er folgreich abgeschlossen und der Audit schreibt keine Meldungen in das Jobproto koll. Im Auditdetails-Bericht des Metadatenberichtstools können Sie sehen, welche Regel fehlschlug. E-Mail an Liste Es wird eine Benachrichtigung über die fehlgeschlagene Auditregel an die von Ihnen in dieser Option aufgeführten E-Mail-Adressen gesendet. Trennen Sie die E-MailAdressen durch Kommata voneinander ab. Sie können eine Variable für die E-Mail-Liste angeben. Skript Das in dieser Option angelegte Skript wird ausgeführt. 5. Führen Sie den Job aus. Im Fenster Ausführungseigenschaften ist die Option Audits aktivieren standardmäßig aktiviert. Deaktivieren Sie dieses Kästchen, wenn Sie keine Auditstatistiken für diese spezifische Jobausführung wünschen. 6. Schauen Sie sich die Auditergebnisse an. Erfolgreiche und fehlgeschlagene Auditregeln können in den Metadatenberichten eingesehen werden. Wenn Sie die Verfolgung von Auditdaten auf dem Tab „Trace“ im Fenster Ausführungseigenschaften aktivieren, können Sie alle Auditergebnisse im Jobüberwachungsprotokoll anzeigen. Weitere Informationen Auditieren von Objekten in einem Datenfluss [Seite 348] Anzeigen von Auditergebnissen [Seite 359] 16.4.4 Richtlinien zur Auswahl von Auditpunkten Orientieren Sie sich beim Auswählen von Auditpunkten an den folgenden Richtlinien: ● Wenn Sie die Ausgabedaten eines Objekts auditieren, kann der Optimizer keine Operationen nach dem Auditpunkt übergeben. Falls also die Leistung einer Abfrage, die an den Datenbankserver übergeben wird, Designer-Handbuch Datenbewertung PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 355 wichtiger ist als das Erfassen von Auditstatistiken aus der Quelle, definieren Sie den ersten Auditpunkt für die Abfrage oder weiter hinten im Datenfluss. Beispiel: Der Datenfluss verfügt über Quell-, Abfrage- und Zielobjekte, und die Abfrage enthält eine WHEREKlausel, die an den Datenbankserver übergeben wird und die an die Software zurückgegebene Datenmenge erheblich reduziert. Definieren Sie den ersten Auditpunkt für die Abfrage, statt für die Quelle, sodass Auditstatistiken für die Abfrageergebnisse abgerufen werden können. ● Wenn sich eine pushdown_sql-Funktion nach einem Auditpunkt befindet, kann die Software sie nicht ausführen. ● Sie können nur Massenladevorgänge auditieren, die mit der Oracle-API-Methode erfolgt sind. Bei den anderen Massenlademethoden steht der Software die Anzahl der geladenen Zeilen nicht zur Verfügung. ● Audits sind deaktiviert, wenn Sie einen Job mit dem Debugger ausführen. ● NRDM-Schemas und Echtzeitjobs lassen sich nicht auditieren. ● Sie können keine Audits innerhalb eines ABAP-Datenflusses ausführen, jedoch die Ausgabe eines ABAPDatenflusses auditieren. ● Wenn Sie die CHECKSUM-Auditfunktion in einem Job verwenden, der normalerweise parallel ausgeführt wird, wird DOP für den gesamten Datenfluss deaktiviert. Die Reihenfolge der Zeilen ist wichtig für das Ergebnis von CHECKSUM. Bei DOP werden die Zeilen jedoch in einer anderen Reihenfolge als in der Quelle verarbeitet. 16.4.5 Auditieren eingebetteter Datenflüsse In einem eingebetteten Datenfluss können Sie Auditbezeichnungen und Auditregeln definieren. In diesem Abschnitt wird beschrieben, was Sie beim Auditieren eingebetteter Datenflüsse beachten müssen: ● Aktivieren von Audits in einem eingebetteten Datenfluss ● Auditpunkte außerhalb des eingebetteten Datenflusses nicht sichtbar 16.4.5.1 Aktivieren von Audits in einem eingebetteten Datenfluss Wenn Sie bei der Ausführung des übergeordneten Datenflusses Auditstatistiken über einen eingebetteten Datenfluss erfassen möchten, müssen Sie die Auditbezeichnung des eingebetteten Datenflusses aktivieren. 16.4.5.1.1 Aktivieren von Audits in einem eingebetteten Datenfluss 1. Öffnen Sie den übergeordneten Datenfluss im Designer-Arbeitsbereich. 2. Klicken Sie in der Symbolleiste auf das Auditsymbol, um das Fenster "Audit" zu öffnen 3. Blenden Sie im Tab "Bezeichnung" die Objekte ein, um alle Auditfunktionen anzuzeigen, die im eingebetteten Datenfluss definiert sind. Wenn ein Datenfluss am Anfang oder am Ende des übergeordneten Datenflusses eingebettet ist, kann am Ausgabe- oder Eingabeport eine Auditfunktion vorhanden sein. 356 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenbewertung 4. Klicken Sie mit der rechten Maustaste auf den Namen der Auditfunktion, und wählen Sie Aktivieren aus. Sie können auch Eigenschaften auswählen, um den Bezeichnungsnamen zu ändern und die Bezeichnung zu aktivieren. 5. Bei aktivierter Bezeichnung lassen sich außerdem Auditregeln definieren. 16.4.5.2 Auditpunkte außerhalb des eingebetteten Datenflusses nicht sichtbar Wenn Sie einen Datenfluss am Anfang eines anderen Datenflusses einbetten, werden Daten über eine einzige Quelle vom eingebetteten Datenfluss zum übergeordneten Datenfluss übertragen. Wenn Sie einen Datenfluss am Ende eines anderen Datenflusses einbetten, werden Daten über ein einziges Ziel vom übergeordneten Datenfluss zum eingebetteten Datenfluss übertragen. In beiden Fällen sind einige der Objekte im übergeordneten Datenfluss nicht sichtbar. Da einige der Objekte im übergeordneten Datenfluss nicht sichtbar sind, sind die Auditpunkte zu diesen Objekten im übergeordneten Datenfluss ebenfalls nicht sichtbar. Der folgende eingebettete Datenfluss verfügt beispielsweise über eine Auditfunktion, die für die SQL-Quellentransformation definiert wurde, und eine Auditfunktion, die für die Zieltabelle definiert wurde. Das folgende Auditfenster zeigt diese beiden Auditpunkte. Designer-Handbuch Datenbewertung PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 357 Wenn Sie diesen Datenfluss einbetten, wird die Zielausgabe zu einer Quelle für den übergeordneten Datenfluss, und die SQL-Tranformation ist nicht mehr sichtbar. Es existiert zwar weiterhin ein Auditpunkt für den gesamten eingebetteten Datenfluss, aber die Beschriftung ist nicht mehr anwendbar. Das folgende Auditfenster für den übergeordneten Datenfluss zeigt die im eingebetteten Datenfluss definierte Auditfunktion, aber sie zeigt keine Auditbeschriftung. Wenn Sie den eingebetteten Datenfluss auditieren möchten, klicken Sie mit der rechten Maustaste auf die Auditfunktion im Auditfenster, und wählen Sie Aktivieren aus. 16.4.6 Auflösen ungültiger Auditbezeichnungen In folgenden Situationen kann eine Auditbezeichnung ungültig werden: ● Wenn Sie die Auditbezeichnung in einem eingebetteten Datenfluss löschen, den der übergeordnete Datenfluss aktiviert hat. ● Wenn Sie ein Objekt löschen oder umbenennen, für das ein Auditpunkt definiert wurde 16.4.6.1 Auflösen ungültiger Auditbezeichnungen 1. Öffnen Sie das Audit-Fenster. 2. Klappen Sie den Knoten "Ungültige Bezeichnungen" auf, um die einzelnen Bezeichnungen anzuzeigen. 3. Notieren Sie sich alle Bezeichnungen, die Sie für neue Objekte im Datenfluss definieren möchten. 358 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenbewertung 4. Nachdem Sie eine entsprechende Auditbezeichnung für ein neues Objekt definiert haben, klicken Sie mit der rechten Maustaste auf die ungültige Bezeichnung und wählen Löschen. 5. Wenn Sie alle ungültigen Bezeichnungen gleichzeitig löschen möchten, klicken Sie mit der rechten Maustaste auf den Knoten "Ungültige Bezeichnungen" und wählen Alle löschen. 16.4.7 Anzeigen von Auditergebnissen Sie können den Auditstatus in einem der folgenden Bereiche sehen: ● Jobüberwachungsprotokoll ● Wenn die Auditregel fehlschlägt werden die Auditinformationen in Abhängigkeit von der unter Aktion bei Fehler gewählten Option angezeigt: Tabelle 122: Aktion bei Fehler Bereiche, in denen Auditinformationen angezeigt werden Ausnahme auslösen Jobfehlerprotokoll, Metadatenberichte E-Mail an Liste E-Mail-Nachricht, Metadatenberichte Skript Wohin auch immer das benutzerdefinierte Skript die Auditnachricht sendet, Metada tenberichte Weitere Informationen Jobüberwachungsprotokoll [Seite 359] Jobfehlerprotokoll [Seite 360] Metadatenberichte [Seite 360] 16.4.7.1 Jobüberwachungsprotokoll Wenn Sie Auditdaten verfolgen auf dem Tab "Verfolgen" im Fenster "Ausführungseigenschaften" auf Ja festlegen, werden die Auditnachrichten im Jobüberwachungsprotokoll angezeigt. Sie können Nachrichten für Auditregeln sehen, die erfolgreich waren oder fehlgeschlagen sind. Die folgenden beispielhaften Auditerfolgsnachrichten werden im Jobüberwachungsprotokoll angezeigt, wenn Auditdaten verfolgen auf Ja festgelegt wurde: Audit Audit Audit Audit Audit Audit Audit Audit Audit Label Label Label Label Label Label Label Label Label Designer-Handbuch Datenbewertung $Count_R2 = 4. Data flow <Case_DF>. $CountError_R2 = 0. Data flow <Case_DF>. $Count_R3 = 3. Data flow <Case_DF>. $CountError_R3 = 0. Data flow <Case_DF>. $Count_R123 = 12. Data flow <Case_DF>. $CountError_R123 = 0. Data flow <Case_DF>. $Count_R1 = 5. Data flow <Case_DF>. $CountError_R1 = 0. Data flow <Case_DF>. $Count_ODS_CUSTOMER = 12. Data flow <Case_DF>. PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 359 Audit Label $CountError_ODS_CUSTOMER = 0. Data flow <Case_DF>. Audit Rule passed ($Count_ODS_CUSTOMER = (($CountR1 + $CountR2 + $Count_R3)): LHS=12, RHS=12. Data flow <Case_DF>. Audit Rule passed ($Count_ODS_CUSTOMER = $CountR123): LHS=12, RHS=12. Data flow <Case_DF>. 16.4.7.2 Jobfehlerprotokoll Wenn Sie die Option Ausnahme auslösen wählen und eine Auditregel fehlschlägt, wird die fehlgeschlagene Regel im Jobfehlerprotokoll angezeigt. Im Jobfehlerprotokoll wird die folgende Beispielnachricht angezeigt: Audit rule failed <($Count_ODS_CUSTOMER = $CountR1)> for <Data flow Case_DF>. 16.4.7.3 Metadatenberichte Betrachten Sie die Spalte Auditstatus in den "Datenflussausführungsstatistik"-Berichten des Metadatenberichtstools. Die Spalte Auditstatus hat folgende Werte: Tabelle 123: Wert Beschreibung Nicht auditiert Statistik wurde nicht erfasst. Erfolgreich Alle Auditregeln wurden erfolgreich ausgeführt. Dieser Wert ist eine Verknüpfung zum Auditdetails-Bericht, in dem die Auditregeln und Werte der Auditbezeichnun gen angezeigt werden. Erfasste Informationen Dieser Status tritt auf, wenn Sie Auditbezeichnungen zum Erfassen von Statistiken definieren, jedoch keine Auditregeln definieren. Dieser Wert ist eine Verknüpfung zum Auditdetails-Bericht, in dem die Werte der Auditbezeichnungen angezeigt wer den. Fehlgeschlagen Die Auditregel wurde nicht erfolgreich ausgeführt. Dieser Wert ist eine Verknüpfung zum Auditdetails-Bericht, in dem die fehlgeschlagene Regel und die Werte der Au ditbezeichnungen angezeigt werden. Weitere Informationen Management-Console-Handbuch: Berichte des operativen Dashboards 360 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenbewertung 17 Datenqualität 17.1 Überblick über die Datenqualität Datenqualität (bzw. Data Quality) ist ein Begriff, der sich auf diejenige Gruppe von Transformationen bezieht, die zusammen zur Verbesserung der Datenqualität beitragen, indem sie Datenelemente bereinigen, erweitern, abgleichen und konsolidieren. Datenqualität wird in der Software in erster Linie durch vier Transformationen gewährleistet: Tabelle 124: Transformation Beschreibung Address Cleanse Parst, standardisiert, korrigiert und erweitert Adressdaten. Data Cleanse Parst, standardisiert, korrigiert und erweitert Kunden- und Betriebsdaten. Geokodierung Verwendet geografische Koordinaten, Adressen und Point-of-Interest-Daten (POI-Daten), um Informationen z.B. zu Adressen, Breiten- und Längengraden sowie zu Zensusdaten an die Datensätze anzuhängen. Match Identifiziert doppelte Datensätze auf mehreren Ebenen in einem einzigen Durchlauf für Einzelpersonen, Haushalte oder Unternehmen innerhalb mehre rer Tabellen oder Datenbanken und konsolidiert sie in einer einzigen Quelle. Weitere Informationen Address Cleanse [Seite 503] Informationen über das Bereinigen von Daten [Seite 361] Geokodierung [Seite 393] Match [Seite 417] 17.2 Data Cleanse 17.2.1 Informationen über das Bereinigen von Daten Die Datenbereinigung ist ein Vorgang, in dessen Rahmen Daten geparst und standardisiert werden. In einem Bereinigungspaket befinden sich die Parser-Regeln und weitere Informationen, die festlegen, wie Daten geparst und standardisiert werden. Die Bereinigungspaketerstellung von SAP Information Steward bietet eine grafische Benutzeroberfläche zum Anlegen und Anpassen von Bereinigungspaketen. Sie können ein Bereinigungspaket auf der Grundlage von Beispieldaten von Grund auf neu anlegen oder ein vorhandenes oder ein Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 361 von SAP vordefiniertes Bereinigungspaket an Ihre spezifischen Bereinigungsanforderungen und -standards anpassen. Hinweis Der Data Cleansing Advisor verwendet bei der Datenverarbeitung das von SAP bereitgestellte Bereinigungspaket Person_Firm. Löschen Sie das von SAP bereitgestellte Bereinigungspaket nicht und benennen Sie es nicht um. Wenn Sie das von SAP bereitgestellte Bereinigungspaket ändern, werden dadurch möglicherweise die Ergebnisse im Datenbereinigungsassistenten geändert. Hinweis Nach dem Anlegen eines oder mehrerer benutzerdefinierter Inhaltstypen in Data Insight wird das Bereinigungspaket CTID_CUSTOM_TYPE in der Bereinigungspaketerstellung angezeigt. Öffnen oder ändern Sie CTID_CUSTOM_TYPE nicht in der Bereinigungspaketerstellung, denn dies wirkt sich auf die benutzerdefinierten Inhaltstypen aus. Ein Bereinigungspaket wird in der Bereinigungspaketerstellung angelegt und veröffentlicht. Anschließend wird es von der Data-Cleanse-Transformation in Data Services zum Testen und zum Deployment in der Produktion referenziert. Innerhalb eines Data-Services-Workflows identifiziert und isoliert die Data-Cleanse-Transformation bestimmte Teile von gemischten Daten. Sie parst und formatiert die Daten dann auf Grundlage des referenzierten Bereinigungspakets und der direkt in der Transformation festgelegten Optionen. Im folgenden Diagramm wird das Zusammenspiel von Data Services und Information Steward veranschaulicht, damit Sie ein auf Ihre Datenanforderungen zugeschnittenes Bereinigungspaket entwickeln können, das beim Bereinigen der Daten angewendet werden kann. 362 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität 17.2.2 Bereinigungspaket-Lebenszyklus: Entwickeln, Implementieren und Warten Der Prozess der Entwicklung, des Deployments und der Verwaltung eines Bereinigungspakets ist das Ergebnis der Aktionen und der Kommunikation zwischen dem Data-Services-Administrator, dem Data-Services-Tester und dem Bereinigungspaketerstellungs-Daten-Steward. Die genauen Rollen, Zuständigkeiten und Titel richten sich nach der Organisation, beinhalten aber häufig folgende Aufgaben: Tabelle 125: Rolle Zuständigkeit Bereinigungspaketerstellungs Verwendet die Bereinigungspaketerstellung und besitzt das zur Entwicklung und Anpassung -Daten-Steward eines Bereinigungspakets für eine bestimmte Datendomäne benötigte Wissen. Data-Services-Tester Verwendet die Data-Services-Transformation in einer Data-Services-Testumgebung zur Be reinigung von Daten. Sendet Ergebnisse an den Bereinigungspaketerstellungs-Daten-Steward zur Prüfung und Anpassung. Data-Services-Administrator Bereinigt Daten in einer Data-Services-Produktionsumgebung mithilfe der Data-CleanseTransformation basierend auf den in dem ausgewählten Bereinigungspaket definierten Regeln und Standards. Ein Bereinigungspaket-Workflow hat normalerweise drei iterative Phasen: Anlegen und Testen (Entwicklung), Deployment und Wartung. Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 363 Tabelle 126: Phasen im Bereinigungspaket-Workflow Phase Benutzerdefiniertes Bereinigungspa ket Anlegen und Testen (Entwickeln) Der Daten-Steward legt ein benutzerde finiertes Bereinigungspaket mit dem As sistenten für benutzerdefinierte Bereini gungspakete an. Der Daten-Steward testet das Bereinigungspaket und passt es in der Bereinigungspaketerstellung basierend auf den DatenbereinigungsParsing- und Standardisierungsergeb nissen im unteren Bereich im Designmo dus an. Bereinigungspaket für Personen- und Unternehmensdaten Der Daten-Steward legt ein Bereini gungspaket für Personen- und Unter nehmensdaten an, indem er eine Kopie eines veröffentlichten Bereinigungspa kets verwendet oder indem er (nicht empfohlen) eines manuell anlegt. Der Daten-Steward testet das Bereinigungs paket und passt es in der Bereinigungspaketerstellung basierend auf den Datenbereinigungs-Parsing- und Standardisierungsergebnissen in den Wenn der Daten-Steward mit den Er Beispieldaten auf der Registerkarte gebnissen zufrieden ist, veröffentlicht er Validieren der das Bereinigungspaket und sendet es an Bereinigungspaketerstellung an. den Data-Services-Tester, um es zu Wenn der Daten-Steward mit den Ergeb Testzwecken auf eine größere Anzahl an nissen zufrieden ist, veröffentlicht er das Datensätzen anzuwenden. Der DatenBereinigungspaket und sendet es an den Steward prüft ggf. die unzureichenden Data-Services-Tester, um es zu Test Ergebnisse der Data-Cleanse-Testphase zwecken auf eine größere Anzahl an Da und nimmt Änderungen am Bereini tensätzen anzuwenden. Der Daten-Ste gungspaket vor. Dieser Prozess setzt ward prüft ggf. die unzureichenden Er sich so lange fort, bis das Bereinigungs gebnisse der Data-Cleanse-Testphase paket die erwarteten Ergebnisse in Data und nimmt Änderungen am Bereini Services liefert. gungspaket vor. Dieser Prozess setzt sich so lange fort, bis das Bereinigungs paket die erwarteten Ergebnisse in Data Services liefert. Hinweis Die Registerkarte Validieren steht nur Bereinigungspaketen für Personenund Unternehmensdaten mit mehre ren Domänen zur Verfügung. Wenn der Daten-Steward mit den Ergeb nissen eines Bereinigungspakets mit ei ner Domäne zufrieden ist, veröffentlicht er das Bereinigungspaket und sendet es an den Data-Services-Tester, um es zu Testzwecken auf eine größere Anzahl an Datensätzen anzuwenden. Der DatenSteward prüft ggf. die unzureichenden Ergebnisse und nimmt Änderungen am Bereinigungspaket vor. Dieser Prozess setzt sich so lange fort, bis das Bereini gungspaket die erwarteten Ergebnisse in Data Services liefert. 364 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität Phase Benutzerdefiniertes Bereinigungspa ket Bereinigungspaket für Personen- und Unternehmensdaten Deployment Wenn alle mit den Testergebnissen zu frieden sind, implementiert der DatenSteward das Bereinigungspaket in der Produktion mithilfe des Hochstufverwal tungstools in der Central Management Console (CMC). Wenn alle mit den Testergebnissen zu frieden sind, implementiert der DatenSteward das Bereinigungspaket in der Produktion mithilfe des Hochstufverwal tungstools in der CMC. Weitere Informationen zur Hochstufver waltung finden Sie unter „Lifecycle Ma Weitere Informationen zur Hochstufver waltung finden Sie unter „Lifecycle ma nagement“ im Information platform ser nagement (LMC)“ im Information plat vices Administrator Guide. form services Administrator Guide. Wartung Der Information-Steward-Administrator verschiebt das Bereinigungspaket in die Wartungsphase und aktualisiert es nur dann, wenn die Ergebnisse regelmäßig eingeplanter Jobs abweichen oder wenn es neue Daten gibt. Der Information-Steward-Administrator verschiebt das Bereinigungspaket in die Wartungsphase und aktualisiert es nur dann, wenn die Ergebnisse regelmäßig eingeplanter Jobs abweichen oder wenn es neue Daten gibt. Das folgende Diagramm veranschaulicht einen typischen Workflow: Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 365 366 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität Weitere Informationen zum Verschieben eines Bereinigungspakets von der Entwicklungs-, in die Produktiv- und schließlich in die Wartungsumgebung finden Sie im Administratorhandbuch für SAP BusinessObjects Information Steward. Weitere Informationen zur Verwendung des Hochstufverwaltungstools in der Central Management Console (CMC) zum Verschieben von Bereinigungspaketen (als Hochstufen von „Objekten“ oder „InfoObjects“ bezeichnet) finden Sie im Administratorhandbuch für SAP BusinessObjects Business Intelligence. 17.2.3 Konfigurieren der Data-Cleanse-Transformation Voraussetzungen zum Konfigurieren der Data-Cleanse-Transformation: ● Zugriff auf das erforderliche Bereinigungspaket. ● Zugriff auf die von der Bereinigungspaketerstellung übertragene ATL-Datei. ● Zuordnungsinformationen für Eingabefelder und Attribute (Ausgabefeld) für Regeln zum benutzerdefinierten Mustervergleich, die im Tab Referenzdaten der Cleansing Package Builder definiert sind. So konfigurieren Sie die Data-Cleanse-Transformation: 1. Importieren Sie die von der Bereinigungspaketerstellung übertragene ATL-Datei. Durch das Importieren der ATL-Datei werden die erforderlichen Informationen bereitgestellt und automatisch die folgenden Optionen eingestellt: ○ Bereinigungspaket ○ Ausgabefelder filtern ○ Eingabewortzerlegung ○ Parser-Konfiguration Hinweis Sie können ein von SAP bereitgestelltes Bereinigungspaket für Personen- und Unternehmensdaten ohne direkte Änderungen in Data Services installieren und verwenden. Überspringen Sie zu diesem Zweck Schritt 1, und legen Sie alle erforderlichen Optionen in der Data-Cleanse-Transformation fest. 2. Wählen Sie im Eingabeschema die Eingabefelder, die Sie zuordnen möchten, und ziehen Sie diese auf die entsprechenden Felder im Tab Eingabe. ○ Namens- und Unternehmensdaten können entweder diskreten oder mehrzeiligen Feldern zugeordnet werden. ○ Benutzerdefinierte Daten müssen mehrzeiligen Feldern zugeordnet werden. ○ Telefon-, E-Mail-, Sozialversicherungsnummer- und benutzerdefinierte Musterdaten können entweder diskreten oder mehrzeiligen Feldern zugeordnet werden. Der entsprechende Parser muss aktiviert sein. 3. Wählen Sie im Tab Optionen die entsprechenden Optionswerte, um festzulegen, wie Data Cleanse die Daten verarbeitet. Wenn Sie die Standardeinstellung eines Optionswertes ändern, wird neben dem Optionsnamen ein grünes Dreieck angezeigt, um anzugeben, dass der Wert geändert wurde. Mit der ATL-Datei, die Sie in Schritt 1 importiert haben, werden bestimmte Optionen auf der Grundlage von Informationen im Bereinigungspaket festgelegt. 4. Wählen Sie im Tab Ausgabe die Felder, die von der Transformation ausgegeben werden sollen. Im Cleansing Package Builder werden Ausgabefelder als Attribute bezeichnet. Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 367 Vergewissern Sie sich, dass Sie alle Attribute (Ausgabefelder) zuordnen, die in benutzerdefinierten Mustern in den Referenzdaten der Cleansing Package Builder definiert sind. Weitere Informationen Transformationskonfigurationen [Seite 181] Data-Quality-Transformationseditoren [Seite 189] Hinzufügen von Data-Quality-Transformationen zu Datenflüssen [Seite 187] 17.2.4 Festlegen der Rangfolge und Priorisieren von ParsingEngines Bei einer mehrzeiligen Eingabe können Sie die Data Cleanse-Transformation so konfigurieren, dass sie nur bestimmte Parser verwendet und die Ausführungsreihenfolge der Parser angibt. Es kann vorteilhaft sein, sorgfältig auszuwählen, welche Parser in welcher Reihenfolge ausgeführt werden. Durch ein Deaktivieren nicht benötigter Parser lässt sich die Analysegeschwindigkeit erheblich erhöhen, und die Gefahr fehlerhaft analysierter Daten nimmt ab. Sie können die Parser-Reihenfolge für eine bestimmte mehrzeilige Eingabe ändern, indem Sie die entsprechende Parser-Sequenzoption in der Parser_Configuration-Optionsgruppe in der Data Cleanse-Transformation ändern. Um beispielsweise die Reihenfolge der Parser für das Eingabefeld "Mehrzeilig1" zu ändern, ändern Sie die Option "Parser-Sequenz: mehrzeilig1". Zum Ändern der ausgewählten Parser oder der Parser-Reihenfolge: Wählen Sie eine Parser-Sequenz aus, klicken Sie in der Meldung auf OK, und nehmen Sie dann im Fenster Sortierte Optionen die Änderungen vor. Weitere Informationen Editor für sortierte Optionen [Seite 192] 17.2.5 Informationen zum Parsen von Daten Mit der Data-Cleanse-Transformation kann eine große Vielzahl von Daten identifiziert und isoliert werden. In der Data-Cleanse-Transformation können Sie die Eingabefelder in den Daten den entsprechenden Eingabefeldern in der Transformation zuordnen. Benutzerdefinierte Daten mit Betriebs- oder Produktdaten werden immer mehrzeiligen Feldern zugeordnet. Personen- und Unternehmensdaten, Telefon-, E-Mail- und Sozialversicherungsnummerdaten können entweder diskreten oder mehrzeiligen Eingabefeldern zugeordnet werden. Im nachstehenden Beispiel wird gezeigt, wie mit Data Cleanse Produktdaten aus einem mehrzeiligen Eingabefeld geparst und in diskreten Ausgabefeldern angezeigt werden. Die Daten können auch in zusammengesetzten 368 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität Feldern angezeigt werden, wie Standardbeschreibung, die in der Bereinigungspaketerstellung Ihren individuellen Anforderungen angepasst werden können. Tabelle 127: Eingabedaten Geparste Daten Handschuh extreme Griffigkeit profit 2.3 large schwarz Kunstleder elastisch mit Klettver schluss Mechanix Wear Produktkategorie Handschuh Größe Groß Material Kunstleder Marke Pro-Fit 2.3 Series Bündchenstil Elastischer Klettverschluss Handfläche Extreme Griffigkeit Farbe Schwarz Anbieter Mechanix Wear Standardbeschreibung Handschuh – Kunstleder, schwarz, Größe: Large, Bündchenstil: Elastischer Klettverschluss, extreme Griffigkeit, Me chanix Wear In den nachfolgenden Beispielen wird gezeigt, wie mit Data Cleanse Namens- und Unternehmensdaten geparst und in diskreten Ausgabefeldern angezeigt werden. Die Daten können auch in zusammengesetzten Feldern angezeigt werden, die in der Bereinigungspaketerstellung Ihren individuellen Anforderungen angepasst werden können. Tabelle 128: Eingabedaten Geparste Daten Zusammengesetzte Da ten Ms Mary Ann Smith Jones, CPA Account Mgr. Jones Inc. Namenspräfix Ms. Vorname 1 Mary Vorname_Vollständig Vorname 2 Anne Mary Anne Nachname 1 Smith Nachname_Vollständig Nachname 2 Jones Smith Jones Namenssuffix CPA Titel Account Mgr. Firma Jones, Inc. Tabelle 129: Eingabedaten Geparste Daten James Witt 421-55-2424 [email protected] 507-555-3423 20. August 2003 Vorname 1 James Nachname 1 Witt Namenszusatz Jr. Sozialversicherungsnummer 421-55-2424 Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 369 Eingabedaten Geparste Daten E-Mail-Adresse [email protected] Rufnummer 507.555.3423 Date 20. August 2003 Die Data-Cleanse-Transformation parst bis zu sechs Namen pro Datensatz, zwei pro Eingabefeld. Für alle sechs gefundenen Namen parst sie Komponenten, wie Namenspräfix, Vornamen, Nachname und Namenssuffix. Dann sendet sie die Daten an die einzelnen Felder. Die Data-Cleanse-Transformation parst auch bis zu sechs Positionsbezeichnungen pro Datensatz. Die Data-Cleanse-Transformation parst bis zu sechs Unternehmensnamen pro Datensatz, einen pro Eingabefeld. 17.2.5.1 Parsen von Telefonnummern Data Cleanse parst Telefonnummern gemäß NANP (North American Numbering Plan) und internationale Telefonnummern. Telefonnummernsysteme sind weltweit verschieden. Wenn Data Cleanse eine Telefonnummer parst, werden die einzelnen Komponenten der Nummer in den entsprechenden Ausgabefeldern ausgegeben. Wenn die Telefonnummer einen gültigen Ländercode besitzt, der ihr vorangeht, ist das Parsing am effizientesten. Ist kein Ländercode vorhanden oder steht er nicht am Anfang der Zeichenfolge, parst Data Cleanse die Telefonnummer mit anderen Ressourcen. Data Cleanse parst die Telefonnummern zunächst durch eine internationale Suche. Die Transformation verwendet ISO2-Ländercodes, sofern vorhanden, sowie die im Bereinigungspaket für jedes Land definierten Muster, um den Ländercode zu identifizieren. Wenn Sie ein Land antrifft, das an NANP teilnimmt, hört sie automatisch auf, die Nummer als internationale zu parsen, und parst die Telefonnummer als nordamerikanische Nummer, wobei die Telefonnummer mit gängigen Mustern, wie z.B. (234) 567-8901, 234-567-8901 und 2345678901, verglichen wird. Folgende Länder nehmen derzeit an NANP teil: ● AS – Amerikanisch-Samoa ● AI – Anquilla ● AG – Antiqua und Barbuda ● BS – Bahamas ● BB – Barbados ● BM – Bermuda ● VG – Britische Jungferninseln ● CA – Kanada ● KY – Kaimaninseln ● DM – Dominica ● DO – Dominikanische Republik ● GD – Grenada ● GU – Guam ● JM – Jamaika 370 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität ● MS – Montserrat ● MP – Nördliche Marianen ● PR – Puerto Rico ● KN – St. Kitts und Nevis ● LC – St. Lucia ● VC – St. Vincent und die Grenadinen ● SX - Saint Maarten ● TT – Trinidad und Tobago ● TC – Turks- und Caicosinseln ● US – Vereinigte Staaten ● VI – Amerikanische Jungferninseln Data Cleanse ermöglicht Ihnen die Formatierung der nordamerikanischen Nummern bei der Ausgabe (beispielsweise können Sie die Trennzeichen auswählen). Internationale Nummern gibt Data Cleanse jedoch ohne Formatierung so, wie sie eingegeben wurden, aus. Außerdem führt Data Cleanse keinen Quervergleich mit der Adresse aus, um festzustellen, ob die Landes- und Ortsvorwahl in der Telefonnummer mit der Adresse übereinstimmen. Weitere Informationen Informationen zu Eins-zu-eins-Zuordnungen [Seite 380] 17.2.5.1.1 Parsen von Telefonnummern durch Data Cleanse Richten Sie in der Data-Cleanse-Transformation das Parsen internationaler Telefonnummern ein. Sie können das Parsen internationaler Telefonnummern in der Data-Cleanse-Transformation auf drei Ebenen einrichten: Datensatz, Jobdatei und Global. Data Cleanse versucht, Telefondaten nacheinander wie in der folgenden Tabelle erklärt zu parsen. Wenn die Transformation Telefondaten nicht mithilfe einer der drei Ebenen parsen kann, parst sie die Telefondaten als nordamerikanische Telefonnummer. Trifft Data Cleanse einen Ländercode an, der auf einer beliebigen Ebene im North American Numbering Plan (NANP) enthalten ist, lässt die Transformation alle verbleibenden Ebenen aus und parst die Nummer automatisch als nordamerikanische Telefonnummer. Hinweis Das Land muss im Bereinigungspaket angegeben sein, bevor Data Cleanse versucht, mithilfe der drei in der folgenden Tabelle angegebenen Ebenen zu parsen. Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 371 Tabelle 130: Ebene Prozess Datensatz Optional: Verwenden Sie das dynamische Eingabefeld "Op tion_Land". Richten Sie Ihren Datenfluss so ein, dass die Global-AddressCleanse- vor der Data-Cleanse-Transformation berücksichtigt wird. Stellen Sie sicher, dass die Global-Address-CleanseTransformation das Feld "ISO_Ländercode_2Zeich" ausgibt. Ordnen Sie dann "ISO_Ländercode_2Zeich" in Ihrer Eingabe zuordnung dem dynamischen Eingabefeld "Option_Land" zu. Vorteil: Da Global Address Cleanse den Ländercode be stimmt, der basierend auf den Adressdaten des Datensatzes im Feld "ISO_Ländercode_2Zeich" ausgegeben wird, kann mit einiger Wahrscheinlichkeit angenommen werden, dass die Ad resse und die Telefonnummer des Datensatzes aus demsel ben Land stammen. Data Cleanse versucht, die Telefondaten mit demselben Län dercode zu parsen. Wenn eine Übereinstimmung gefunden wird, parst Data Cleanse die Telefondaten basierend auf dem anwendbaren Land und fährt dann mit dem Parsen des nächs ten Datensatzes fort. Wenn die Transformation keine Überein stimmung findet, wird die nächste Ebene (Jobdatei) geparst. Stammt der Ländercode aus NANP, stoppt Data Cleanse das internationale Parsing, überspringt die Jobdatei- und die glo bale Ebene und versucht, die Telefondaten als nordamerikani sche Telefonnummer zu parsen. Informationen über dynamische Transformationseinstellun gen finden Sie im Referenzhandbuch. 372 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität Ebene Prozess Jobdatei Optional: Verwenden Sie die Option ISO2-Ländercodesequenz, die Sie unter Telefonoptionen auf dem Tab Optionen von Data Cleanse finden. Legen Sie in der Option ISO2-Ländercodesequenz eine Län dersequenz fest, um die Reihenfolge anzugeben, in der Data Cleanse Telefondaten sucht. Data Cleanse gleicht Telefonda ten mit dem ersten Land in der Sequenz ab. Wird keine Über einstimmung gefunden, fährt Data Cleanse mit dem nächsten Land in der Sequenz fort. "Global" ist die Standardeinstellung für die Sequenz. Sie sollten "Global" als letzten Eintrag in der Sequenz behalten oder aber entfernen. Vorteil: Wenn Sie wissen, dass Ihre Daten vorwiegend aus be stimmten Ländern stammen, können Sie die Sequenz mithilfe dieser Länder festlegen und "Global" entfernen, sodass Data Cleanse Telefondaten nur und in der Reihenfolge, in der Sie sie aufgelistet haben, mit diesen Ländern abgleicht. Stammt der Ländercode aus NANP, stoppt Data Cleanse das internationale Parsing, überspringt die globale Ebene und ver sucht, die Telefondaten als nordamerikanische Telefonnum mer zu parsen. Wenn Sie "Global" aus der Sequenz löschen und Data Cleanse keine Übereinstimmungen mit den Ländern in der Sequenz gefunden hat, parst die Transformation die Telefondaten des Datensatzes als nordamerikanische Daten. Wenn Sie diese Ebene des Telefon-Parsings auslassen möch ten, können Sie die Option ISO2-Ländercodesequenz leer las sen. Data Cleanse parst die Telefondaten dann als nordameri kanische Daten. Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 373 Ebene Prozess Global Optional. "Global" ist die Standardeinstellung für die Jobdatei-Option ISO2-Ländercodesequenz. Sie können angeben, dass "Global" nicht in der Sequenz berücksichtigt wird, dass "Global" nach einer Sequenz von Ländercodes berücksichtigt wird oder dass nur "Global" in der Sequenz berücksichtigt wird. Vorteil: Wenn Sie sich über die in Ihren Daten dargestellten Länder unsicher sind und/oder den von der Global-AddressCleanse-Transformation ausgegebenen Ländercode nicht ha ben, durchsucht die Transformation als Teil der globalen Su che alle im Bereinigungspaket gelisteten Länder (außer NANP-Länder). Hinweis Die Ebene "Global" berücksichtigt Ländercodes nicht als Suchkriterien. Stammt der Ländercode aus NANP, stoppt Data Cleanse das globale Parsing und versucht, die Telefondaten als nordameri kanische Telefonnummer zu parsen. Wenn die Transformation Telefondaten nicht basierend auf der Einstellung "Global" parsen kann oder Sie "Global" aus der Option ISO2-Ländercodesequenz entfernt haben, parst die Transformation die Telefondaten als nordamerikanische Da ten. Die Transformation gibt beliebige Telefondaten aus, die nicht zu einem EXTRA-Ausgabefeld parsen, wenn Sie dieses in Ihrem Ausgabefeld-Setup berücksichtigt haben. Weitere Informationen Konfigurieren der Data-Cleanse-Transformation [Seite 367] Editor für sortierte Optionen [Seite 192] 17.2.5.2 Parsen von Datumsangaben Data Cleanse erkennt Datumsangaben in einer Vielzahl von Formaten und zerlegt diese Datumsangaben in Komponenten. Data Cleanse kann in Ihrem definierten Datensatz bis zu sechs Datumsangaben parsen. Das bedeutet, Data Cleanse identifiziert bis zu sechs Datumsangaben in der Eingabe, zerlegt diese Datumsangaben in Komponenten 374 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität und stellt die Datumsangaben als Ausgabe entweder im ursprünglichen Format oder in einem vom Benutzer ausgewählten Standardformat zur Verfügung. Weitere Informationen Informationen zu Eins-zu-eins-Zuordnungen [Seite 380] 17.2.5.3 Parsen von Sozialversicherungsnummern Data Cleanse parst US-amerikanische Sozialversicherungsnummern (SVNs), die entweder alleine stehen oder in einer Eingabezeile von anderem Text umgeben sind. Verwendete Felder Data Cleanse gibt die einzelnen Komponenten einer geparsten Sozialversicherungsnummer aus – d.h. die gesamte SVN, den Bereich, die Gruppe und die Seriennummer. Prozess des Parsens von Sozialversicherungsnummern durch Data Cleanse Data Cleanse parst Sozialversicherungsnummern in den folgenden Schritten: 1. Eine potenzielle SVN wird durch Suchen nach den folgenden Mustern identifiziert: Tabelle 131: Muster Ziffern pro Gruppierung Begrenzt durch nnnnnnnnn 9 aufeinanderfolgende Ziffern Nicht anwendbar nnn nn nnnn 3, 2 und 4 (für Bereich, Gruppe und Seriennummer) Leerzeichen nnn-nn-nnnn 3, 2 und 4 (für Bereich, Gruppe und Seriennummer) alle unterstützten Trennzeichen 2. Eine Gültigkeitsprüfung wird nur für die ersten fünf Ziffern ausgeführt. Die folgenden Ergebnisse dieser Gültigkeitsprüfung sind möglich: Tabelle 132: Ergebnis Beschreibung Erfolgreich Data Cleanse parst die Daten erfolgreich – und die Sozialversicherungsnummer wird in einem SVN-Ausga befeld ausgegeben. Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 375 Ergebnis Beschreibung Fehlge schlagen Data Cleanse parst die Daten nicht, weil es sich nicht um eine gültige Sozialversicherungsnummer gemäß der Definition der US-Regierung handelt. Die Daten werden als zusätzliche, nicht geparste Daten ausgege ben. Prüfen der Gültigkeit Bei der Ausführung einer Gültigkeitsprüfung prüft Data Cleanse nicht, ob eine bestimmte 9-stellige Sozialversicherungsnummer tatsächlich ausgegeben wurde oder ob es sich um die korrekte Nummer für eine benannte Person handelt. Stattdessen werden nur die ersten 5 Ziffern (Bereich und Gruppe) geprüft. Data Cleanse prüft die letzten 4 Ziffern (die Seriennummer) nur daraufhin, ob es sich um Ziffern handelt. SSA-Daten Data Cleanse prüft die ersten fünf Ziffern auf der Basis einer Tabelle der US-Behörde Social Security Administration (http://www.socialsecurity.gov/employer/ssns/HGJune2411_final.txt ). Die Regeln und Daten, die dieser Prüfung zugrunde liegen, sind unter http://www.ssa.gov/history/ssn/geocard.html . Die Informationen zur Sozialversicherungsnummer, auf denen Data Cleanse basiert, sind im Bereinigungspaket enthalten. Hinweis Die Tabelle wird von Social Security Administration nicht mehr aktualisiert. Die letzte Aktualisierung fand im Juli 2011 statt. Deswegen basiert die in Data Cleanse ausgeführte Validierung der Sozialversicherung auf Daten von Juli 2011. Weitere Informationen zum Zuweisungsverfahren der Sozialversicherungsnummer von Social Security Administration finden Sie unter http://www.ssa.gov/employer/randomizationfaqs.html . Ausgabe gültiger SVNs Data Cleanse gibt nur Sozialversicherungsnummern aus, bei denen die Gültigkeitsprüfung erfolgreich ist. Wenn bei einer mutmaßlichen SVN die Gültigkeitsprüfung fehlschlägt, gibt Data Cleanse die Nummer nicht als geparste, sondern als ungültige Sozialversicherungsnummer weiter. Weitere Informationen Referenzhandbuch: Transformationen, Data-Quality-Transformationen, Data Cleanse, Ausgabefelder 376 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität 17.2.5.4 Parsen von E-Mail-Adressen Wenn Data Cleanse Eingabedaten parst, die als E-Mail-Adresse erkannt werden, werden die Komponenten dieser Daten für die Ausgabe in bestimmte Felder gestellt. Es folgt ein Beispiel einer einfachen E-Mail-Adresse: [email protected] Durch Identifikation der verschiedenen Datenkomponenten (Benutzername, Host etc.) anhand ihrer Beziehungen zueinander kann Data Cleanse die Daten bestimmten Attributen (Ausgabefeldern) zuweisen. Von Data Cleanse verwendete Ausgabefelder Data Cleanse gibt die einzelnen Komponenten einer geparsten E-Mail-Adresse aus – d.h. den Benutzernamen, den vollständigen Domänennamen, die oberste Domäne, die zweite Domäne, die dritte Domäne, die vierte Domäne, die fünfte Domäne und den Hostnamen der E-Mail-Adresse. Von Data Cleanse ausgeführte Aktionen Data Cleanse kann folgende Aktionen ausführen: ● Eine E-Mail-Adresse parsen, die sich entweder in einem diskreten Feld oder zusammen mit anderen Daten in einem mehrzeiligen Feld befindet. ● Den Domänennamen in Unterelemente zerlegen. ● Prüfen, ob eine E-Mail-Adresse ordnungsgemäß formatiert ist. ● Kennzeichnen, dass die Adresse den Namen eines ISP (Internet Service Provider) oder einer E-Mail-Domäne enthält, die unter den E-Mail-Typen der Referenzdaten in Data Cleanse aufgelistet ist. Dieses Kennzeichen wird im Ausgabefeld Email_is_ISP angezeigt. Nicht von Data Cleanse ausgeführte Prüfungen Verschiedene Aspekte einer E-Mail-Adresse werden nicht von Data Cleanse verifiziert. Nicht von Data Cleanse ausgeführte Prüfungen ● Ob der Domänenname (der Teil rechts von dem Zeichen @) registriert ist. ● Ob ein E-Mail-Server unter dieser Adresse aktiv ist. ● Ob der Benutzername (der Teil links von dem Zeichen @) auf diesem E-Mail-Server (falls vorhanden) registriert ist. ● Ob der persönliche Name in dem Datensatz unter dieser E-Mail-Adresse erreichbar ist. Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 377 E-Mail-Komponenten Das Ausgabefeld, in das Data Cleanse die Daten stellt, ist von der Position der Daten in dem Datensatz abhängig. Data Cleanse folgt dem Domain Name System (DNS) bei der Ermittlung des korrekten Ausgabefelds. Beispiel: Bei den Eingabedaten [email protected] gibt Data Cleanse die Elemente in den folgenden Feldern aus: Tabelle 133: Ausgabefeld Ausgabewert E-Mail [email protected] Benutzer_E-Mail expat E-Mail-Domäne_Alle london.home.office.city.co.uk E-Mail-Domäne_Oben uk E-Mail-Domäne_Zweite co E-Mail-Domäne_Dritte city E-Mail-Domäne_Vierte office E-Mail-Domäne_Fünfte home E-Mail-Domäne_Host london Weitere Informationen Informationen zu Eins-zu-eins-Zuordnungen [Seite 380] 17.2.5.5 Parsen von benutzerdefinierten Mustern Data Cleanse kann Muster in einer Vielzahl von Daten parsen, z.B. in folgenden Daten: ● Kontonummern ● Artikelnummern ● Bestellungen ● Rechnungsnummern ● VINs (Fahrzeugidentifizierungsnummern) ● Führerscheinnummern In anderen Worten: Data Cleanse kann jede alphanumerische Sequenz parsen, für die Sie ein Muster definieren können. Der Parser für den benutzerdefinierten Mustervergleich (UDPM) sucht das Muster in jedem Feld und im gesamten Feld. 378 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität Muster werden mithilfe regulärer Ausdrücke im Tab Referenzdaten der Bereinigungspaketerstellung definiert. Informationen über erforderliche Zuordnungen für Eingabe- und Ausgabefelder (Attribute) erhalten Sie vom Eigentümer des Bereinigungspakets. 17.2.5.6 Parsen von Adressen Data Cleanse identifiziert und parst keine einzelnen Adresskomponenten. Um Daten zu parsen, die Adressdaten enthalten, verarbeiten Sie sie mit einer Global-Address-Cleanse- oder einer U.S.-Regulatory-Address-CleanseTransformation, bevor Sie sie mit Data Cleanse verarbeiten. Werden Adressdaten von der Data CleanseTransformation verarbeitet, werden sie normalerweise in den zusätzlichen Feldern ausgegeben. Weitere Informationen Funktionsweise der Adressenbereinigung [Seite 504] 17.2.5.7 Parsen von Unternehmensnamen Mit Data Cleanse können Unternehmensdaten geparst werden. Data Cleanse akzeptiert diese Unternehmensnamen alleine in einem Feld oder zusammen mit anderen Daten. Eine Ausnahme zu der Regel, anhand derer Data Cleanse die Bestandteile zusammenhängender Wörter neu zusammensetzt, gilt für Wörter, die mit einem S enden, wie Applebee's oder Macy's. Die Eingabezeichenfolge Macy's wird in drei einzelne Token zerlegt: MACY, ', S. Da das letzte Token ein S ist, kombiniert Data Cleanse zuerst die Token und sucht den Begriff einschließlich Apostroph (MACY'S). Wird der Begriff nicht gefunden, sucht Data Cleanse den Begriff ohne Apostroph (MACYS). Ist diese Suche nicht erfolgreich, hält Data Cleanse die Token automatisch zusammen (MACY'S) und fügt dem Begriff die Klassifizierung FIRM_MISCELLANEOUS hinzu. Da Wörter, die mit S enden, automatisch zusammengehalten werden, ist es nicht erforderlich, alle possessiven Unternehmensnamen in das Wörterbuch aufzunehmen. 17.2.5.8 Parsen von Namens- und Titeldaten Mit Data Cleanse können Namens- und Titeldaten geparst werden. Der Name einer Person kann aus den folgenden Teilen bestehen: Namenspräfix, Vornamen, Nachnamen, Namenssuffix etc. Data Cleanse kann bis zu zwei Namen und Titel als verschiedene Komponenten akzeptieren. Data Cleanse akzeptiert auch Daten zu Namen und Titeln zusammen mit anderen Daten oder alleine in einem Feld. Die Zeile oder das mehrzeilige Feld für den Namen kann einen oder zwei Namen pro Feld enthalten. Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 379 17.2.5.9 Informationen zu Eins-zu-eins-Zuordnungen Ein-zu-eins-Zuordnung ist eine Option in der Data-Cleanse-Transformation, die steuert, wie einzelne Parser Daten ausgeben. Die Option Eins-zu-eins-Zuordnung steht für drei Parser zur Verfügung: ● Datum ● E-Mail ● Telefonnummer Wenn die Option auf Ja gesetzt ist, gibt die Data-Cleanse-Transformation die von bestimmten diskreten Eigabefeldern geparsten Daten in ihren entsprechenden Ausgabefeldern aus. Die Ausgabefelder sind für Parsevorgänge aus bestimmen diskreten Eingabefeldern „reserviert“. Diese Option zeigt die Zuordnung des Eingabefelds, das die ursprünglichen Daten enthielt, basiered auf den geparsten Daten im Ausgabefeld. Wenn beispielsweise die Eingabedaten in Rufnummer1 bis Rufnummer5 leer waren und das Feld "Rufnummer6" Daten enthielt, sind die Felder "Rufnummer1" bis "Rufnummer5" bei der Ausgabe immer noch leer und "Rufnummer6" enthält die geparsten Daten. Wenn die Eins-zu-eins-Zuordnung auf Ja gesetzt ist, werden alle Parser, die diese Option verwenden, auf Ja gesetzt. Beispielsweise können Sie die Option Eins-zu-eins-Zuordnung nicht ausschließlich für den Telefon-Parser festlegen. Wenn die Eins-zu-eins-Zuordnung auf Nein gesetzt ist, parst die Data-Cleanse-Transformation die Daten in der Reihenfolge, in der sie in den Parser eingegeben wurden. Die Daten werden nicht unbedingt im selben Feld ausgegeben, dem sie bei der Ausgabe zugeordnet waren. Die Daten werden im ersten verfügbaren Feld in der Kategorie ausgegeben. Hinweis Die Beispiele in diesem Abschnitt zeigen Datumsfelder. Dieselben Beispiele gelten auch für Telefon- und EMail--Felder. Beispiel Tabelle 134: Feld Eingabedaten Ausgabedaten, wenn die Option auf Nein gesetzt ist Ausgabedaten, wenn die Option auf Ja gesetzt ist Datum1 <leer> 1968/01/01 <leer> Datum2 1968/01/01 1968/02/02 1968/01/01 Datum3 1968/02/02 1968/03/03 1968/02/02 Datum4 <leer> 1968/04/04 <leer> Datum5 1968/03/03 <leer> 1968/03/03 Datum6 1968/04/04 <leer> 1968/04/04 380 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität Mehrzeilige Felder Die diskreten Felder "Datum", E-Mail" und "Telefon" werden vor den mehrzeiligen Feldern geparst, so dass nicht reservierte Felder Daten aus mehrzeiligen Feldern enthalten können. Beispiel Tabelle 135: Feld Eingabedaten Ausgabedaten, wenn die Option auf Nein gesetzt ist Ausgabedaten, wenn die Option auf Ja ge setzt ist Datum1 <leer> 1968/01/01 <leer> Datum2 1968/01/01 1968/02/02 1968/01/01 Datum3 <leer> 1968/03/03 <leer> Datum4 1968/02/02 1968/04/04 1968/02/02 Datum5 <leer> <leer> 1968/03/03 (nicht reserviert, daher können mehrzeilige Eingaben hier hinzugefügt werden) Datum6 <leer> <leer> 1968/04/04 (nicht reserviert, daher können mehrzeilige Eingaben hier hinzugefügt werden) <leer> <leer> Mehrzei 1968/03/03 lig1 1968/04/04 Zusätzliche Felder Wenn die Option Eins-zu-eins-Zuordnung auf Ja gesetzt ist, und das Eingabefeld mehrere Datensätze enthält, wird nur der erste Datensatz in das entsprechenden Ausgabefeld eingefügt. Alle anderen Datensätze werden in das zusätzliche Feld eingefügt. Beispiel Tabelle 136: Feld Eingabedaten Ausgabedaten, wenn die Option auf Nein gesetzt ist Ausgabedaten, wenn die Option auf Ja ge setzt ist Datum1 1968/01/01 1968/02/02 1968/03/03 1968/04/04 1968/05/05 1968/06/06 1968/07/07 1968/08/08 1968/01/01 1968/01/01 Datum2 <leer> 1968/02/02 <leer> Datum3 <leer> 1968/03/03 <leer> Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 381 Feld Eingabedaten Ausgabedaten, wenn die Option auf Nein gesetzt ist Ausgabedaten, wenn die Option auf Ja ge setzt ist Datum4 <leer> 1968/04/04 <leer> Datum5 <leer> 1968/05/05 <leer> Datum6 <leer> 1968/06/06 <leer> Extra <leer> 1968/07/07 1968/08/08 1968/02/02 1968/03/03 1968/04/04 1968/05/05 1968/06/06 1968/07/07 1968/08/08 Weitere Informationen Parsen von Datumsangaben [Seite 374] Parsen von E-Mail-Adressen [Seite 377] Parsen von Telefonnummern [Seite 370] 17.2.6 Informationen zum Standardisieren von Daten Standardformulare für einzelne Variationen werden im Rahmen eines Bereinigungspakets mit der Bereinigungspaketerstellung definiert. Darüber hinaus kann die Data Cleanse-Transformation Daten standardisieren, um deren Format einheitlicher zu gestalten. Zu den Dateneigenschaften, die die Transformation standardisieren kann, gehören Fall, Interpunktion und Abkürzungen. 17.2.7 Informationen zum Zuordnen von Genusbeschreibungen und Namenspräfixen Jeder Variation in einem Bereinigungspaket ist ein Genus zugewiesen. Standardmäßig ist das Genus nicht zugewiesen. Sie können einer Variation im erweiterten Modus der Bereinigungspaketerstellung ein Genus zuweisen. Genusbeschreibungen sind: "Stark männlich", "Stark weiblich", "Schwach männlich", "Schwach weiblich" und "Mehrdeutig". Den Variationen in dem von SAP bereitgestellten Namens- und Unternehmensbereinigungspaket wurden Genera zugewiesen. Mit der Data-Cleanse-Transformation können Sie das einer Variation zugewiesene Genus an das Ausgabefeld "GENUS" ausgeben. Das Ausgabefeld "Namenspräfix" enthält immer Namenspräfixe, die zu den Eingabedaten des Namens gehören. Wenn außerdem die Option Namenspräfixe zuweisen auf Ja gesetzt ist, füllt Data Cleanse das Ausgabefeld "NAMENSPRÄFIX" aus, wenn einer Variation das Genus "Stark männlich" oder "Stark weiblich" zugeordnet ist. 382 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität Doppelanrede Wenn eine Doppelanrede geparst wird, stellt Data Cleanse vier weitere Genusbeschreibungen bereit: "Weiblich mehrere Namen", "Männlich mehrere Namen", "Gemischt mehrere Namen" und "Mehrdeutig mehrere Namen". Diese Genera werden in Data Cleanse auf der Grundlage der zugewiesenen Genera der beiden Namen erzeugt. Aus der nachstehenden Tabelle geht hervor, wie die Genera mit mehreren Namen zugewiesen werden: Tabelle 137: Doppelanrede Genus des ersten Na mens Genus des zweiten Namens Zugewiesenes Genus für Dop pelanrede Bob und Sue Jones Stark männlich Stark weiblich Gemischt mehrere Namen Bob und Tom Jones Stark männlich Stark männlich Männlich mehrere Namen Sue und Sara Jones Stark weiblich Stark weiblich Weiblich mehrere Namen Bob und Pat Jones Stark männlich Mehrdeutig Mehrdeutig mehrere Namen Chinesische und japanische Vornamen Wenn ein Vorname infolge der Regeln geparst wurde, die Zeichen von Vornamen intelligent zusammensetzen, anstatt den Vornamen als Variation im Bereinigungspaket aufzunehmen, generiert Data Cleanse das Genus, indem das Genus der einzelnen Zeichen, aus denen der Vorname besteht, anhand der folgenden Tabelle kombiniert wird. Tabelle 138: Stark weiblich Stark männlich Schwach weiblich Schwach männlich Mehrdeutig Stark weiblich Stark weiblich Mehrdeutig Stark weiblich Mehrdeutig Stark weiblich Stark männlich Mehrdeutig Stark männlich Mehrdeutig Stark männlich Stark männlich Schwach weiblich Stark weiblich Mehrdeutig Schwach weiblich Mehrdeutig Schwach weiblich Schwach männlich Mehrdeutig Stark männlich Mehrdeutig Schwach männlich Schwach männlich Mehrdeutig Stark weiblich Stark männlich Schwach weiblich Schwach männlich Mehrdeutig 17.2.8 Vorbereiten von Datensätzen für den Vergleich Wenn Sie einen Datenfluss planen, der einen Vergleich enthält, wird empfohlen, dass Sie zunächst die Data Cleanse-Transformation zur Standardisierung der Daten verwenden, um die Genauigkeit Ihrer Vergleiche zu erhöhen. Die Data Cleanse-Transformation sollte der Match-Transformation vorgelagert sein. Die Data Cleanse-Transformation kann Übereinstimmungsstandards oder Alternativbezeichnungen für viele Namens- und Unternehmensfelder sowie alle benutzerdefinierten Ausgabefelder generieren. Beispielsweise erfahren Sie durch Data Cleanse, dass Patrick und Patricia potenzielle Übereinstimmungen für den Namen Pat sind. Mit Übereinstimmungsstandards können Sie zwei Typen von Übereinstimmungsproblemen beheben: alternative Schreibweisen (Catherine und Katherine) und Kurznamen (Pat und Patrick). Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 383 Das folgende Beispiel zeigt, wie Data Cleanse Datensätze für den Vergleich vorbereiten kann. Tabelle 139: Datenquelle 1 Eingabedatensatz Bereinigter Datensatz Intl Marketing, Inc. Vorname 1 Pat Pat Smith, Accounting Mgr. Übereinstimmungsstandards Patrick, Patricia Vorname 2 Nachname 1 Smith Titel Accounting Mgr. Unternehmen Intl. Mktg, Inc. Tabelle 140: Datenquelle 2 Eingabedatensatz Bereinigter Datensatz Smith, Patricia R. Vorname 1 International Marketing, Incorp. Übereinstimmungsstandards Patricia Vorname 2 R Nachname 1 Smith Position Unternehmen Intl. Mktg, Inc. Wenn ein Bereinigungspaket keine Alternativbezeichnung enthält, ist das Ausgabefeld für den Übereinstimmungsstandard für diesen Begriff leer. Ist bei einer aus mehreren Wörtern bestehenden Ausgabe wie einem Unternehmensnamen für keine der Variationen im Unternehmensnamen eine Alternativbezeichnung vorhanden, ist die Ausgabe für den Übereinstimmungsstandard leer. Ist jedoch mindestens einer Variation eine Alternativbezeichnung zugeordnet, wird der Übereinstimmungsstandard unter Verwendung der vorhandenen Alternativbezeichnung für Variationen generiert. Für Wörter ohne Alternativbezeichnung wird die Variation verwendet. 17.2.9 Regionsspezifische Daten 17.2.9.1 Informationen über Domänen Eine Domäne beschreibt einen bestimmten Daten- oder Inhaltstyp. Dank Domänen können Daten von der Datenbereinigung besser entsprechend den kulturellen Standards einer Region bereinigt werden. Jedes unterstützte Gebietsschema ist innerhalb eines von SAP vordefinierten Bereinigungspakets für Personen- und Unternehmensdaten eine Domäne. Mögliche kulturspezifische Unterschiede beim Parsing von Namen werden in der unten stehenden Tabelle veranschaulicht: 384 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität Tabelle 141: Domäne Name Geparste Ausgabe Vorname1 Vorname2 Nachname1 C. Sánchez Spanisch Juan C. Sánchez Juan Portugiesisch João A. Lopes João A. Französisch Jean Christophe Rousseau Jean Christophe Rousseau Deutsch Hans Joachim Mül ler Hans Joachim Müller Englisch (USA und Kanada) James Andrew Smith James Andrew Smith Nachname2 Lopes Jede Variation wird automatisch der globalen Domäne zugewiesen und kann außerdem einer oder mehreren anderen Domänen zugewiesen werden. Eine Variation kann in jeder Domäne eine andere Bedeutung haben. Anders ausgedrückt bedeutet dies, dass die mit einer bestimmten Variation assoziierten Eigenschaften, z.B. Standardform und Klassifizierung, für eine Domäne spezifisch sein können. Die Variation AG z.B. hat im Deutschen und im US-Englischen verschiedene Bedeutungen: AG steht im Deutschen für „Aktiengesellschaft“ und wird als „AG“ bereinigt, während AG im Englischen die Abkürzung für „Agriculture“ (Landwirtschaft) ist und als „Ag“ bereinigt wird. Sie können steuern, wie die Datenbereinigung Daten bereinigt, indem Sie eine oder mehrere Domänen, auf die die Datenbereinigung angewendet werden soll, und die Reihenfolge der Anwendung angeben. Hinweis Mehrere Domänen werden nur in Bereinigungspaketen für Personen- und Unternehmensdaten ab Version 4.1 unterstützt. Variationen in benutzerdefinierten Bereinigungspaketen und in Bereinigungspaketen für Personen- und Unternehmensdaten, die vor Information Steward 4.1 angelegt wurden, werden nur der globalen Domäne zugewiesen. Globale Domäne Die globale Domäne ist eine spezielle Inhaltsdomäne, in der alle Variationen und ihre verknüpften Eigenschaften enthalten sind. Wenn eine Variation nicht mit domänenspezifischen Informationen assoziiert ist, dient die globale Domäne als Standarddomäne. Wenn Sie eine neue Variation hinzufügen, wird diese zunächst zur globalen Domänen hinzugefügt. Sie können sie dann nach Bedarf zu anderen Domänen hinzufügen, um domänenspezifische Informationen zuzuweisen. Eine Variation muss nur dann zu einer anderen als der globalen Domäne hinzugefügt werden, wenn die Variation Eigenschaften, wie z.B. Geschlecht, Klassifizierung und Standardform, besitzt, die sich bei der globalen und bei anderen Domänen unterscheiden. Eine Variation, die aus der globalen Domäne gelöscht wird, wird auch aus allen anderen mit ihr assoziierten Domänen gelöscht. Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 385 Steuern der domänenspezifischen Bereinigung Der Data-Services-Administrator oder -Tester kann die Inhaltsdomänensequenz in der Data-CleanseTransformation festlegen, um zu steuern, wie die domänenspezifischen Daten, wie z.B. Name, Geschlecht, Position, von Data Cleanse geparst werden. Betrachten Sie in den folgenden Beispielen, wie das Geschlecht unter Berücksichtigung der folgenden Informationen auf den Namen Jean angewendet wird: Tabelle 142: Name Domäne Geschlecht Jean Global AMBIGUOUS Jean Französisch STARK_MÄNNLICH Jean Englisch (USA und Kanada) SCHWACH_WEIBLICH Wenn Sie keine domänenspezifischen Eigenschaften bevorzugen möchten, wählen Sie nur GLOBAL aus. Der Name Jean wird einem mehrdeutigen Geschlecht zugewiesen, da weder die französischen noch die englischen domänenspezifischen Informationen berücksichtigt werden. Wenn Daten aus einer Eindomänenregion vorhanden sind, geben Sie eine Domäne gefolgt von "Global" an. Wenn Sie beispielsweise „EN_US“ gefolgt von „GLOBAL“ (EN_US|GLOBAL) angeben, wird dem Namen Jean das Geschlecht „Schwach weiblich“ zugewiesen. Wenn Daten aus einer Mehrdomänenregion vorhanden sind, wählen Sie die bevorzugte Domänenreihenfolge und Global am Ende aus. Beispiel: Benelux (Belgien, Niederlande, Luxemburg) beinhaltet die Domänen Niederländisch, Französisch und Deutsch. Sie können Domänen je nach Bereinigungspräferenz in der gewünschten Reihenfolge anordnen. Wenn Sie beispielsweise die Domäne Niederländisch bevorzugen, geben Sie NL|FR|DE|GLOBAL an. Wenn die Daten eine Variation mit unterschiedlichen Eigenschaften in den ausgewählten Inhaltsdomänen enthalten, werden im Bereinigungsprozess zuerst die niederländischen Eigenschaften verwendet, wenn diese vorhanden sind. Wenn keine für Niederländisch spezifischen Eigenschaften vorhanden sind, werden die französischen Eigenschaften von Data Cleanse verwendet. Wenn weder für Niederländisch noch Französisch spezifische Eigenschaften vorhanden sind, werden die deutschen Eigenschaften verwendet. Wenn keine der drei Domänen spezifische Eigenschaften besitzt, werden die in der globalen Domäne angegebenen Eigenschaften von der Datenbereinigung verwendet. Ein weiteres Beispiel einer Mehrdomänenregion ist die Schweiz. Die Schweiz beinhaltet die Domänen Deutsch, Französisch und Italienisch. Sie können Domänen je nach Bereinigungspräferenz in der gewünschten Reihenfolge anordnen. Wenn Sie beispielsweise die Domäne Deutsch bevorzugen, wählen Sie DE|FR|IT|GLOBAL aus. Wenn die Daten eine Variation mit unterschiedlichen Eigenschaften in den ausgewählten Inhaltsdomänen enthalten, werden im Bereinigungsprozess zuerst die deutschen Eigenschaften verwendet, wenn diese vorhanden sind. Wenn keine für Deutsch spezifischen Eigenschaften vorhanden sind, werden die französischen Eigenschaften von Data Cleanse verwendet. Wenn weder für Deutsch noch Französisch spezifische Eigenschaften vorhanden sind, werden die italienischen Eigenschaften verwendet. Wenn keine der drei Domänen eine spezifische Bedeutung hat, wird die in der globalen Domäne vorhandene Bedeutung von der Datenbereinigung verwendet. Angeben der Inhaltsdomänensequenz Sie können die Inhaltsdomänensequenz auf drei verschiedenen Ebenen festlegen. 386 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität Tabelle 143: Ebene Option Standardebene Data-Cleanse-Transformationsoption Inhaltsdomänensequenz. Diese Option ist erforderlich. Bei Fehlern oder wenn die Optionen für die Zwischenebene und die oberste Ebene nicht angegeben sind, wird diese Einstellung verwendet. Zwischenebene Die Daten in den Eingabeoptionen Option_Land, Option_Sprache oder Option_Region. Bei Fehlern oder wenn die Option für die oberste Ebene nicht angegeben ist, wird diese Einstellung verwendet. Diese Ein gabefelder werden jeweils von den Ausgabefeldern der Global-Address-Cleanse-Transformation ISO_Ländercode_2Zeich, Sprache und Region1 gefüllt und zugeordnet. Die Verwendung dieser Eingabe felder ist optional. Oberste Ebene Die Daten in der Eingabeoption Option_Inhaltsdomänensequenz. Die Daten in dieser Option werden durch eine vorangegangene Query-Transformation oder einen anderen Vorverarbeitungsschritt zuge wiesen. Die Verwendung dieses Eingabefelds ist optional. Beispiel Während der Verarbeitung weist Data Cleanse die Inhaltsdomänensequenz basierend auf der Option der obersten Ebene zu, wenn die Option festgelegt und gültig ist. Tabelle 144: Ebene Option Ausgabe Hinweise Oberste Ebene Eingabefeld: Option_Inhaltsdomänense quenz=FR|Global Die Inhaltsdomänensequenz ist Französisch. Für alle Da ten, die nicht als französisch erkannt werden, gilt als Stan dard die Domäne "Global". Diese Option setzt die Ein stellungen für die Zwischenund Standardebene außer Kraft, sofern sie nicht ungül tig (z.B. falsch geschrieben) ist oder nicht festgelegt wurde. Zwischen ebene Eingabefelder: Die Inhaltsdomänensequenz ist Spanisch (ES_MX, Me xiko). Für alle Daten, die nicht als spanisch erkannt werden, gilt als Standard die Domäne "Global". Diese Option setzt die Ein Option_Land=MX Option_Sprache=<nicht festgelegt> Option_Region=<nicht festgelegt> stellungen für die Standard ebene außer Kraft, sofern sie nicht ungültig ist oder nicht festgelegt wurde. In den meisten Fällen kann die Inhaltsdomänensequenz nur anhand des Eingabefelds "Option_Land" erkannt wer den. Es gibt jedoch be stimmte Länder, die die In haltsdomänensequenz an hand von Option_Sprache oder Option_Region ermit teln können. Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 387 Ebene Option Ausgabe Hinweise Standard ebene Data-Cleanse-Transformationsoption: In haltsdomänensequenz=EN_US|Global Die Inhaltsdomänensequenz ist Englisch (USA und Ka nada). Für alle Daten, die nicht als englisch erkannt werden, gilt als Standard die Domäne "Global". Diese Option ist erforderlich und wird verwendet, wenn die Optionen der obersten Ebene und der Zwischen ebene Fehler enthalten. Wenn Sie die Zwischenebene verwenden, können manche Länder zusätzliche Eingabedaten für die Erkennung der Inhaltsdomänensequenz verwenden. Tabelle 145: Eingabefeld "Option_Land" Zusätzliche Eingabefelder Zugewiesene Inhaltsdomä nensequenz Hinweise CA (Kanada) Option_Region FR|Global Option_Region=BC* EN_US|Global Die Inhaltsdomänensequenz wird im mer "FR|Global" zugeordnet, wenn für "Option_Region" der Wert "Que bec" festgelegt ist. Zulässige Daten sind "Quebec" oder "QC". Die Großund Kleinschreibung muss dabei nicht berücksichtigt werden. Bei ei ner anderen gültigen Region (z.B. "BC" für British Columbia) wird die Inhaltsdomänensequenz "EN_US| Global" zurückgegeben. Option_Sprache=FR FR|Global Option_Sprache=NL* NL|Global Option_Sprache=FR FR|Global Option_Sprache=IT IT|Global Option_Sprache=RU* DE|Global BE (Belgien) CH (Schweiz) Die Inhaltsdomänensequenz wird im mer „FR|Global“ zugewiesen, wenn für „Option_Sprache“ der Wert „FR“ festgelegt ist. Wenn eine andere Sprache (z.B. „NL“ für Niederlän disch oder „EN_GB“ für britisches Englisch) angegeben oder diese Op tion leer ist, wird das Ausgabeformat „NL|Global“ zurückgegeben. Die Inhaltsdomänensequenz wird im mer "FR|Global" oder "IT|Global" zu geordnet, wenn für "Option_Spra che" der Wert "FR" bzw. "IT" festge legt ist. Wenn eine andere Sprache (z.B. "RU" für Russisch) angegeben oder diese Option leer ist, wird die In haltsdomänensequenz "DE|Global" zurückgegeben. Hinweis *Die Inhaltsdomänensequenz wird unabhängig vom Ausgabeformat zugewiesen. 388 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität Weitere Informationen Informationen über das Ausgabeformat [Seite 389] Referenzhandbuch: Transformationen, Data-Quality-Transformationen, Data Cleanse, Data-Cleanse-Optionen Referenzhandbuch: Transformationen, Dynamische Transformationseinstellungen 17.2.9.2 Informationen über das Ausgabeformat Je nach der im Ausgabeformat angegebenen Domäne verwendet die Datenbereinigung bestimmte Ausgabefelder und formatiert die in ihnen enthaltenen Daten gemäß den regionalen Standards. Sie können die Domäne im Ausgabeformat der Data-Cleanse-Transformation angeben. Je nach regionalen Standards wird ein zusammengesetzter Vorname kombiniert und im Feld Vorname1 ausgegeben, während in anderen Domänen der erste Vorname im Feld Vorname1 und der zweite Vorname im Feld Vorname2 ausgegeben werden. Auf ähnliche Weise wird in einigen Domänen ein zusammengesetzter Nachname kombiniert und im Feld Nachname1 ausgegeben, während in anderen Domänen der erste Nachname im Feld Nachname1 und der zweite Nachname im Feld Nachname2 ausgegeben werden. In einigen Domänen besteht das zusammengesetzte Ausgabefeld Person aus dem Vornamen, gefolgt von dem Nachnamen, während sich das zusammengesetzte Ausgabefeld Person in anderen Domänen aus Nachname und Vorname zusammensetzt. Die Data-Cleanse-Transformation setzt voraus, dass Sie auch dann ein Ausgabeformat angeben, wenn die Daten wirklich global sind. Wenn Sie Daten aus einer Eindomänenregion haben, geben Sie die Domäne an. Wählen Sie beispielsweise für Deutschland DE oder für China ZH aus. Wenn Sie Daten aus einer Mehrdomänenregion haben, wählen Sie die bevorzugte Domäne aus. Die Daten können je nach ausgewählter Domäne unterschiedlich formatiert werden. Daten von den Philippinen können z.B. im englischen oder spanischen Ausgabeformat ausgegeben werden. Die folgende Tabelle zeigt, dass der Name Juan Carlos Sánchez Cruz in Abhängigkeit von dem ausgewählten Ausgabeformat in verschiedenen Feldern ausgegeben wird. Tabelle 146: Ausgabefeld Ausgabeformat Englisch Spanisch Vorname1 Juan Juan Vorname2 Carlos Carlos Nachname 1 Sánchez Cruz Sánchez Cruz Nachname 2 Person Designer-Handbuch Datenqualität Juan Carlos Sánchez Cruz Juan Carlos Sánchez Cruz PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 389 Sie können Benelux-Daten in den Ausgabeformaten Niederländisch, Französisch oder Deutsch ausgeben. Die folgende Tabelle zeigt, dass der Name H. D. BUDJHAWAN abhängig von dem ausgewählten Ausgabeformat in verschiedenen Feldern ausgegeben wird. Tabelle 147: Ausgabefeld Ausgabeformat Vorname1 Niederländisch Französisch Deutsch H.D. H. D. H. D. Vorname2 Nachname 1 Budjhawan Budjhawan Budjhawan H.D. Budjhawan H. D. Budjhawan H. D. Budjhawan Nachname 2 Person Sie können das vorhandene Ausgabeformat ändern oder ein neues domänenspezifisches Ausgabeformat hinzufügen, indem Sie die entsprechenden Regeln in dem Bereinigungspaket ändern. Angeben des Ausgabeformats Sie können das Ausgabeformat auf drei verschiedenen Ebenen festlegen. Tabelle 148: Ebene Option Standardebene Data-Cleanse-Transformationsoption Ausgabeformat. Diese Option ist erforderlich. Bei Fehlern oder wenn die Optionen für die Zwischenebene und die oberste Ebene nicht angegeben sind, wird diese Ein stellung verwendet. Zwischenebene Die Daten in den Eingabeoptionen Option_Land, Option_Sprache oder Option_Region. Bei Fehlern oder wenn die Option für die oberste Ebene nicht angegeben ist, wird diese Einstellung verwendet. Diese Ein gabefelder werden jeweils von den Ausgabefeldern der Global-Address-Cleanse-Transformation ISO_Ländercode_2Zeich, Sprache und Region1 gefüllt und zugeordnet. Die Verwendung dieser Eingabe felder ist optional. Oberste Ebene Die Daten in der Eingabeoption Option_Ausgabeformat. Die Daten in dieser Option werden durch eine vorangegangene Query-Transformation oder einen anderen Vorverarbeitungsschritt zugewiesen. Die Verwendung dieses Eingabefelds ist optional. Beispiel Während der Verarbeitung weist Data Cleanse das Ausgabeformat basierend auf der Option der obersten Ebene zu, wenn die Option festgelegt und gültig ist. 390 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität Tabelle 149: Ebene Option Ausgabe Hinweise Oberste Ebene Eingabefeld: Option_Ausgabe format=FR Das Ausgabeformat ist Französisch. Diese Option setzt die Einstellungen für die Zwi schen- und Standardebene außer Kraft, sofern sie nicht ungültig (z.B. falsch geschrieben) ist oder nicht festgelegt wurde. Zwischen ebene Eingabefelder: Das Ausgabeformat ist Spanisch (Mexiko). Diese Option setzt die Einstellungen für die Stan Option_Land=MX dardebene außer Kraft, sofern sie nicht ungültig ist oder nicht festgelegt wurde. Option_Sprache=<nicht fest In den meisten Fällen kann das Ausgabeformat gelegt> nur anhand des Eingabefelds Option_Land er Option_Region=<nicht festge kannt werden. Es gibt jedoch bestimmte Länder, legt> die das Ausgabeformat anhand von Op tion_Sprache oder Option_Region ermitteln kön nen. Standard ebene Data-Cleanse-Transformati onsoption: Ausgabefor mat=EN_US Das Ausgabeformat ist Englisch (USA). Diese Option ist erforderlich und wird verwendet, wenn die Optionen der obersten Ebene und der Zwischenebene Fehler enthalten. Wenn Sie die Zwischenebene verwenden, können manche Länder zusätzliche Eingabedaten für die Erkennung des Ausgabeformats verwenden. Tabelle 150: Eingabefeld "Option_Land" Zusätzliche Eingabefel der Zugewiesenes Ausgabeformat Hinweise CA (Kanada) Option_Region FR Option_Region=BC* EN_US Das Ausgabeformat wird immer "FR" zugeordnet, wenn für "Option_Region" der Wert "Quebec" festgelegt ist. Zulässige Daten sind "Quebec" oder "QC". Die Groß- und Kleinschreibung muss dabei nicht berücksichtigt wer den. Bei einer anderen gültigen Region (z.B. "BC" für Bri tish Columbia) wird das Ausgabeformat "EN_US" zu rückgegeben. Option_Sprache=FR FR Option_Sprache=NL* NL Option_Sprache=FR FR Option_Sprache=IT IT Option_Sprache=RU* DE BE (Belgien) CH (Schweiz) Das Ausgabeformat wird immer „FR“ zugeordnet, wenn für „Option_Sprache“ der Wert „FR“ festgelegt ist. Wenn eine andere Sprache (z.B. „NL“ für Niederländisch oder EN_GB für britisches Englisch) angegeben oder diese Option leer ist, wird das Ausgabeformat „NL“ zurückge geben. Das Ausgabeformat wird immer "FR" oder "IT" zugeord net, wenn für "Option_Sprache" der Wert "FR" bzw. "IT" festgelegt ist. Wenn eine andere Sprache (z.B. "RU" für Russisch) angegeben oder diese Option leer ist, wird das Ausgabeformat "DE" zurückgegeben. Hinweis *Das Ausgabeformat wird unabhängig von der Inhaltsdomänensequenz zugewiesen. Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 391 Weitere Informationen Referenzhandbuch: Transformationen, Data-Quality-Transformationen, Data Cleanse, Data-Cleanse-Optionen, Bereinigungspaket-Optionen Referenzhandbuch: Transformationen, Dynamische Transformationseinstellungen 17.2.9.3 Anpassen von Namenspräfixen pro Land Wenn der Eingabename kein Namenspräfix enthält, generiert Data Cleanse die englischen Namenspräfixe Mr. und Ms. Um diese Begriffe zu ändern, fügen Sie nach der Data Cleanse-Transformation eine Query -Transformation hinzu und verwenden Sie die search_replace-Funktion, um die Begriffe durch regionsspezifische Namenspräfixe zu ersetzen. 17.2.9.4 Persönliche Identifikationsnummern Data Cleanse kann US-Sozialversicherungsnummern identifizieren und in diskrete Komponenten aufteilen. Falls Ihre Daten andere persönliche Identifikationsnummern als US-Sozialversicherungsnummern enthalten, können Sie benutzerdefinierte Musterregeln zur Identifikation der Nummern anlegen. Benutzerdefinierte Musterregeln sind Teil des Bereinigungspakets und werden auf dem Tab Referenzdaten bearbeiten in der Bereinigungspaketerstellung definiert. Benutzerdefinierte Musterregeln werden in Data Cleanse mit dem UDPM-Parser geparst. USSozialversicherungsnummern werden in Data Cleanse mit dem SSN-Parser geparst. 17.2.9.5 Textbreite in Ausgabefeldern Viele Japanische Zeichen werden sowohl in voll- als auch in halbbreiten Formen dargestellt. Lateinische Zeichen können in proportionalen oder vollbreiten Formen codiert sein. In jedem Fall nimmt die vollbreite Form mehr Platz ein als die halbbreite oder proportionale. Um Ihre Daten zu standardisieren, können Sie die Option Zeichenbreite verwenden, um die Zeichenbreite für alle Ausgabefelder auf vollbreit oder halbbreit festzulegen. Der Wert der normalen Breite spiegelt die normalisierte Zeichenbreite auf Grundlage des Skripttyps wider. Daher können einige Ausgabefelder halbbreite Zeichen und andere Felder vollbreite Zeichen enthalten. Beispielsweise sind alle vollbreiten lateinischen Zeichen auf die halbbreiten Formen standardisiert und alle halbbreiten Katakana-Zeichen auf die vollbreiten Formen. Für die NORMALE_BREITE ist keine spezielle Verarbeitung erforderlich, daher ist dies die effizienteste Einstellung. Hinweis Da die Ausgabebreite auf der normalisierte Breite für den Zeichentyp basiert, können die Ausgabedaten größer als die Eingabedaten sein. Möglicherweise muss die Spaltenbreite in der Zieltabelle erhöht werden. 392 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität Wenn Sie in Vorlagentabellen die Option NVARCHAR für VARCHAR-Spalten in unterstützten Datenbanken verwenden| wählen, wird der VARCHAR-Spaltentyp in NVARCHAR umgewandelt, und ein größeres Datenvolumen ist möglich. Weitere Informationen Referenzhandbuch: Gebietsschemas und Mehrfachbyte-Funktion, Mehrfachbyte-Unterstützung, Spaltengrößenanpassung 17.3 Geokodierung In diesem Abschnitt wird die Funktionsweise und die verschiedenen Einsatzmöglichkeiten der GeocoderTransformation beschrieben. Außerdem erfahren Sie, wie die Ausgabe zu interpretieren ist. Hinweis Die GeoCensus-Funktion in der USA Regulatory Address Cleanse-Transformation wird in zukünftigen Versionen von Data Services veraltet sein. Es empfiehlt sich, alle Datenflüsse, die derzeit von der GeoCensusFunktion Gebrauch machen, auf die Geocoder-Transformation zu aktualisieren. Anleitungen zum Aktualisieren von GeoCensus auf die Geocoder-Transformation finden Sie im Upgrade Guide. Funktionsweise der Geocoder-Transformation Die Geocoder-Transformation verwendet geografische Koordinaten die in Form von Breiten- und Längengraden, Adressen und POI-Daten (Point of Interest) angegeben werden. Mithilfe der Transformation können Sie den Daten Adressen, Breiten- und Längengrade, Zensusdaten und andere Informationen hinzufügen. Die Geocoder-Transformation basiert auf zugeordneten Eingabefeldern und bietet drei Verarbeitungsmodi für die Geokodierung: ● Adressgeokodierung ● Rückwärtsgeokodierung ● Textbasierte POI-Suche Die Geocoder-Transformation wird normalerweise in Verbindung mit der Global Address Cleanse- oder USA Regulatory Address Cleanse-Transformation verwendet. Weitere Informationen Referenzhandbuch: Transformationen, Data-Quality-Transformationen, Geocoder Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 393 Referenzhandbuch: Transformationen, Data-Quality-Transformationen, Geocoder, Geocoder-Felder GeoCensus (USA Regulatory Address Cleanse) [Seite 593] 17.3.1 Adressgeokodierung Im Adressgeokodierungsmodus weist die Geocoder-Transformation geografische Daten zu. Basierend auf der Vollständigkeit der Eingabeadressdaten kann die Geocoder-Transformation mehrere Ebenen der Breiten- und Längengraddaten zurückgeben. Wenn Sie verschiedene Ebenen von Breiten- und Längengradinformationen an die Daten anfügen, kann Ihre Organisation besser auf bestimmte Einwohnerzahlgrößen und andere regionale geografische Daten abzielen. Datensätze für Geokodierung vorbereiten Die Geocoder-Transformation ist am wirkungsvollsten, wenn sie standardisierte und korrigierte Adressdaten enthält. Um also höchst präzise Informationen zu erhalten, können Sie eine Address-Cleanse-Transformation vor die Geocoder-Transformation im Workflow setzen. 17.3.1.1 Breitengrad- und Längengradebenen Primärnummerebene Wenn in den Eingeabedaten eine vollständige Adresse enthalten ist (einschließlich Primärnummer), gibt die Geocoder-Transformation Breiten- und Längengradkoordinaten für die exakte Position des Orts auf Basis des Verzeichnistyps (bereichsbasiert oder parzellenbasiert) zurück, den Sie abonniert haben. Im Allgemeinen berechnet die Geocoder-Transformation mithilfe von Geokodierungsverzeichnissen die Breitenund Längengradwerte für ein Haus, indem sie zwischen dem Anfangs- und Endpunkt eines Liniensegments interpoliert, wobei das Liniensegment eine Reihe von Häusern darstellt. Die Breiten- und Längengradwerte können von der exakten Position des Hauses geringfügig abweichen. Dies wird als Zuordnungsebene "Primärer Bereich interpoliert" (Primary Range Interpolated, PRI) bezeichnet. Hinweis Wenn Sie eine Zuordnung auf Adressebene wünschen, muss das Eingabefeld "Primärnummer" zugeordnet werden und ausgefüllt sein. Die Geocoder-Transformation unterstützt auch Parzellenverzeichnisse, die die präzisesten und korrektesten verfügbaren Breiten- und Längengradwerte für Adressen enthalten, je nach verfügbaren Länderdaten. Parzellendaten werden als Punkte gespeichert. Sie gelangen nicht nur in die Nähe des Hauses, sondern direkt vor die Haustür. Dies wird als Zuordnungsebene "Primärer Bereich exakt" (Primary Range Exact, PRE) bezeichnet. 394 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität Postleitzahl-Schwerpunktebene Wenn eine Adresse über eine Postleitzahl verfügt, erhalten Sie Koordinaten im entsprechenden Postleitzahlbereich. Die Geocoder-Transformation verfügt über die Zuordnungsebenen "Vollständige Postleitzahl" (Postcode Full, PF), "Teilpostleitzahl 2" (Postcode2 Partial, P2P) und "Postleitzahl1" (Postcode1, P1), je nach verfügbaren Länderdaten. Ortschaft-Schwerpunktebene Wenn eine Adresse über eine Ortschaft verfügt, erhalten Sie Koordinaten im entsprechenden Ortschaftsbereich. Die Geocoder-Transformation verfügt über die Zuordnungsebenen "Ortschaft1" (Locality1, L1), Ortschaft2 (Locality2, L2), "Ortschaft3" (Locality3, L3) und "Ortschaft4" (Locality4, L4), je nach verfügbaren Länderdaten. 17.3.1.2 Feldzuordnung der Adressgeokodierung In den folgenden Tabellen werden die Eingabe- und Ausgabefelder aufgeführt, die erforderlich bzw. optional sind oder im Adressgeokodierungsmodus nicht zugeordnet werden können. Je mehr Eingabedaten Sie bereitstellen können, desto besser sind die zurückgegebenen Ergebnisse. Eingabefeldzuordnung Tabelle 151: Eingabefeldkategorie Adressgeokodierungsmodus Adresse Mindestens einer erforderlich Adresse POI Optional Breitengrad/Längengrad - Max. Datensätze - Suchfilter - Ausgabefeldzuordnung Tabelle 152: Ausgabefeldkategorie Adressgeokodierungsmodus Adresse - Adresse POI - Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 395 Ausgabefeldkategorie Adressgeokodierungsmodus Zuordnungsebene Optional Zensus Optional Entfernung - Infocode Optional Breitengrad/Längengrad Optional Einwohnerzahl Optional Ergebnisse - Straßenseite Optional Statuscode Optional 17.3.1.3 Adressgeokodierungsszenario Szenario: Sie weisen unter Verwendung einer Adresse oder einer Adresse und eines Point of Interest Breitengradund Längengradinformationen zu. Anzahl der Ausgabeergebnisse\ {4}: Ein einziger Datensatz In den folgenden Abschnitten werden die erforderlichen und optionalen Eingabefelder und verfügbaren Ausgabefelder beschrieben, die Ergebnisse für dieses Szenario liefern. Außerdem wird das Szenario anhand von Beispieldaten veranschaulicht. Erforderliche Eingabefelder Bei den erforderlichen Eingabefeldern muss das Feld "Land" zugeordnet werden. Je mehr Eingabedaten Sie bereitstellen können, desto besser sind die zurückgegebenen Ergebnisse. 396 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität Tabelle 153: Kategorie Name des Eingabefelds Adresse Land (erforderlich) Ortschaft1-4 Postleitzahl1-2 Primärer_Name1-4 Primärnummer Suffix1_Primär Präfix1_Primär Typ1-4_Primär Region1-2 Optionale Eingabefelder Tabelle 154: Kategorie Name des Eingabefelds Adresse POI POI_Name POI_Typ Verfügbare Ausgabefelder Alle Ausgabefelder sind optional. Tabelle 155: Kategorie Name des Ausgabefelds Zuordnungsebene Zuordnungsebene Zuordnungsebene_Ortschaft Zuordnungsebene_Postleitzahl Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 397 Kategorie Name des Ausgabefelds Zensus Zensustrakt_Zensusblock Zensustrakt_Zensusblock_Gruppe Landkreiscode_Verwaltung Ortschaft1_Code_Verwaltung Region1_Code_Verwaltung Städtischer_Statistikbereichscode Gemeindecode Statistikbereichscode Infocode Infocode Breitengrad/Längengrad Breitengrad Breitengrad_Ortschaft Breitengrad_Postleitzahl Breitengrad_Primärnummer Längengrad Längengrad_Ortschaft Längengrad_Postleitzahl Längengrad_Primärnummer Einwohnerzahl Einwohnerzahl_Ortschaft1 Straßenseite Primäradresse_Seite Statuscode Statuscode Beispiel Eingabe: Sie ordnen Eingabefelder zu, die folgende Daten enthalten: Tabelle 156: Name des Eingabefelds Eingabewert Land US Postleitzahl1 54601 Postleitzahl2 4023 Primärer_Name1 Front Primärnummer 332 Typ1_Primär St. Ausgabe: Die zugeordneten Ausgabefelder enthalten die folgenden Ergebnisse: 398 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität Tabelle 157: Name des Ausgabefelds Ausgabewert Zuordnungsebene PRE Breitengrad 43.811616 Längengrad -91.256695 Weitere Informationen Verstehen Ihrer Ausgabe [Seite 413] Referenzhandbuch: Data-Quality-Felder, Geocoder-Felder, Eingabefelder Referenzhandbuch: Data-Quality-Felder, Geocoder-Felder, Ausgabefelder 17.3.2 Rückwärtsgeokodierung Im Rückwärtsgeokodierungsmodus identifiziert die Geocoder-Transformation die nächste Adresse oder der nächste Point of Interest auf Basis eines Eingabereferenz-Standorts. Auf Basis der Eingabezuordnung kann die Rückwärtsgeokodierung in vier Modi verarbeiten: Tabelle 158: Modus Beschreibung Rückwärts mit Adresseingabe und Ausgabe eines einzigen Datensatzes Es wird ein eindeutiger Referenzpunkt anhand der Adressund der optionalen Adresszielfelder bestimmt und nur ein ein ziger, am nächsten gelegener Datensatz, der mit dem Suchfil ter übereinstimmt, ausgegeben. Wenn Suchfilterfelder nicht zugeordnet sind, verwendet die Geocoder-Transformation standardmäßig den nächsten Point of Interest oder die nächste Adresse. Rückwärts mit Adresseingabe und Ausgabe mehrerer Datensätze Es wird ein eindeutiger Referenzpunkt anhand der Adressund der optionalen Adresszielfelder bestimmt, und es werden die Referenzpunktdaten in Ausgabefelder und mehrere, am nächsten gelegene Datensätze, die mit den Suchfilterfeldern übereinstimmen, in das Feld "Ergebnisliste" ausgegeben. Die Anzahl von mehreren Datensätzen wird durch das Einga befeld "Option_Max_Datensätze" (falls zugeordnet und ge füllt) oder der Option "Max. Datensätze" bestimmt. Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 399 Modus Beschreibung Rückwärts mit Breiten-/Längengradeingabe und Ausgabe eines einzigen Datensatzes Es werden die Breiten- und Längengradfelder als Referenz punkt verwendet, und es wird nur ein einziger, am nächsten gelegener Datensatz, der mit den optionalen Suchfilterfeldern übereinstimmt, ausgegeben. Wenn die Suchfilterfelder nicht zugeordnet sind, verwendet die Geocoder-Transformation standardmäßig den nächsten Point of Interest oder die nächste Adresse. Rückwärts mit Breiten-/Längengradeingabe und Ausgabe mehrerer Datensätze Es werden die Breiten- und Längengradfelder als Referenz punkt verwendet und mehrere, am nächsten gelegene Daten sätze, die mit den Suchfilterfeldern übereinstimmen, in das Feld "Ergebnisliste" ausgegeben. Die Anzahl von mehreren Datensätzen wird durch das Einga befeld „Option_Max_Datensätze“ (falls zugeordnet und ge füllt) oder der Option „Max. Datensätze“ bestimmt. Wenn die Suchfilterfelder nicht zugeordnet sind, verwendet die Geocoder-Transformation standardmäßig den nächsten Point of Interest oder die nächste Adresse. Hinweis ● Durch Zuordnung des Eingabefelds "Option_Radius" können Sie die Entfernung vom angegebenen Referenzpunkt definieren und einen Bereich identifizieren, in dem übereinstimmende Datensätze angesiedelt sind. ● Um nach einem oder mehreren Standorten zu suchen, die Ziele, Adressen oder beides sein können, stellen Sie das Eingabefeld "Name_des_Suchfilters" oder "Typ_des_Suchfilters" ein. Dadurch werden die ausgegebenen Übereinstimmungen auf Ihre Suchkriterien beschränkt. ● Um nur eine Adresse zurückzugeben, geben Sie ADDR in das Eingabefeld „Typ_des_Suchfilters“ ein. ● Um nur zu einem Point of Interest zurückzukehren, geben Sie den dessen Namen und Typ ein. ● Wenn Sie keinen Suchfilter setzen, gibt die Transformation sowohl Adressen als auch Ziele zurück. 17.3.2.1 Feldzuordnung der Rückwärtsgeokodierung In den folgenden Tabellen werden die Eingabe- und Ausgabefelder aufgeführt, die erforderlich bzw. optional sind oder im Rückwärtsgeokodierungsmodus nicht zugeordnet werden können. Je mehr Eingabedaten Sie bereitstellen können, desto besser sind die zurückgegebenen Ergebnisse. 400 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität Eingabefeldzuordnung Tabelle 159: Eingabefeldkategorie Adresseingabe Adresseingabe Eine Ausgabe Mehrere Ausgaben Breiten-/Längengra deingabe Breiten-/Längengra deingabe Eine Ausgabe Mehrere Ausgaben Adresse Mindestens einer erfor Mindestens einer erfor derlich derlich - Adresse POI Optional Optional - - Breitengrad/Längen grad - - Mindestens einer erfor Mindestens einer erfor derlich derlich Max. Datensätze - Mindestens einer erfor derlich Suchfilter Mindestens einer erfor Mindestens einer erfor Optional derlich derlich Mindestens einer erfor derlich Optional Ausgabefeldzuordnung Tabelle 160: Ausgabefeldkategorie Adresseingabe Adresseingabe Eine Ausgabe Mehrere Ausgaben Breiten-/Längengra deingabe Breiten-/Längengra deingabe Eine Ausgabe Mehrere Ausgaben Adresse Optional - Optional - Adresse POI Optional - Optional - Zuordnungsebene Optional Optional Optional - Zensus Optional - Optional - Entfernung Optional - Optional - Infocode Optional Optional Optional Optional Breitengrad/Längen grad Optional Optional Optional - Einwohnerzahl Optional - Optional - Ergebnisse - Optional - Optional Straßenseite Optional Optional Optional - 17.3.2.2 Rückwärtsgeokodierungsszenario 1 Verwenden Sie Breitengrad und Längengrad, um mindestens eine Adresse oder mindestens einen Point of Interest zu finden. Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 401 Beispiel Das folgende Beispiel veranschaulicht ein Szenario, bei dem Breitengrad und Längengrad sowie ein Suchfilter verwendet werden, um ein einzelnes Point of Interest auszugeben, das der eingegebenen Breitengrad und Längengrad am nächsten liegt. Eingabe: Sie ordnen Eingabefelder zu, die folgende Daten enthalten: Tabelle 161: Name des Eingabefelds Eingabewert Breitengrad 43.811616 Längengrad -91.256695 Name_des_Suchfilters BUSINESS OBJECTS Weitere Informationen über Eingabefelder für dieses Szenario finden Sie unter Erforderliche Eingabefelder [Seite 403] und Optionale Eingabefelder [Seite 403]. Ausgabe: Die zugeordneten Ausgabefelder enthalten die folgenden Ergebnisse: Tabelle 162: Name des Ausgabefelds Ausgabewert Adresszeile 332 FRONT ST Zuordnungsebene PRE Ländercode US Entfernung 1.3452 Ortschaft1 LA CROSSE Postleitzahl 54601-4023 Postleitzahl1 54601 Postleitzahl2 4023 Primärer_Name1 FRONT Primärnummer 332 Typ1_Primär ST POI_Name BUSINESS OBJECTS POI_Typ 5800 Region1 WI Weitere Informationen über Ausgabefelder für dieses Szenario finden Sie unter Verfügbare Ausgabefelder [Seite 403]. Weitere Informationen Verstehen Ihrer Ausgabe [Seite 413] 402 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität Referenzhandbuch: Data-Quality-Felder, Geocoder-Felder, Eingabefelder Referenzhandbuch: Data-Quality-Felder, Geocoder-Felder, Ausgabefelder 17.3.2.2.1 Erforderliche Eingabefelder Szenario 1 Für ein Ergebnis mit einem Datensatz müssen beide Eingabefelder, „Breitengrad“ und „Längengrad“, zugeordnet werden. Für Ergebnisse mit mehreren Datensätzen müssen alle Eingabefelder, „Breitengrad“, „Längengrad“ und „Option_Max_Datensätze“ zugeordnet werden. Tabelle 163: Kategorie Breitengrad/Längengrad Max. Datensätze 17.3.2.2.2 Ergebnisse mit einem Datensatz Ergebnisse mit mehreren Datensätzen Name des Eingabefelds Name des Eingabefelds Breitengrad Breitengrad Längengrad Längengrad - Option_Max_Datensätze Optionale Eingabefelder Szenario 1 Tabelle 164: Kategorie Suchfilter 17.3.2.2.3 Ergebnisse mit einem Datensatz Ergebnisse mit mehreren Datensätzen Name des Eingabefelds Name des Eingabefelds Option_Radius Option_Radius Name_des_Suchfilters Name_des_Suchfilters Typ_des_Suchfilters Typ_des_Suchfilters Verfügbare Ausgabefelder Szenario 1 Alle Ausgabefelder sind optional. Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 403 Tabelle 165: Kategorie Adresse Ergebnisse mit einem Datensatz Ergebnisse mit mehreren Datensätzen Name des Ausgabefelds Name des Ausgabefelds Adresszeile - Ländercode Ortschaft1-4 Postleitzahl Postleitzahl1-2 Primärer_Name1-4 Primärnummer Suffix1_Primär Präfix1_Primär Primärer_Bereich_Hoch Primärer_Bereich_Niedrig Typ1-4_Primär Region1-2 Adresse POI POI_Name - POI_Typ Zuordnungsebene Zuordnungsebene - Zuordnungsebene_Ortschaft Zuordnungsebene_Postleitzahl Zensus Zensustrakt_Zensusblock - Zensustrakt_Zensusblock_Gruppe Landkreiscode_Verwaltung Ortschaft1_Code_Verwaltung Region1_Code_Verwaltung Städtischer_Statistikbereichscode Gemeindecode Statistikbereichscode Entfernung Entfernung - Infocode Infocode Infocode 404 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität Kategorie Breitengrad/Längengrad Ergebnisse mit einem Datensatz Ergebnisse mit mehreren Datensätzen Name des Ausgabefelds Name des Ausgabefelds Breitengrad - Breitengrad_Ortschaft Breitengrad_Postleitzahl Breitengrad_Primärnummer Längengrad Längengrad_Ortschaft Längengrad_Postleitzahl Längengrad_Primärnummer Einwohnerzahl Einwohnerzahl_Ortschaft1 - Ergebnisse - Ergebnisliste Ergebnisliste_Anzahl Straßenseite 17.3.2.3 Primäradresse_Seite - Rückwärtsgeokodierungsszenario 2 Suchen Sie anhand einer Adresse oder eines Point of Interest mindestens eine Adresse oder einen Point of Interest, der bzw. die dem Ziel am nächsten liegt. Außerdem gibt die Geocoder-Transformation Breiten- und Längengradinformationen für den Eingabereferenzpunkt und die zugeordneten Ausgabeergebnisse aus. Beispiel Das folgende Beispiel veranschaulicht ein Szenario, bei dem eine Adresse sowie ein Suchfilter verwendet werden, um ein einzelnes Point of Interest auszugeben, das der Eingabeadresse am nächsten liegt. Es soll die Bank (POI-Typ 6000) gesucht werden, die dem Eingabeort am nächsten liegt. Die Transformation gibt auch Breiten- und Längengradinformationen für das Ausgabeergebnis aus. Eingabe: Sie ordnen Eingabefelder zu, die folgende Daten enthalten. Tabelle 166: Name des Eingabefelds Eingabewert Land US Postleitzahl1 55601 Postleitzahl2 4023 Primärer_Name1 Front Primärnummer 332 Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 405 Name des Eingabefelds Eingabewert Typ1_Primär St. POI_Name BUSINESS OBJECTS Typ_des_Suchfilters 6000 Weitere Informationen über Eingabefelder für dieses Szenario finden Sie unter Erforderliche Eingabefelder [Seite 406] und Optionale Eingabefelder [Seite 407]. Ausgabe: Die zugeordneten Ausgabefelder enthalten die folgenden Ergebnisse: Tabelle 167: Name des Ausgabefelds Ausgabewert Adresszeile 201 MAIN ST Zuordnungsebene PRE Ländercode US Entfernung 0.4180 Ortschaft1 LA CROSSE POI_Name US BANK POI_Typ 6000 Postleitzahl1 54601 Primärer_Name1 MAIN Primärnummer 201 Typ1_Primär ST Region1 WI Weitere Informationen über Ausgabefelder für dieses Szenario finden Sie unter Verfügbare Ausgabefelder [Seite 407]. 17.3.2.3.1 Erforderliche Eingabefelder Szenario 2 Bei den erforderlichen Eingabefeldern muss mindestens ein Eingabefeld in jeder Kategorie zugeordnet werden. 406 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität Tabelle 168: Kategorie Adresse Ergebnisse mit einem Datensatz Ergebnisse mit mehreren Datensätzen Name des Eingabefelds Name des Eingabefelds Adresszeile Breitengrad Land Längengrad Ortschaft1-4 Postleitzahl Postleitzahl1-2 Primärer_Name1-4 Primärnummer Suffix1_Primär Präfix1_Primär Primärer_Bereich_Hoch Primärer_Bereich_Niedrig Typ1-4_Primär Region1-2 Max. Datensätze - Option_Max_Datensätze Suchfilter Option_Radius Option_Radius Name_des_Suchfilters Name_des_Suchfilters Typ_des_Suchfilters Typ_des_Suchfilters 17.3.2.3.2 Optionale Eingabefelder Szenario 2 Tabelle 169: Kategorie Adresse POI 17.3.2.3.3 Ergebnisse mit einem Datensatz Ergebnisse mit mehreren Datensätzen Name des Eingabefelds Name des Eingabefelds POI_Name POI_Name POI_Typ POI_Typ Verfügbare Ausgabefelder Szenario 2 Alle Ausgabefelder sind optional. Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 407 Für ein Ergebnis mit einem Datensatz sind die Ausgabefelder die Ergebnisse für die räumliche Suche. Für Ergebnisse mit mehreren Datensätzen sind die Ausgabefelder in den Kategorien "Zuordnungsebene" und "Breitengrad/Längengrad" die Ergebnisse für die Referenzadresszuweisung. Ausgabefelder in der Kategorie "Ergebnis" sind die Ergebnisse für die Rückwärtsgeokodierung. Tabelle 170: Kategorie Adresse Ergebnisse mit einem Datensatz Ergebnisse mit mehreren Datensätzen Name des Ausgabefelds Name des Ausgabefelds Adresszeile - Ländercode Ortschaft1-4 Postleitzahl Postleitzahl1-2 Primärer_Name1-4 Primärnummer Suffix1_Primär Präfix1_Primär Primärer_Bereich_Hoch Primärer_Bereich_Niedrig Typ1-4_Primär Region1-2 Adresse POI POI_Name - POI_Typ Zuordnungsebene Zensus Zuordnungsebene Zuordnungsebene Zuordnungsebene_Ortschaft Zuordnungsebene_Ortschaft Zuordnungsebene_Postleitzahl Zuordnungsebene_Postleitzahl Zensustrakt_Zensusblock - Zensustrakt_Zensusblock_Gruppe Landkreiscode_Verwaltung Ortschaft1_Code_Verwaltung Region1_Code_Verwaltung Städtischer_Statistikbereichscode Gemeindecode Statistikbereichscode Entfernung Entfernung - Infocode Infocode Infocode 408 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität Kategorie Ergebnisse mit einem Datensatz Ergebnisse mit mehreren Datensätzen Name des Ausgabefelds Name des Ausgabefelds Breitengrad Breitengrad Breitengrad_Ortschaft Breitengrad_Ortschaft Breitengrad_Postleitzahl Breitengrad_Postleitzahl Breitengrad_Primärnummer Breitengrad_Primärnummer Längengrad Längengrad Längengrad_Ortschaft Längengrad_Ortschaft Längengrad_Postleitzahl Längengrad_Postleitzahl Längengrad_Primärnummer Längengrad_Primärnummer Einwohnerzahl Einwohnerzahl_Ortschaft1 - Ergebnisse - Ergebnisliste Breitengrad/Längengrad Ergebnisliste_Anzahl Straßenseite Primäradresse_Seite Primäradresse_Seite 17.3.3 Textbasierte POI-Suche Im textbasierten POI-Suchmodus verwendet die Geocoder-Transformation Adressfelder und POI-Namen- oder Typfelder als Suchkriterien, um einen Abgleich mit Points of Interest auszuführen. Die Ergebnisse werden in das XML-Ausgabefeld "Ergebnisliste" ausgegeben. Die Anzahl von mehreren Datensätzen wird durch das Eingabefeld "Option_Max_Datensätze" (falls zugeordnet und gefüllt) oder der Option "Max. Datensätze" bestimmt. 17.3.3.1 Feldzuordnung der textbasierten POI-Suche In den folgenden Tabellen werden die Eingabe- und Ausgabefelder aufgeführt, die erforderlich bzw. optional sind oder im textbasierten POI-Suchmodus nicht zugeordnet werden können. Je mehr Eingabedaten Sie bereitstellen können, desto besser sind die zurückgegebenen Ergebnisse. Eingabefeldzuordnung Im textbasierten POI-Suchmodus muss mindestens ein Eingabefeld in der Kategorie "Adresse POI" zugeordnet sein, wobei es sich um den Hauptunterschied zwischen dem textbasierten POI-Such- und dem Adressgeokodierungsmodus handelt. Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 409 Tabelle 171: Eingabefeldkategorie Adressgeokodierungsmodus Adresse Mindestens einer erforderlich Adresse POI Mindestens einer erforderlich Breitengrad/Längengrad - Max. Datensätze Mindestens einer erforderlich Suchfilter - Ausgabefeldzuordnung Tabelle 172: Ausgabefeldkategorie Adressgeokodierungsmodus Adresse - Adresse POI - Zuordnungsebene - Zensus - Entfernung - Infocode Optional Breitengrad/Längengrad - Einwohnerzahl - Ergebnisse Optional Straßenseite - 17.3.3.2 Textbasiertes POI-Suchszenario Szenario: Sie verwenden eine Adresse und POI-Informationen, um eine Liste potenzieller POI-Übereinstimmungen zu ermitteln. Anzahl der Ausgabeergebnisse\ {4}: Mehrere Datensätze. Die Anzahl der Datensätze wird durch das Eingabefeld "Option_Max_Datensätze" (falls gefüllt) oder der Option "Max. Datensätze" bestimmt. In den folgenden Abschnitten werden die erforderlichen Eingabefelder und verfügbaren Ausgabefelder beschrieben, die Ergebnisse für dieses Szenario liefern. Außerdem wird das Szenario anhand von Beispieldaten veranschaulicht. 410 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität Erforderliche Eingabefelder Bei den erforderlichen Eingabefeldern muss mindestens ein Eingabefeld in jeder Kategorie zugeordnet werden. Das Feld "Land" muss zugeordnet werden. Je mehr Eingabedaten Sie bereitstellen können, desto besser sind die zurückgegebenen Ergebnisse. Tabelle 173: Kategorie Name des Eingabefelds Adresse Land (erforderlich) Ortschaft1-4 Postleitzahl1-2 Primärer_Name1-4 Primärnummer Suffix1_Primär Präfix1_Primär Typ1-4_Primär Region1-2 Adresse POI POI_Name POI_Typ Max. Datensätze Option_Max_Datensätze Optionale Eingabefelder Nicht zutreffend. Verfügbare Ausgabefelder Alle Ausgabefelder sind optional. Tabelle 174: Kategorie Name des Ausgabefelds Infocode Infocode Ergebnisse Ergebnisliste Ergebnisliste_Anzahl Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 411 Beispiel Im folgenden Beispiel wird ein Szenario veranschaulicht, in dem mit der textbasierten POI-Suche eine Liste der potenziellen Zielübereinstimmungen bestimmt wird (alle BUSINESS-OBJECTS-Datensätze in der Front Street). Eingabe: Sie ordnen Eingabefelder zu, die folgende Daten enthalten: Tabelle 175: Name des Eingabefelds Eingabewert Land US Postleitzahl1 54601 Postleitzahl2 4023 Primärer_Name1 Front Typ1_Primär St. POI_Name BUSINESS OBJECTS Option_Max_Datensätze 10 Ausgabe: Die zugeordneten Ausgabefelder enthalten die folgenden Ergebnisse in einem Datensatz: Tabelle 176: Name des Ausgabefelds Ausgabewert Ergebnisliste Ausgabe im XML-Format. Das Beispiel ist unten zu sehen. Ergebnisliste_Anzahl 1 Ergebnisliste XML: Das XML-Ergebnis für dieses Beispiel enthält einen Datensatz. <RESULT_LIST> <RECORD> <ADDRESS_LINE>332 FRONT ST</ADDRESS_LINE> <ASSIGNMENT_LEVEL>PRE</ASSIGNMENT_LEVEL> <COUNTRY_CODE>US</COUNTRY_CODE> <DISTANCE>0.3340</DISTANCE> <LATITUDE>43.811616</LATITUDE> <LOCALITY1>LA CROSSE</LOCALITY1> <LONGITUDE>-91.256695</LONGITUDE> <POI_NAME>BUSINESS OBJECTS</POI_NAME> <POI_TYPE>5800</POI_TYPE> <POSTCODE>56001-4023</POSTCODE> <POSTCODE1>56001</POSTCODE1> <POSTCODE2>4023</POSTCODE2> <PRIMARY_NAME1>FRONT</PRIMARY_NAME1> <PRIMARY_NUMBER>332</PRIMARY_NUMBER> <PRIMARY_TYPE1>ST</PRIMARY_TYPE1> <RANKING>1</RANKING> <REGION1>WI</REGION1> </RECORD> </RESULT_LIST> 412 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität 17.3.4 Verstehen Ihrer Ausgabe Breitengrad und Längengrad Bei einer Ausgabe von der Geocoder-Transformation stehen Ihnen Breiten- und Längengraddaten zur Verfügung. Breitengrad und Längengrad sind in der Ausgabe mittels Dezimalgrad bezeichnet, beispielsweise 12.12345. Bei Breitengrad (0-90 Grad nördlich oder östlich des Äquators) ist dem Ausgabewert ein Minuszeichen vorangestellt, wenn sich der Standort südlich des Äquators befindet. Bei Längengrad (0-180 Grad östlich oder westlich des Greenwich-Meridians in London, England) ist dem Ausgabewert ein Minuszeichen vorangestellt, wenn der Standort innerhalb von 180 Grad westlich von Greenwich liegt. Zuordnungsebene Basierend auf dem Ausgabefeld "Zuordnungsebene" wird die Genauigkeit der Zuordnung verständlich. Der Rückgabecode von PRE bedeutet, dass Sie die feinste Tiefe der für den exakten Standort verfügbaren Zuordnung erhalten. Die zweitfeinste Zuordnungstiefe ist ein Rückgabecode von PRI, also der Primäradressbereich oder die Hausnummer. Die allgemeinste Ausgabeebene ist entweder P1 (Postleitzahlenebene) oder L1 (Ortschaftsebene), je nach dem von Ihnen in der Option "Optimale Zuordnungsebene" gewählten Wert. Mehrere Ergebnisse Bei Ergebnissen mit mehreren Datensätzen wird das Ausgabefeld "Ergebnisliste" als XLM ausgegeben und kann je nach den verfügbaren Daten folgende Ausgabe enthalten. Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 413 Tabelle 177: Kategorie Name des Ausgabefelds Adresse Adresszeile Ländercode Ortschaft1-4 Postleitzahl Postleitzahl1-2 Primärer_Name1-4 Primärnummer Suffix1_Primär Präfix1_Primär Primärer_Bereich_Hoch Primärer_Bereich_Niedrig Typ1-4_Primär Region1-2 Adresse POI POI_Name POI_Typ Zuordnungsebene Zuordnungsebene Entfernung Entfernung Breitengrad/Längengrad Breitengrad Längengrad Rangfolge Rangfolge Standardisieren von Adressinformationen Die von Anbietern gelieferten Geokodierungsdaten sind nicht standardisiert. Um die Adressdaten zu standardisieren, die von der Geocoder-Transformation ausgegeben werden, können Sie eine Global Address Cleanse- oder USA Regulatory Address Cleanse-Transformation in den Datenfluss hinter der GeocoderTransformation einfügen. Wenn Sie die Geocoder-Transformation so eingerichtet haben, dass sie mehrere Datensätze ausgibt, muss die Verschachtelung der Adressinformationen in der XML-Ausgabezeichenfolge erst aufgehoben werden, bevor die Adressinformationen bereinigt werden können. Weitere Informationen Referenzhandbuch: Transformationen, Data-Quality-Transformationen, Geocoder, Geocoder-Optionen 414 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität 17.3.5 Arbeiten mit sonstigen Transformationen Die Geocoder-Transformation wird normalerweise in Verbindung mit der Global Address Cleanse- oder USA Regulatory Address Cleanse-Transformation verwendet. Global-Address-Cleanse-Transformation Damit die Geocoder-Transformation die genauesten Informationen zurückgibt, sollten Sie sicherstellen, dass die Ausgabefelder der Global Address Cleanse-Transformation wie folgt den Eingabefeldern der GeocoderTransformation zugeordnet sind: Tabelle 178: Global Address Cleanse-Ausgabe Geocoder-Eingabefeld ISO-Ländercode_2Zeich Land Postleitzahl1 Postleitzahl1 Postleitzahl2 Postleitzahl2 Primärer_Name1 Primärer_Name1 Primärnummer Primärnummer Suffix1_Primär Suffix1_Primär Präfix1_Primär Präfix1_Primär Typ1_Primär Typ1_Primär Symbol_Region1 Ortschaft1 Es empfiehlt sich außerdem, die Standardisierungsoptionen der Global-Address-Cleanse-Transformation wie folgt einzustellen: Tabelle 179: Global Address Cleanse-Standardisierungsoption Wert Ortschaft zuweisen Konvertieren Stil der Himmelsrichtung Short Primärtypformat Short Tipp Postalische Adresse im Vergleich zur administrativen Adresse: Die Global Address Cleanse-Transformation verwendet postalische Adressen, während Anbieter der Geocoder-Transformation (NAVTEQ und TOMTOM) administrative Adressen verwenden. Obwohl mit postalischen Adressen eine postalische Ausrichtung ausgeführt wird, kommt es zu einigen Lücken. Beispielsweise kann die Ortschaft aus der Global Address Cleanse-Transformation für eine kanadische Adresse TORONTO zurückgeben, im Geocoder-Verzeichnis jedoch NORTH YORK gespeichert sein. Wenn in diesem Fall das Feld "Ortschaft1" bei der Eingabe zugeordnet wird, führt dies zu einem Fehler mit der Information, dass die Adresse nicht gefunden wurde. Um dieses Problem zu umgehen, können Sie die Zuordnung des Eingabefelds "Ortschaft1" entfernen, um eine bessere Geokodierungszuordnung zu erzielen. Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 415 17.4 Übereinstimmung 17.4.1 Abgleich und Konsolidierung in Data Services und Information Steward Wenn eine manuelle Prüfung erforderlich ist, verwenden Sie SAP Data Services für die automatische Implementierung des Gesamtprozesses für Abgleich und Konsolidierung. Dieser Prozess stellt die Übereinstimmungsgruppen für die manuelle Prüfung in SAP Information Steward bereit. Berücksichtigen Sie bei der Implementierung dieses Prozesses die folgenden Faktoren: ● Stellen Sie nur verdächtige Übereinstimmungsgruppen (Gruppen, die der festgelegten Übereinstimmungspunktzahl bzw. dem festgelegten Schwellenwert nicht entsprechen) für die manuelle Prüfung bereit? Oder stellen Sie sämtliche Übereinstimmungsergebnisse für die Übereinstimmungsprüfung bereit und lassen die Daten-Steward die verdächtigen Übereinstimmungsgruppen oder eindeutigen Datensätze manuell in die Gruppen verschieben, in die sie gehören? Als Zielgruppe kann in diesem Fall eine verdächtige Gruppe oder eine „Übereinstimmungskonfidenz“-Gruppe dienen. ● Möchten Sie das Anlegen optimaler Datensätze in Information Steward aktivieren? Oder möchten Sie, dass die manuelle Prüfung von Information Steward nur verdächtige Übereinstimmungsgruppen nach Bedarf ändert und Data Services die optimalen Datensätze nach Abschluss der manuellen Prüfung anlegt? ● Wenn Sie das Anlegen optimaler Datensätze in Information Steward aktivieren möchten, wann legen Sie die optimalen Datensätze für die Übereinstimmungskonfidenz-Gruppen an? ○ Einen optimalen Datensatz für alle Übereinstimmungsgruppen in einer Datenmenge manuell anzulegen, ist möglicherweise nicht praktisch. ○ Wenn Sie jedoch bereits Übereinstimmungskonfidenz-Gruppen in Data Services konsolidiert haben, haben Sie auch bereits die ursprünglichen Übereinstimmungsgruppen so geändert, dass sie die optimalen Datensatzwerte enthalten, und können diese geänderten Übereinstimmungsgruppen nicht für die manuelle Prüfung in Information Steward bereitstellen. Folgende Ansätze für die Übereinstimmungsprüfung sind möglich: ● Data Stewards und Fachexperten sind nur an der manuellen Prüfung von verdächtigen Übereinstimmungsgruppen beteiligt. Sie können die verdächtigen Übereinstimmungsgruppen falls nötig bearbeiten und den optimalen Datensatz für die jeweilige Gruppe anlegen. 1. Der Job Data Services führt den automatischen Abgleich durch, identifiziert verdächtige Übereinstimmungsgruppen und befüllt eine Staging-Datenbank ausschließlich mit verdächtigen Übereinstimmungsgruppen. In diesem Szenario müssen „Übereinstimmungskonfidenz-Gruppen“ von „verdächtigen Übereinstimmungsgruppen“ getrennt werden. Der optimale Datensatz kann für die „Übereinstimmungskonfidenz-Gruppen“ angelegt und diese Übereinstimmungsgruppen können in Data Services konsolidiert werden. Dieser Prozess kann durch das Routing der „Übereinstimmungskonfidenz-Gruppen“ an eine weitere Match-Transformation erfolgen, die für das Anlegen von optimalen Datensätzen aus bereits abgeglichenen Datensatzgruppen konfiguriert ist. 2. Data Stewards und Fachexperten prüfen die „verdächtigen Übereinstimmungsgruppen“ in Information Steward und nehmen ggf. Korrekturen vor (z.B. Übereinstimmungen aufheben oder Datensätze verschieben). Sie können den optimalen Datensatz für diese Übereinstimmungsgruppen anlegen. ● Data Stewards und Fachexperten sind an der manuellen Prüfung und Korrektur aller Übereinstimmungsgruppen beteiligt, das Anlegen von optimalen Datensätzen und die Konsolidierungslogik verbleiben jedoch in Data Services. 416 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität 1. Der Job Data Services führt den automatischen Abgleich durch und befüllt die Staging-Datenbank mit allen Übereinstimmungsergebnissen. Eine Übereinstimmungsergebnistabelle in der Staging-Datenbank enthält verdächtige Übereinstimmungsgruppen, „Übereinstimmungskonfidenz“-Gruppen und eindeutige Datensätze. 2. Data Stewards und Fachexperten prüfen die verdächtigen Übereinstimmungsgruppen in Information Steward und nehmen ggf. Korrekturen vor. Sie können Datensätze zwischen den verdächtigen Übereinstimmungsgruppen und den „Übereinstimmungskonfidenz“-Gruppen verschieben oder eindeutige Sätze in die entsprechende Übereinstimmungsgruppe einfügen. 3. Nach Abschluss der Übereinstimmungsprüfung werden alle Übereinstimmungsgruppen in einem separaten Data-Services-Job verarbeitet, der den optimalen Datensatz anlegt und alle Übereinstimmungsgruppen konsolidiert. Dieser Prozess kann durch eine weitere Match-Transformation erfolgen, die für das Anlegen von optimalen Datensätzen aus bereits abgeglichenen Datensatzgruppen konfiguriert ist. Hinweis Um Beispiele für das Anlegen von optimalen Datensätzen mithilfe von Information Steward oder Data Services zu erhalten, laden Sie die Data-Quality-Management-Match-Blueprints herunter. Weitere Informationen zu Blueprints finden Sie unter http://scn.sap.com/docs/DOC-8820 . 17.4.2 Abgleichsstrategien Nachfolgend finden Sie ein paar Beispiele zu Strategien, die Ihnen veranschaulichen, wie Sie an die Einrichtung Ihres Übereinstimmungsdatenflusses herangehen können. Tabelle 180: Strategie Beschreibung Einfache Übereinstimmung Verwenden Sie diese Strategie, wenn Ihre Business-Regeln für Übereinstimmungen aus ei nem einzelnen Übereinstimmungskriterium für das Identifizieren von Beziehungen in Konsu menten-, Geschäfts- oder Produktdaten bestehen. Konsumentenhaushalt Verwenden Sie diese Strategie, wenn Ihre übereinstimmenden Geschäftsregeln aus mehre ren Ebenen von Konsumentenbeziehungen besteht, beispielsweise Wohnungsübereinstim mungen, Familienübereinstimmungen und Einzelübereinstimmungen. Unternehmenshaushalt Verwenden Sie diese Strategie, wenn Ihre Business-Regeln für Übereinstimmungen aus mehreren Ebenen von Unternehmensbeziehungen bestehen, wie Unternehmensüberein stimmungen, Tochtergesellschaftsübereinstimmungen und Kontaktübereinstimmungen. Multinationale Konsumenten übereinstimmung Verwenden Sie diese Übereinstimmungsstrategie, wenn Ihre Daten aus mehreren Ländern bestehen und Ihre übereinstimmenden Geschäftsregeln in den verschiedenen Ländern un terschiedlich sind. Person auf verschiedene Weise identifizieren Verwenden Sie diese Strategie, wenn Ihre übereinstimmenden Geschäftsregeln aus mehre ren Übereinstimmungskriterien zum Identifizieren von Beziehungen bestehen und Sie die Überlappung zwischen all diesen Definitionen ermitteln möchten. Überlegen Sie sich erst Antworten auf diese Fragen, bevor Sie sich für eine Übereinstimmungsstrategie entscheiden. ● Aus was bestehen meine Daten? (Kundendaten, internationale Daten usw.) Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 417 ● Welche Felder möchte ich vergleichen? (Nachname, Unternehmen usw.) ● Welche relativen Stärken und Schwächen weisen die Daten in diesen Feldern auf? Tipp Sie erhalten bessere Ergebnisse, wenn Sie Ihre Daten vor dem Abgleich bereinigen. Auch ein DatenProfiling kann Ihnen bei der Beantwortung dieser Frage behilflich sein. ● Welches Endergebnis möchte ich haben, wenn der Übereinstimmungsjob abgeschlossen ist? (Ein Datensatz pro Familie, pro Unternehmen usw.) Weitere Informationen Assoziationsabgleich [Seite 494] 17.4.3 Übereinstimmungskomponenten Die grundlegenden Komponenten bei der Übereinstimmung sind folgende: ● Übereinstimmungssätze ● Übereinstimmungsebenen ● Übereinstimmungskriterium Übereinstimmungssätze Ein Übereinstimmungssatz wird im Arbeitsbereich durch eine Match-Transformation dargestellt. Jeder Übereinstimmungssatz kann über eigene Zerlegungsgruppen, Übereinstimmungskriterien und Priorisierungen verfügen. Ein Übereinstimmungssatz dient drei Zwecken: ● Er lässt nur ausgewählte Daten in einer bestimmten Gruppe von Übereinstimmungskriterien für den möglichen Vergleich zu (z.B. Ausschließen leerer SVNs, internationaler Adressen usw.). ● Er ermöglicht das Stapeln zusammengehöriger Übereinstimmungsszenarien, um einen Übereinstimmungssatz für mehrere Übereinstimmungsebenen anzulegen. ● Er ermöglicht die Berücksichtigung von mehreren Übereinstimmungssätzen für die Assoziation in einem Associate-Übereinstimmungssatz. 418 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität Übereinstimmungsebenen Eine Übereinstimmungsebene ist ein Indikator für den Typ der Übereinstimmung, beispielsweise Übereinstimmung bei Einzelperson, Familie, Anwohner, Unternehmen usw. Eine Übereinstimmungsebene bezieht sich nicht auf ein bestimmtes Kriterium, sondern auf die breite Übereinstimmungskategorie. Sie können über beliebig viele Übereinstimmungsebenen verfügen. Der Match-Assistent beschränkt die Anzahl der Ebenen bei der Einrichtung jedoch auf drei (später können weitere Ebenen hinzugefügt werden). Sie können die einzelnen Übereinstimmungsebenen in einem Übereinstimmungssatz mit immer stärkerer Einschränkung definieren. Bei der Übereinstimmung mit mehreren Ebenen werden nur die jeweils übereinstimmenden Datensätze für den Vergleich an die nächste Übereinstimmungsebene (z.B. Anwohner, Familie, Einzelperson) übergeben. Tabelle 181: Übereinstimmungskom Beschreibung ponente Familie Mit dem Übereinstimmungstyp Familie wird festgestellt, ob zwei Personen auf der Basis der Da ten in ihrem Datensatz als Mitglieder derselben Familie angesehen werden sollen. Die MatchTransformation vergleicht den Nachnamen und die Adressdaten. Eine Übereinstimmung bedeu tet, dass die beiden Datensätze Mitglieder derselben Familie darstellen. Das Ergebnis der Über einstimmung ist ein einziger Datensatz pro Familie. Einzelperson Mit dem Übereinstimmungstyp Einzelperson wird festgestellt, ob zwei Datensätze auf der Basis der Daten in den Datensätzen dieselbe Person darstellen. Die Match-Transformation vergleicht den Vornamen, den Nachnamen und die Adressdaten. Eine Übereinstimmung bedeutet, dass die beiden Datensätze dieselbe Person darstellen. Das Ergebnis der Übereinstimmung ist ein einziger Datensatz pro Einzelperson. Anwohner Mit dem Übereinstimmungstyp Anwohner wird festgestellt, ob zwei Datensätze auf der Basis der Daten in den Datensätzen als Anwohner desselben Wohnsitzes angesehen werden sollen. Die Match-Transformation vergleicht die Adressdaten. Eine Übereinstimmung bedeutet, dass die bei den Datensätze Mitglieder desselben Haushalts darstellen. Dieser Übereinstimmungstyp ist nicht identisch mit dem Übereinstimmungstyp Familie, bei dem auch die Daten zum Nachnamen vergli chen werden. Das Ergebnis der Übereinstimmung ist ein einziger Datensatz pro Wohnsitz. Unternehmen Mit dem Übereinstimmungstyp Unternehmen wird festgestellt, ob zwei Datensätze dasselbe Un ternehmen darstellen. Dieser Übereinstimmungstyp umfasst Vergleiche der Unternehmens- und Adressdaten. Eine Übereinstimmung bedeutet, dass die beiden Datensätze dasselbe Unterneh men darstellen. Das Ergebnis der Übereinstimmung ist ein einziger Datensatz pro Unternehmen. Unternehmen-Einzelper Mit dem Übereinstimmungstyp Unternehmens-Einzelperson wird festgestellt, ob zwei Datensätze son auf der Basis der Daten in den Datensätzen dieselbe Person im selben Unternehmen darstellen. Bei diesem Übereinstimmungstyp werden Vorname, Nachname, Unternehmensname und Ad ressdaten verglichen. Eine Übereinstimmung bedeutet, dass die beiden Datensätze dieselbe Per son im selben Unternehmen darstellen. Das Ergebnis der Übereinstimmung ist ein einziger Daten satz pro Einzelperson pro Unternehmen. Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 419 Übereinstimmungskriterium Das Übereinstimmungskriterium gibt das Feld an, das für den Abgleich verwendet werden soll. Sie können Kriterienoptionen verwenden, um Business-Regeln für den Abgleich mit jedem dieser Felder anzugeben. Mit diesen können Sie steuern, wie genau die Daten übereinstimmen müssen, damit sie als Übereinstimmung angesehen werden. Beispielsweise können Sie angeben, dass Vornamen eine Ähnlichkeit von 85 % aufweisen müssen, dass jedoch auch der Anfangsbuchstabe des Vornamens mit einem ausgeschriebenen Vornamen übereinstimmen kann und dass ein Vorname mit einem weiteren Vornamen übereinstimmen kann. ● Das Übereinstimmungskriterium für die Familienebene kann den Familiennamen (Nachnamen) und die Adresse oder den Familiennamen (Nachnamen) und die Telefonnummer umfassen. ● Das Übereinstimmungskriterium für die Einzelpersonenebene kann den vollständigen Namen und die Adresse, den vollständigen Namen und die SVN oder den vollständigen Namen und die E-Mail-Adresse umfassen. ● Das Übereinstimmungskriterium für die Unternehmensebene kann den Unternehmensnamen und die Adresse, den Unternehmensnamen und den SIC-Code (Standard Industrial Classification) oder den Unternehmensnamen und die DUNS-Nummer (Data Universal Numbering System) umfassen. 17.4.4 Übereinstimmungsassistent 17.4.4.1 Übereinstimmungsassistent Mit dem Match-Assistenten können schnell Übereinstimmungsdatenflüsse konfiguriert werden, ohne dass Sie jede einzelne Transformation manuell anlegen müssen, die zum Durchführen der Aufgabe erforderlich ist. Funktionen des Übereinstimmungsassistenten Der Match-Assistent: ● Legt alle erforderlichen Transformationen zum Durchführen der gewählten Übereinstimmungsstrategie an. ● Wendet Standardwerte auf Ihre Übereinstimmungskriterien basierend auf der gewählten Strategie an. ● Legt die resultierenden Transformationen im Arbeitsbereich ab, verbunden mit der ausgewählten vorgelagerten Transformation. ● Ermittelt die entsprechenden vorgelagerten Felder und ordnet sie diesen automatisch zu. Vom Übereinstimmungsassistenten nicht ausgeführte Funktionen Der Match-Assistent stellt Ihnen eine grundlegende Übereinstimmungskonfiguration zur Verfügung, die Sie ggf. an Ihre Geschäftsregeln anpassen müssen. Der Match-Assistent: 420 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität ● Ändert keine ihn durchlaufenden Daten. Um Nichtstandardeinträge oder fehlende Daten zu korrigieren, lagern Sie dem Abgleichsprozess eine der Address-Cleanse-Transformationen sowie eine Data CleanseTransformation vor. ● Verbindet die generierten Match-Transformationen nicht mit nachgelagerten Transformationen wie z.B. einem Loader. Sie müssen diese Transformationen selbst verbinden. ● Es können keine regelbasierten Werte oder Werte für gewichteten Vergleich zum Abgleich festgelegt werden. Der Match-Assistent verfügt über einen Standard für die optimale Vorgehensweise, mit dem diese Werte für Sie festgelegt werden. Sie können Optionswerte ändern, um Sie an Ihre Geschäftsregeln anzupassen. Weitere Informationen Kombinationsmethode [Seite 463] 17.4.4.2 Vorbereitende Schritte Bereiten Sie einen Datenfluss für den Übereinstimmungsassistenten vor. Damit er möglichst großen Nutzen hat, schließen Sie Folgendes in den Datenfluss ein, bevor Sie den MatchAssistenten starten. ● Schließen Sie einen Reader in den Datenfluss ein. Eventuell möchten Sie einen Abgleich bei einem bestimmten Eingabefeld vornehmen, der von unseren Data-Cleansing-Transformationen nicht ausgeführt wird. ● Schließen Sie eine der Address-Cleansing-Transformationen und die Data Cleanse-Transformation ein. Der Match-Assistent ist am leistungsfähigsten, wenn die von Ihnen abgeglichenen Daten bereits bereinigt und in diskrete vorgelagerte Felder im Datenfluss geparst wurden. ● Wenn Sie nur bei Adressfeldern einen Abgleich vornehmen möchten, müssen Sie diese unbedingt über die Data Cleanse-Transformation weiterleiten. Andernfalls stehen sie der Match-Transformation (und dem Match-Assistenten) nicht zur Verfügung. Diese Regel trifft auch zu, wenn sich die Data CleanseTransformation vor einer Address-Cleanse-Transformation befindet. 17.4.4.3 Verwendung des Übereinstimmungsassistenten 17.4.4.3.1 Auswählen einer Übereinstimmungsstrategie Der MatchAssistent fordert Sie zunächst auf, eine Übereinstimmungsstrategie auf der Grundlage der Anforderungen Ihrer Business-Regeln zu wählen. Der Pfad durch den Match-Assistenten hängt von der hier gewählten Strategie ab. Als Entscheidungshilfe für die für Sie am besten geeignete Strategie dienen die folgenden Beschreibungen: Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 421 ● Einfache Übereinstimmung. Verwenden Sie diese Strategie, wenn Ihre Business-Regeln für Übereinstimmungen aus einem einzelnen Übereinstimmungskriterium für das Identifizieren von Beziehungen in Konsumenten-, Geschäfts- oder Produktdaten bestehen. ● Konsumentenhaushalt. Verwenden Sie diese Strategie, wenn Ihre Business-Regeln für Übereinstimmungen aus mehreren Ebenen von Konsumentenbeziehungen bestehen, wie Wohnübereinstimmungen, Familienübereinstimmungen und Einzelübereinstimmungen. ● Unternehmenshaushalt. Verwenden Sie diese Strategie, wenn Ihre Business-Regeln für Übereinstimmungen aus mehreren Ebenen von Unternehmensbeziehungen bestehen, wie Unternehmensübereinstimmungen, Tochtergesellschaftsübereinstimmungen und Kontaktübereinstimmungen. ● Multinationale Konsumentenübereinstimmung. Verwenden Sie diese Strategie, wenn Ihre Daten aus mehreren Ländern stammen und Ihre Business-Regeln für Übereinstimmungen für die verschiedenen Länder unterschiedlich sind. Hinweis Bei der multinationalen Konsumentenübereinstimmungsstrategie wird ein Datenfluss eingerichtet, bei dem Latin1-Daten erwartet werden. Wenn Sie Unicode-Übereinstimmung verwenden möchten, müssen Sie den Datenfluss nach der Anlage bearbeiten. ● Person auf verschiedene Weise identifizieren. Verwenden Sie diese Strategie, wenn Ihre Business-Regeln für Übereinstimmungen aus mehreren Übereinstimmungskriterien zum Identifizieren von Beziehungen bestehen und Sie die Überlappung zwischen all diesen Definitionen ermitteln möchten. Quellstatistik Wenn Sie Quellstatistik für Berichte generieren möchten, vergewissern Sie sich, dass es in allen Datenquellen ein Feld gibt, das den physischen Quellwert enthält. Um Quellstatistik für die Übereinstimmungsberichte zu generieren, markieren Sie das Kontrollkästchen Statistik für Quellen generieren, und wählen Sie dann ein Feld, das den physischen Quellwert enthält. Weitere Informationen Unicode-Abgleich [Seite 495] Assoziationsabgleich [Seite 494] 17.4.4.3.2 Ermitteln von Übereinstimmungskriterien Kriterien repräsentieren die Daten, mit deren Hilfe Sie Übereinstimmungen finden möchten. In diesem Fenster definieren Sie diese Kriterien für die einzelnen von Ihnen verwendeten Übereinstimmungssätze. Übereinstimmungssätze vergleichen Daten, um ähnliche Datensätze zu finden. Dabei arbeiten sie unabhängig innerhalb jeder von Ihnen (zu einem späteren Zeitpunkt im Übereinstimmungsassistenten) festgelegten 422 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität Zerlegungsgruppe. Die Datensätze in einer Zerlegungsgruppe werden nicht mit den Datensätzen in einer anderen Zerlegungsgruppe verglichen. Um die Daten zu finden, die in allen Feldern übereinstimmen, müssen Sie einen einzigen Übereinstimmungssatz mit mehreren Feldern verwenden. Um die Daten zu finden, die nur in einer bestimmten Kombination von Feldern übereinstimmen, müssen Sie mehrere Übereinstimmungssätze mit zwei Feldern verwenden. Wenn Sie mit den Daten von Studenten oder Snowbirds arbeiten, kann eine Person bei gleichem Namen unter Umständen mehrere gültige Adressen haben. Wählen Sie eine Kombination von Feldern aus, die am besten zeigen, welche Informationen sich überlappen, wie der Nachname und die SVN. Tabelle 182: Daten1 Daten2 Daten3 Daten4 R. Carson 1239 Whistle Lane Columbus, Ohio 555-23-4333 Robert T. Carson 52 Sunbird Suites Tampa, Florida 555-23-4333 1. Geben Sie an, wie oft Sie eine Person gefunden haben. Hierdurch wird die entsprechende Anzahl von Übereinstimmungssätzen (Transformationen) im Datenfluss angelegt. 2. Im Feld Name wird der Standard-Übereinstimmungssatzname angezeigt. Wählen Sie in der Liste Übereinstimmungssätze einen Übereinstimmungssatz aus, und geben Sie bei Bedarf einen aussagekräftigeren Namen ein. 3. Wählen Sie für jeden Übereinstimmungssatz die Kriterien aus, für die nach Übereinstimmungen gesucht werden soll. Zu einem späteren Zeitpunkt werden Sie diesen Kriterien Felder aus vorgelagerten Transformationen zuweisen. 4. Wählen Sie die Option aus, die Sie für den Vergleich in der Spalte "Vergleichen mit" verwenden möchten. Die Optionen hängen von den ausgewählten Kriterien ab. Folgende Vergleichsoptionen sind verfügbar: ○ Feldähnlichkeit ○ Wortähnlichkeit ○ Numerische Differenz ○ Numerische prozentuale Differenz ○ Geoproximität 5. Optional: Wenn Sie nach einer Übereinstimmung für "Benutzerdefiniert" suchen, geben Sie in der Spalte "Benutzerdefinierter Name" einen Namen für das benutzerdefinierte Kriterium ein. 6. Optional: Wenn Sie nach einer Übereinstimmung für "Benutzerdefiniert" suchen, geben Sie in zwei als Übereinstimmung angesehenen Datensätzen an, wie stark die Daten dem Kriterium ähneln müssen. Die resultierenden Werte bestimmen, wie stark die Ähnlichkeit der Daten während des Vergleichsprozesses nur für dieses Kriterium sein soll. Nach dem Auswählen einer Strategie können Sie die Werte für jede der Vergleichsregeloptionen ändern, um Ihre spezifischen Übereinstimmungsanforderungen zu erfüllen. Wählen Sie eine der folgenden Optionen aus der Liste in der Spalte "Benutzerdefinierte Genauigkeit" aus: ○ Exakt: Daten in diesem Kriterium müssen exakt identisch sein; es sind keine Abweichungen bei den Daten zulässig. ○ Eng: Daten in diesem Kriterium müssen eine große Ähnlichkeit aufweisen; eine geringe Abweichung zwischen den Daten ist zulässig. Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 423 ○ Mittel: Daten in diesem Kriterium müssen eine mittlere Ähnlichkeit aufweisen; eine mittlere Abweichung zwischen den Daten ist zulässig. ○ Lose: Daten in diesem Kriterium können eine geringe Ähnlichkeit aufweisen; eine größere Abweichung zwischen den Daten ist zulässig. 17.4.4.3.3 Definieren von Übereinstimmungsebenen Übereinstimmungsebenen ermöglichen die Definition von Abgleichprozessen auf bestimmten Ebenen, die logisch zusammenhängen. Übereinstimmungsebenen beziehen sich auf ein breiteres Abgleichspektrum als spezifische Abgleichregeln. Bei der Suche nach Übereinstimmungen auf Wohnsitzebene werden beispielsweise nur Adresselemente abgeglichen. Ähnlich verhält es sich bei Suchen auf Nachnamenebene und Einzelpersonebene, bei denen entsprechend nur Nachnamen bzw. Vornamen abgeglichen werden. Bei einem Abgleich mit mehreren Ebenen können bis zu drei Ebenen in einen einzigen Übereinstimmungssatz aufgenommen werden, wobei diese zunehmend strenger definiert sein können. Bei einem Abgleich mit mehreren Ebenen werden nur die Datensätze verarbeitet, die von Übereinstimmungsebene zu Übereinstimmungsebene übereinstimmen (also Wohnsitz, Nachname, Einzelperson). Definieren von Übereinstimmungsebenen: 1. Klicken Sie auf die Übereinstimmung der obersten Ebene, und geben Sie einen Namen für die Ebene ein, falls Sie den Standardnamen nicht übernehmen möchten. Die Standardkriterien sind bereits ausgewählt. Wenn Sie diese nicht verwenden möchten, klicken Sie auf das Kontrollkästchen, um das Häkchen zu entfernen. Die Standardkriterien sind ein guter Ausgangspunkt zur Auswahl von Kriterien. Sie können für jede Ebene Kriterien hinzufügen, um präzisere Übereinstimmungen zu erhalten. 2. Wählen Sie für die jeweilige Ebene gegebenenfalls zusätzliche Kriterien aus. 3. Wenn Sie andere Kriterien als die angebotenen verwenden möchten, klicken Sie auf Benutzerdefiniert und wählen dann die gewünschten Kriterien aus. 4. Fahren Sie fort, bis alle erforderlichen Ebenen mit Kriterien gefüllt sind. 17.4.4.3.4 Auswählen von Ländern Wählen Sie die Länder aus, deren Poststandards erforderlich sein können, um die eingehenden Daten erfolgreich zu vergleichen. Im linken Bereich wird eine Liste aller verfügbaren Länder angezeigt. Im rechten Bereich werden die bereits von Ihnen ausgewählten Länder angezeigt. 1. Wählen Sie den Ländernamen in der Liste "Alle Länder" aus. 2. Klicken Sie auf Hinzufügen, um ihn in die Liste "Ausgewählte Länder" zu verschieben. 3. Wiederholen Sie die Schritte 1 und 2 für alle Länder, die Sie einschließen möchten. Sie können auch mehrere Länder auswählen und gleichzeitig hinzufügen, indem Sie auf die Schaltfläche Hinzufügen klicken. Die von Ihnen ausgewählten Länder werden für die nächste Sitzung des Match-Assistenten gespeichert. 424 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität 17.4.4.3.5 Gruppieren von Ländern in Tracks Legen Sie Tracks an, um Länder logisch gemäß Ihren Business-Regeln zu gruppieren (zum Beispiel Asien, Europa, Südamerika). Jeder Track legt bis zu sechs Übereinstimmungssätze an (Match-Transformationen). 1. Wählen Sie die Anzahl der anzulegenden Tracks aus. Die Liste mit den Tracks spiegelt die von Ihnen ausgewählte Anzahl von Pfaden wider und weist jedem davon eine Pfadnummer zu. 2. Um die einzelnen Tracks anzulegen, wählen Sie einen Tracktitel wie "Track1" aus. 3. Wählen Sie die Länder für diesen Track aus. 4. Klicken Sie auf Hinzufügen, um die ausgewählten Länder in den ausgewählten Track zu verschieben. Verwenden Sie die Liste LAND UNBEKANNT (__) für Daten, bei denen das Ursprungsland nicht identifiziert wurde. Verwenden Sie die Liste ANDERES LAND ALS (--) für Daten, deren Ursprungsland zwar identifiziert, aber in der Liste der ausgewählten Länder nicht gefunden wurde. 5. Wählen Sie unter "Übereinstimmungs-Engines" eine der folgenden Engines für jeden Track aus: Hinweis Alle für den Track generierten Match-Transformationen verwenden die ausgewählte ÜbereinstimmungsEngine. ○ WESTEUROPÄISCH (Standardeinstellung) ○ CHINESISCH ○ JAPANISCH ○ KOREANISCH ○ TAIWANESISCH ○ ANDERE AUSSER WESTEUROPÄISCH Die Schaltfläche Weiter wird erst aktiviert, nachdem alle Tracks über einen Eintrag verfügen und alle Länder einem Track zugewiesen wurden. 17.4.4.3.6 Auswählen von Kriterienfeldern Wählen Sie für alle Übereinstimmungssätze und -ebenen, die Sie im Datenfluss anlegen, Kriterienfelder aus, bzw. heben Sie deren Auswahl auf. Damit bestimmen Sie, welche Felder für die einzelnen Datensätze verglichen werden. Manche Kriterien können standardmäßig auf Basis der Dateneingabe ausgewählt sein. Wenn es nur ein Feld mit dem entsprechenden Inhaltstyp gibt, können Sie das Feld für das jeweilige Kriterium im Match-Assistenten nicht ändern. Damit die Schaltfläche Weiter aktiviert wird, müssen Sie mindestens ein Nichtübereinstimmungs-Standardfeld auswählen. 1. Wählen Sie für alle einzubeziehenden Kriterienfelder ein verfügbares Feld aus der Drop-Down-Liste aus, die Felder aus vorgelagerten Quellen enthält. Die verfügbaren Felder sind auf die entsprechenden Inhaltstypen für das jeweilige Kriterium beschränkt. Wenn keine Felder des entsprechenden Typs verfügbar sind, werden alle vorgelagerten Felder im Menü angezeigt. Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 425 2. Optional: Heben Sie die Auswahl von Kriterienfeldern auf, die Sie nicht einbeziehen möchten. 17.4.4.3.7 Anlegen von Zerlegungsschlüsseln Verwenden Sie Zerlegungsschlüssel, um kleinere Datengruppen für den Vergleich zu erhalten. Mit dem Übereinstimmungssatz werden die Daten in den Datensätzen nur innerhalb jeder Zerlegungsgruppe, nicht über mehrere Gruppen hinweg verglichen. Mit den richtigen Auswahlen können Sie wertvolle Verarbeitungszeit einsparen, indem Sie verhindern, dass sehr unterschiedliche Daten verglichen werden. Zerlegungsschlüssel sind besonders bei großen Datenmengen wichtig, da die Größe der Zerlegungsgruppen sich auf die Verarbeitungszeit auswirken kann. Selbst wenn die Daten nicht so umfangreich sind, tragen Zerlegungsgruppen zur Beschleunigung der Verarbeitung bei. Legen Sie Zerlegungsschlüssel an, die ähnliche Daten gruppieren, bei denen die Wahrscheinlichkeit von Übereinstimmungen hoch ist. Die Datensätze in einer Zerlegungsgruppe werden nicht mit Datensätzen in anderen Zerlegungsgruppen verglichen. Beispiel: Wenn Sie einen Abgleich durchführen, um Dubletten in Adressen zu finden, verwenden Sie die Postleitzahl, den Ort oder das Bundesland als Basis des Zerlegungsschlüssels, um Gruppen mit einer hohen Übereinstimmungswahrscheinlichkeit anzulegen. Wenn Sie einen Abgleich durchführen, um Dubletten in Personennamen zu finden, verwenden Sie die Postleitzahl und einen Teil des Namens, welches die wahrscheinlichsten Übereinstimmungspunkte sind, als Basis des Zerlegungsschlüssels. Anlegen von Zerlegungsschlüsseln: 1. In der Spalte "Wie viele Felder?" wählen Sie die Anzahl der Felder aus, die in den Zerlegungsschlüssel eingeschlossen werden sollen. 2. Für jeden Zerlegungsschlüssel wählen Sie Folgendes aus: ○ Feld(er) im Zerlegungsschlüssel ○ Startpunkt für jedes Feld ○ Anzahl der Anzeigestellen, die in jedem Feld gelesen werden sollen 3. Nach der Definition der Zerlegungsschlüssel führen Sie einen der folgenden Schritte aus: ○ Klicken Sie auf Fertig stellen. Dadurch wird die Match-Transformation abgeschlossen. ○ Wenn Sie einen multinationalen Abgleich ausführen, klicken Sie auf Weiter, um die Seite "Übereinstimmungskriterien ermitteln" aufzurufen. 17.4.4.4 Nach dem Einrichten Obwohl ein Großteil der Aufgaben vom Match-Assistenten übernommen wird, müssen Sie einige Aktionen durchführen, damit der Übereinstimmungsjob ausgeführt wird. Außerdem sollten Sie Ihren Abgleichprozess verfeinern. 426 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität Herstellen einer Verbindung zu nachgelagerten Transformationen Wenn die Aktionen des Match-Assistenten abgeschlossen sind, werden die generierten Transformationen im Arbeitsbereich platziert und mit der vorgelagerten Transformation verbunden, die Sie zum Starten des MatchAssistenten ausgewählt haben. Damit Ihr Job ausgeführt wird, muss jeder Port aus der letzten Transformation mit einer nachgelagerten Transformation verbunden werden. Klicken Sie hierfür auf einen Port und ziehen, um eine Verbindung zum gewünschten Objekt herzustellen. Anzeigen und Bearbeiten der neuen Match-Transformation Um den Inhalt der vom Match-Assistenten erzeugten Transformation(en) anzuzeigen, klicken Sie mit der rechten Maustaste auf die Transformation und wählen Match-Editor. Anzeigen und Bearbeiten von Associate-Transformationen Um den Inhalt der Associate-Transformation(en) anzuzeigen, die vom Match-Assistenten erzeugt wurden, klicken Sie mit der rechten Maustaste auf die Transformation und wählen Associate-Editor. Multinationaler Abgleich Der Assistent legt für den multinationalen Konsumentenabgleich eine Match-Transformation für jeden angelegten Pfad an. Achtung Wenn Sie Pfade aus dem Arbeitsbereich löschen, nachdem der Assistent diese angelegt hat, müssen Sie die Case-Transformation öffnen und jegliche unerwünschten Regeln löschen. Weitere Informationen Unicode-Abgleich [Seite 495] 17.4.5 Transformationen für Abgleichsdatenflüsse Die Match- und Associate-Transformationen sind die primären Transformationen, die am Einrichten von Abgleichen in einem Datenfluss beteiligt sind. Diese Transformationen führen die grundlegenden Abgleichsfunktionen aus. Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 427 Für bestimmte Zwecke zum Optimieren des Abgleichs können auch andere Transformationen verwendet werden. Tabelle 183: Transfor mation Verwendung Case Leitet Daten an eine bestimmte Match-Transformation (Übereinstimmungssatz) weiter. Eine häufige Verwen dung für diese Transformation besteht darin, für die USA und auf internationaler Ebene spezifische Daten an ver schiedene Transformationen zu senden. Sie können diese Transformation auch verwenden, um leere Datensätze rund um eine Match-Transformation weiterzuleiten. Merge Query Führt die folgenden Funktionen aus: ● Bringt Daten von Match-Transformationen für den Association-Abgleich zusammen. ● Bringt übereinstimmende und leere Datensätze zusammen, nachdem sie von einer Case-Transformation geteilt wurden. Legt Felder an, führt Funktionen aus, um die Vorbereitung von Daten zum Abgleich vorzubereiten, sortiert Daten usw. Beispiel Immer wenn Sie Datensätze aus einem bestimmten Abgleichsprozess umgehen müssen (üblicherweise in assoziativen Datenflüssen und immer wenn Sie Datensätze mit leeren Daten haben, um einen Abgleichsprozess zu umgehen), verwenden Sie die Case-, Query- und Merge-Transformation. ● Die Case-Transformation umfasst zwei Routen: Eine Route sendet alle Datensätze, die die Kriterien erfüllen, an die Match-Transformation, und eine sendet alle anderen Datensätze an die Umgehungsabgleichsroute. ● Die Query-Transformation fügt die Felder hinzu, die von der Match-Transformation generiert werden und die Sie ausgeben. (Das Ausgabeschema in der Match-Transformation und das Ausgabeschema in der Query-Transformation müssen identisch sein, damit die Routen zusammengeführt werden können.) Der Inhalt der neu hinzugefügten Felder in der Query-Transformation kann mit einer leeren Zeichenfolge gefüllt werden. ● Die Merge-Transformation führt die beiden Routen zu einer einzigen Route zusammen. 428 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität 17.4.5.1 Entfernen von Übereinstimmungen aus der MatchTransformation Sie können eine Transformation setzen, die einen Teil der Funktionen einer Match-Transformation im Datenfluss anwendet, aber keine eigentlichen Abgleichsfunktionen beinhaltet. Sie können beispielsweise eine Kandidatenauswahl oder Priorisierung in einem Datenfluss oder an einem Speicherort in einem Datenfluss vornehmen, der keinen Abgleich umfasst. 1. Klicken Sie in der Objektbibliothek mit der rechten Maustaste auf die Match-Transformation, und wählen Sie "Neu". 2. Geben Sie in das Feld Formatname einen aussagekräftigen Namen für die Transformation ein. Es ist hilfreich anzugeben, welchen Funktionstyp diese Transformation ausführen wird. 3. Klicken Sie auf OK. 4. Ziehen und legen Sie die Konfiguration der neuen Match-Transformation auf dem Arbeitsbereich ab, und verbinden Sie sie mit dem Datenfluss. 5. Klicken Sie mit der rechten Maustaste auf die neue Transformation, und wählen Sie Match-Editor. 6. Deaktivieren Sie die Option Vergleichen in der oberen linken Ecke des Match-Editors. Jetzt können Sie dieser Transformation alle verfügbaren Operationen hinzufügen. 17.4.6 Arbeiten im Match- und Associate-Editor Editoren Mit dem Match- und Associate-Transformationseditor können Sie Ihre Eingabe- und Ausgabeschemas einrichten. Sie können auf diese Editoren zugreifen, indem Sie im Arbeitsbereich auf das entsprechende Transformationssymbol doppelklicken. Mit dem Match- und Associate-Editor können Sie die Transformationsoptionen konfigurieren. Sie können auf diese Editoren zugreifen, indem Sie mit der rechten Maustaste auf die entsprechende Transformation klicken und die Option Match-Editor (bzw. Associate-Editor) auswählen. Reihenfolge der Einrichtung Tipp Die Reihenfolge, in der Sie die Match-Transformation einrichten, ist wichtig! Als Erstes ordnen Sie am besten die Eingabefelder zu. Wenn Sie das nicht tun und Sie im Match-Editor eine Operation hinzufügen, kann es sein, dass Sie ein bestimmtes Feld, das Sie für diese Operation verwenden möchten, nicht sehen. Als Zweites sollten Sie die Optionen im Match-Editor konfigurieren, bevor Sie die Ausgabefelder zuordnen. Durch das Hinzufügen von Operationen zur Match-Transformation (z.B. „Eindeutige ID“ und „Gruppenstatistik“) können Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 429 Sie nützliche, von der Match-Transformation generierte Felder erhalten, die Sie später im Datenfluss verwenden oder zur Datenbank hinzufügen können. Nicht vergessen Stellen Sie Folgendes sicher: 1. Ordnen Sie die Eingabefelder zu. 2. Konfigurieren Sie die Optionen für die Transformation. 3. Ordnen Sie die Ausgabefelder zu. 17.4.7 Physische und logische Quellen Das Verfolgen Ihrer Eingabedatenquellen und weiterer Quellen über den gesamten Datenfluss hinweg ist wichtig, damit informative Abgleichsberichte angelegt werden können. Das Verfolgen Ihrer Eingabedatenquellen und weiterer Quellen über den gesamten Datenfluss hinweg, egal, ob diese auf einer Eingabequelle oder auf einem Datenelement in den gelesenen Zeilen basieren, ist wichtig, damit informative Abgleichsberichte angelegt werden können. Abhängig davon, was Sie verfolgen, müssen Sie die entsprechenden Felder im Datenfluss anlegen, um sicherzugehen, dass die gewünschte Statistik generiert wird, falls diese noch nicht in der Datenbank enthalten ist. Zwei Typen von Eingabequellen sind verfügbar, die in der folgenden Tabelle beschrieben sind. Tabelle 184: Eingabequelle Beschreibung Physisch Der Dateiname oder Wert, der der Quelle der Eingabedaten zugewiesen ist. Logisch Eine Gruppe aus Datensätzen, die mehrere Eingabequellen oder eine Teilmenge aus Datensätzen von einer einzelnen Ein gabequelle umfassen. 17.4.7.1 Logische Eingabequelle Verfolgen Sie verschiedene Quellen von Eingabedaten für Berichte und Statistiken und Vergleichstabellen. Wenn Sie in der Match-Transformation (beispielsweise für den Bericht "Zusammenfassung Übereinstimmungsquellstatistik) eine Quellstatistik zählen möchten, müssen Sie mit einer Query-Transformation oder einer User-Defined-Transformation ein Feld anlegen, falls dieses noch nicht in den Eingabedatenquellen vorhanden ist. Dieses Feld verfolgt die verschiedenen Quellen in einem Reader zu Berichtszwecken, und es wird in der Gruppenstatistikoperation der Match-Transformation verwendet, um die Quellstatistik zu generieren. Es wird auch in den Vergleichstabellen verwendet, damit Sie festlegen können, welche Quellen verglichen werden sollen. 430 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität 17.4.7.2 Physische Eingabequelle Sie verfolgen die Eingabedatenquelle, indem Sie dieser physischen Quelle einen Wert in einem Feld zuweisen. Anschließend verwenden Sie dieses Feld in den Transformationen, in denen die Berichtsstatistik generiert wird. Um diesen Wert zuzuweisen, fügen Sie hinter der Quelle eine Query-Transformation hinzu, und fügen Sie eine Spalte mit einer Konstanten hinzu, die den Namen enthält, den Sie dieser Quelle zuweisen möchten. Hinweis Wenn es sich bei Ihrer Quelle um ein Flatfile handelt, können Sie mit der Option Dateinamenspalte einschließen automatisch eine Spalte generieren, die den Dateinamen enthält. 17.4.7.3 Verwenden von Quellen Eine Quelle ist die Gruppierung von Datensätzen auf der Grundlage bestimmter Datenmerkmale, die Sie identifizieren können. Eine Quelle können alle Datensätze aus einer Eingabedatei oder alle Datensätze, die einen bestimmten Wert in einem bestimmten Feld enthalten, sein. Quellen sind abstrakt und beliebig – es gibt keine physische Grenzlinie zwischen Quellen. Die Zugehörigkeit zu einer Quelle kann über verschiedene Eingabedateien oder Datenbanksätze hinweg gehen und es kann zwischen Datensätzen innerhalb einer Datei oder Datenbank unterschieden werden, basierend auf der Art und Weise, wie Sie die Quelle definieren. Wenn Sie alle Ihre Eingabedatensätze als Typ normale, geeignete Datensätze mit gleicher Priorität behandeln möchten, müssen Sie keine Quellen in Ihren Job einschließen. Ein Übereinstimmungsbenutzer hält ein Merkmal oder eine Merkmalskombination für aussagekräftig, entweder, beispielweise um den optimalen Übereinstimmungsdatensatz auszuwählen oder um zu entscheiden, welche Datensätze in die Adressliste aufgenommen oder von ihr ausgeschlossen werden sollen. Mithilfe von Quellen können Sie die Merkmale an einen Datensatz anhängen, und zwar gemäß der Zugehörigkeit dieses Datensatzes zu dessen spezifischer Quelle. Bevor wir uns mit den Details der Konfiguration und Verwendung von Quellen befassen, hier einige der zahlreichen möglichen Gründe für die Verwendung von Quellen in Ihrem Job: ● Um einem Datensatz Priorität vor anderen Datensätzen zu geben. Sie möchten beispielsweise den Datensätzen Ihrer Hausdatenbank oder einer Unterdrückungsquelle Priorität vor den Datensätzen aus einer Aktualisierungsdatei geben. ● Um einen Datensatz zu identifizieren, der mit Quellen des Typs "Unterdrückung" übereinstimmt. ● Um einen Datensatz zu konfigurieren, der nicht zum Status "mehrere Quellen" gezählt werden soll. So verwenden einige Mailer eine Ausgangsquelle mit potenziellen Käufern, die dem Mailer melden, wenn Sie Post erhalten haben, so dass der Mailer die Zustellung messen kann. Dies ist ein spezieller Typ von Datensätzen. ● Um Verarbeitungszeit zu sparen, indem der Vergleich innerhalb eines Satzes von Datensätzen abzubrechen, von dem Sie wissen, dass er keine übereinstimmenden Datensätze enthält. In diesem Fall müssen Sie wissen, dass es keine übereinstimmenden Datensätze innerhalb der Quelle gibt, es jedoch u.U. Übereinstimmungen in verschiedenen Quellen geben kann. Um Verarbeitungszeit zu sparen, können Sie Quellen einrichten und den Vergleich innerhalb jeder einzelnen Quelle abbrechen. Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 431 ● Um separate Berichtsstatistiken für einen Satz von Datensätzen innerhalb einer Quelle zu erhalten oder um Berichtsstatistiken für Gruppen von Quellen zu erhalten. ● Um das Überschreiben von Daten in einer Quelle durch eine "Optimaler Datensatz"- oder "Eindeutige ID"Operation zu verhindern. Sie können Daten basierend auf ihrer Zugehörigkeit zu einer Quelle schützen. 17.4.7.4 Quelltypen Sie können jede Quelle als eine von drei verschiedenen Typen identifizieren: „Normal“, „Unterdrückung“ oder „Spezial“. Ihre Datensätze können je nach Quelltyp unterschiedlich verarbeitet werden. Tabelle 185: Quelle Beschreibung Normal Eine Quelle vom Typ "Normal" ist eine Gruppe von Datensätzen, die als gute, geeignete Datensätze gelten. Unterdrücken Eine Quelle vom Typ "Unterdrücken" enthält Datensätze, die häufig von der Verwendung ausge schlossen werden. Wenn Sie beispielsweise die Übereinstimmung verwenden, um eine Adressquelle einzuschränken, können Sie mithilfe einer Quelle vom Typ "Unterdrücken" Datensätze aus den Ad ressen entfernen. Beispiele: ● Spezial DMA Mail Preference File ● American-Correctional-Association-Haftanstalten als Quelle ● Keine Werbung oder nicht antwortende Adressen als Quelle ● Unterdrückung von Kreditkarten oder ungedeckten Schecks als Quelle Eine Quelle vom Typ "Spezial" wird wie eine Quelle vom Typ "Normal" behandelt, mit einer Aus nahme. Eine Quelle vom Typ "Spezial" wird nicht mitgezählt, wenn ermittelt wird, ob eine Übereins timmungsgruppe eine Quelle oder mehrere Quellen hat. Eine Quelle vom Typ "Spezial" kann Daten sätze beisteuern, wird jedoch nicht zum Status "mehrere Quellen" gezählt. Manche Unternehmen verwenden beispielsweise eine Quelle mit Ausgangsnamen. Dies sind Namen von Personen, die Werbesendungen melden, so dass der Absender die Postzustellung messen kann. Das Erscheinen in der Ausgangsquelle wird nicht zum Status "mehrere Quellen" gezählt. Die Identifikation des Quelltyps dient dazu, die Identität für jeden Datensatz festzulegen, der zur Quelle gehört. Der Quelltyp spielt eine wichtige Rolle bei der Steuerung der Priorität (Reihenfolge) der Datensätze in der Zerlegungsgruppe, der Art und Weise der Verarbeitung von übereinstimmenden Datensätzen (den Mitgliedern der Übereinstimmungsgruppe) sowie der Art der Ausgabe (d.h. ob ein Datensatz ausgegeben wird oder nicht). 17.4.7.4.1 Manuelles Definieren von Eingabequellen Nach der Zuordnung eines Eingabefelds, das die Quellwerte enthält, können Sie die Quellen im Übereinstimmungs-Editor anlegen. 1. Wählen Sie im Übereinstimmungs-Editor den Eintrag Transformationsoptionen im Explorer-Bereich auf der linken Seite aus, klicken Sie auf die Schaltfläche Hinzufügen, und wählen Sie Eingabequellen aus. Die neue Eingabenquelloperation wird unter "Transformationsoptionen" im Explorer-Bereich angezeigt. Wählen Sie sie aus, um die Eingabequelloptionen anzuzeigen. 432 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität 2. In der Drop-Down-Liste Wertfeld wählen Sie das Feld aus, das den Eingabequellwert enthält. 3. Legen Sie in der Tabelle Quellen definieren einen Quellnamen an, geben Sie einen Quellwert für das Feld "Wert" dieser Quelle ein, und wählen Sie einen Quelltyp aus. 4. Wählen Sie unter der Option Standardquellenname einen Wert aus. Dieser Name wird für alle Datensätze verwendet, deren Quellfeldwert leer ist. Klicken Sie auf die Schaltfläche Übernehmen, um alle vorgenommenen Änderungen zu speichern, bevor Sie mit einer anderen Operation im Match-Editor fortfahren. 17.4.7.4.2 Automatisches Definieren von Eingabequellen Wenn Sie die Eingabequellen nicht manuell definieren möchten, können Sie diesen Schritt automatisch ausführen, indem Sie die Option Quellen automatisch generieren in der Operation "Eingabequellen" auswählen. 1. Wählen Sie im Übereinstimmungs-Editor den Eintrag Transformationsoptionen im Explorer-Bereich auf der linken Seite aus, klicken Sie auf die Schaltfläche Hinzufügen, und wählen Sie Eingabequellen aus. Die neue Eingabenquelloperation wird unter "Transformationsoptionen" im Explorer-Bereich angezeigt. Wählen Sie sie aus, um die Eingabequelloptionen anzuzeigen. 2. In der Drop-Down-Liste Wertfeld wählen Sie das Feld aus, das den Eingabequellwert enthält. 3. Wählen Sie unter der Option Standardquellenname einen Wert aus. Dieser Name wird für alle Datensätze verwendet, deren Quellfeldwert leer ist. 4. Wählen Sie die Option Quellen automatisch generieren aus. 5. Wählen Sie einen Wert bei der Option Standardtyp aus. Der Standardtyp wird jeder Quelle zugewiesen, deren Typ noch nicht im Feld "Typ" definiert ist. 6. Wählen Sie ein Feld in der Drop-Down-Liste bei der Option Typfeld aus. Bei der automatischen Generierung von Quellen wird eine Quelle für jeden eindeutigen Wert im Feld "Wert" angelegt. Alle Datensätze, für die kein Wertfeld definiert ist, werden dem Standardquellnamen zugewiesen. 17.4.7.5 Quellgruppen Durch die Quellgruppenfunktion wird eine höhere Ebene der Quellenverwaltung hinzugefügt. Ein Beispiel: Sie haben mehrere Dateien von zwei Brokern gemietet. Sie definieren fünf Quellen, die verwendet werden sollen, um die Reihenfolge der Datensätze festzulegen. Darüber hinaus sollen die Statistiken Ihres Jobs nach Broker und nach Datei aufgeschlüsselt werden. Hierzu können Sie Quellgruppen für jeden Broker definieren. Quellgruppen wirken sich vor allem auf Berichte aus. Sie können Quellgruppen jedoch auch verwenden, um Datensätze mit mehreren Quellen anhand der Anzahl der Quellgruppen auszuwählen, in denen ein Name vorkommt. Beachten Sie jedoch, dass Sie Quellgruppen nicht wie Quellen verwenden können. Sie können beispielsweise einer Quellgruppe keine Priorität gegenüber einer anderen Quellgruppe einräumen. Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 433 17.4.7.5.1 Anlegen von Quellgruppen Sie müssen Eingabequellen in einer Eingabequellenoperation definiert haben, um diese Operation hinzufügen oder die Quellgruppen definieren zu können. 1. Wählen Sie zunächst eine Match-Transformation in Ihrem Datenfluss und anschließend Extras Match- Editor . 2. Wählen Sie im Übereinstimmungs-Editor den Eintrag Transformationsoptionen im Explorer-Bereich auf der linken Seite aus, klicken Sie auf die Schaltfläche Hinzufügen, und wählen Sie Quellgruppen aus. Die neue Quellgruppenoperation wird unter der Eingabequellenoperation im Explorer-Bereich angezeigt. Wählen Sie sie aus, um die Quellgruppenoptionen anzuzeigen. 3. Vergewissern Sie sich, dass die benötigten Eingabequellen in der Spalte "Quellen" rechts enthalten sind. 4. Doppelklicken Sie auf die erste Zeile in der Spalte "Quellgruppen" links, und geben Sie einen Namen für die erste Quellgruppe ein. Drücken Sie dann die Eingabetaste. 5. Wählen Sie in der Spalte "Quellen" eine Quelle aus, und klicken Sie auf die Schaltfläche Hinzufügen. 6. Wählen Sie einen Wert für die Option Undefinierte Aktion. Mit dieser Option wird angegeben, welche Maßnahme ergriffen wird, wenn eine Eingabequelle in einer Quellgruppe nicht angezeigt wird. 7. Wenn Sie im vorangegangenen Schritt "Standard" als die undefinierte Aktion ausgewählt haben, müssen Sie für die Option Standardquellgruppe einen Wert auswählen. Diese Option enthält bereits definierte Quellgruppen. Wenn eine Eingabequelle keiner Quellgruppe zugewiesen ist, wird sie dieser Standardquellgruppe zugewiesen. 8. Sie können in der Optionsdropdown-Liste Feld für Quellgruppe ein Feld auswählen, das den Wert für Ihre Quellgruppen enthält. 17.4.8 Übereinstimmungsvorbereitung 17.4.8.1 Vorbereiten der Daten für den Abgleich Verwenden Sie die Tabelle als Checklistentyp für die Vorbereitung Ihrer Daten auf den Abgleich. Tabelle 186: Checkliste für die Vorbereitung von Daten auf den Abgleich Fertig 434 Aufgabe Beschreibung Datenkorrektur und -standardisierung Genaue Übereinstimmungen sind davon abhängig, dass hochwertige Daten in die Match-Transforma tion einfließen. Für den Batch-Abgleich wird emp fohlen, eine der Transformationen zur Adressenbe reinigung und eine Data Cleanse-Transformation in Ihren Datenfluss einzuschließen, bevor Sie versu chen, den Abgleich auszuführen. PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität Fertig Aufgabe Beschreibung Herausfiltern leerer Datensätze Sie sollten vor der Abgleichsausführung die leeren Datensätze herausfiltern. Hierdurch sollte die Leis tung verbessert werden. Verwenden Sie eine CaseTransformation, um Datensätze auf einen anderen Pfad umzuleiten, oder eine Query-Transformation, um Datensätze zu filtern oder zu sperren. Entfernen von Füllwörtern Sie können eine Suche durchführen und Wörter er setzen, die für den Abgleichprozess ohne Bedeu tung sind. Für den Abgleich von Unternehmensda ten können Wörter wie Inc., Corp. und Ltd. entfernt werden. Hierfür können Sie die Funktion zum Su chen und Ersetzen in der Query-Transformation verwenden. Interpunktion entfernen Um den Abgleichprozess zu maximieren, ordnen Sie die folgenden Data Cleanse-Transformations ausgabefelder in Ihrer Match-Transformation zu. Diese Felder geben standardisierte Daten aus, die in Großbuchstaben konvertiert wurden, bei denen die Interpunktion entfernt wurde usw. Weitere In formationen finden Sie im Abschnitt „Ausgabefel der für die Datenbereinigung“. Zerlegungsgruppen Designer-Handbuch Datenqualität ● Übereinstimmung_Nachname ● Übereinstimmung_Firma ● Übereinstimmung_Vorname1 ● Übereinstimmung_Vorname2 ● Übereinstimmung_Namenssuffix_Zusatz ● Übereinstimmung_Person ● Übereinstimmung_Rufnummer ● Übereinstimmung_Namenspräfix Durch Zerlegungsgruppen werden Datensätze in Sammlungen gegliedert, die potenzielle Überein stimmungen darstellen, wodurch sich die Anzahl an Vergleichen verringert, die die Match-Transfor mation durchführen muss. Schließen Sie eine „Zer legungsgruppen“-Operation in Ihre Match-Trans formation ein, um die Leistung zu optimieren. PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 435 Fertig Aufgabe Beschreibung Übereinstimmungsstandards Sie sollten Variationen von Namens- oder Unter nehmensdaten in den Übereinstimmungsprozess einschließen, um so eine Übereinstimmung sicher zustellen. Eine Variation von „Bill“ wäre „William“. Beim Durchführen von Vergleichen sollten Sie die ursprünglichen Daten und eine oder mehrere Va riationen verwenden. Abhängig vom Datentyp kön nen Sie zwischen einer und fünf Variationen oder Übereinstimmungsstandards hinzufügen. Wenn beispielsweise die Vornamen verglichen wer den, jedoch nicht übereinstimmen, werden an schließend die Variationen verglichen. Wenn die Variationen übereinstimmen, besteht noch die Möglichkeit, dass die beiden Datensätze überein stimmen, auch wenn die ursprünglichen Vornamen nicht als Übereinstimmung erachtet wurden. Benutzerdefinierte Übereinstimmungsstandards Sie können Übereinstimmungen für benutzerdefi nierte Data Cleanse-Ausgabefelder und zugehörige Aliase anlegen. Ordnen Sie die benutzerdefinierten Ausgabefelder von Data Cleanse zu, und die benut zerdefinierten Felder werden auf dem Tab „Krite rienfelder“ des Match-Editors angezeigt. Weitere Informationen Einrichten der Standardkriterien für die Übereinstimmung [Seite 459] Referenzhandbuch: Ausgabefelder 17.4.8.1.1 In den Abgleich einzubeziehende Felder Um die vielfältigen Funktionen in der Match-Transformation nutzen zu können, müssen Sie zusätzlich zu den Feldern, die Sie als Übereinstimmungskriterien verwenden möchten, noch eine Reihe von Eingabefeldern zuordnen. Beispiel Hier einige der weiteren Felder, die Sie einbeziehen können. Die Namen der Felder sind unwichtig, solange Sie sich merken, welche Felder die entsprechenden Daten beinhalten. 436 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität Tabelle 187: Feldinhalt Enthält ... Logische Quelle Ein Wert, der festlegt, aus welcher logischen Quelle ein Datensatz stammt. Dieses Feld wird in der Gruppenstatistikoperation, in Vergleichstabellen und auch in der Associate-Transformation verwendet. Physische Quelle Ein Wert, der festlegt, aus welcher physischen Quelle ein Datensatz stammt. (Beispielsweise ein Quellobjekt oder eine Gruppe von Kandidaten ausgewählter Datensätze) Dieses Feld wird in den Optionen der Match-Transformation, bei der Kandidatenauswahloperation und in der AssociateTransformation verwendet. Zerlegungsschlüssel Ein Feld, das den Zerlegungsschlüsselwert zum Anlegen von Zerlegungsgruppen enthält. Wenn Sie ein Feld einschließen, das den Zerlegungsschlüsselwert bereits enthält, lassen sich Zerle gungsgruppen leichter anlegen, da es der Match-Transformation dann erspart bleibt, mehrere Felder zu parsen, um den Zerlegungsschlüssel anzulegen. Kriterienfelder Die Felder mit den Daten, die Sie abgleichen möchten. Zählkennzeichen Ein Wert "Ja" oder "Nein", um festzulegen, ob eine logische Quelle in einer Gruppenstatistikope ration gezählt werden soll. Datensatzpriorität Ein Wert, mit dem einem Datensatz beim Sortieren von Datensätzen Priorität gegenüber einem anderen zugewiesen wird. Dieses Feld wird bei Gruppenpriorisierungsoperationen verwendet. Abzugswert anwenden Ein Wert "Ja" oder "Nein", um festzulegen, ob Match bei einem Datensatz einen Abzugswert an wenden soll. Dieses Feld wird bei Gruppenpriorisierungsoperationen verwendet. Wert für eindeutige Start-ID Ein Wert für eine Start-ID, der sich bei jedem Zuweisen einer eindeutigen ID um 1 erhöht. Dieses Feld wird bei der Operation mit einer eindeutigen ID verwendet. Diese Liste ist nicht vollständig. Je nach den Funktionen, die Sie verwenden möchten, können Sie viele weitere Felder einschließen, die in der Match-Transformation verwendet werden können. 17.4.8.2 Steuern von Datensatzvergleichen Die Steuerung der Anzahl an Datensatzvergleichen im Abgleichprozess ist aus verschiedenen Gründen wichtig: ● Geschwindigkeit. Durch das Steuern der tatsächlichen Anzahl an Vergleichen können Sie die Verarbeitungszeit verkürzen. ● Übereinstimmungsqualität. Da nur die Datensätze gruppiert werden, die ein gewisses Übereinstimmungspotenzial aufweisen, werden bessere Ergebnisse im Abgleichprozess gewährleistet. Die Steuerung der Anzahl an Vergleichen erfolgt hauptsächlich im Abschnitt "Gruppenbildung" des Match-Editors mit den folgenden Operationen: ● Zerlegungsgruppe: Zerlegung Ihrer Datensätze in kleinere Datensatzgruppen, die eine höhere Übereinstimmungswahrscheinlichkeit haben. ● Kandidatenauswahl: Ausschließliche Auswahl von Übereinstimmungskandidaten aus einer Datenbanktabelle. Diese Operation wird in erster Linie für Echtzeitjobs verwendet. Darüber hinaus können Sie Vergleichstabellen verwenden, um Datensätze für den Vergleich durch logische Quellen ein- oder auszuschließen. Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 437 Weitere Informationen Zerlegungsgruppen [Seite 438] Kandidatenauswahl [Seite 440] Vergleichstabellen [Seite 445] 17.4.8.2.1 Zerlegungsgruppen Wenn Sie Zerlegungsgruppen anlegen, platzieren Sie Datensätze in Gruppen, die höchstwahrscheinlich übereinstimmen. Ein gängiges Beispielszenario ist die Anlage von Zerlegungsgruppen auf Basis einer Postleitzahl. Damit wird sichergestellt, dass Datensätze aus unterschiedlichen Postleitzahlen nie verglichen werden, da die Wahrscheinlichkeit, einen übereinstimmenden Datensatz mit einer unterschiedlichen Postleitzahl zu finden, sehr gering ist. Zerlegungsschlüssel Sie bilden Zerlegungsgruppen, indem Sie einen Zerlegungsschlüssel anlegen: ein Feld, das aus Teilen anderer Felder oder einem einzigen Feld besteht, das dann zur Gruppierung von Datensätzen, die auf ähnlichen Daten basieren, verwendet wird. Im Folgenden ist ein Beispiel eines typischen Zerlegungsschlüssels aufgeführt, der durch die Kombination der fünf Ziffern des Felds "Postleitzahl1" und der ersten drei Zeichen des Felds "Primäradressname" angelegt wurde. Tabelle 188: Feld (Startposition:Länge) Daten im Feld Generierter Zerlegungsschlüssel Postleitzahl1 (1:5) 10101 10101Mai Primäradressname (1:3) Main Alle Datensätze, die mit dem in diesem Beispiel generierten Zerlegungsschlüssel übereinstimmen, werden in derselben Zerlegungsgruppe platziert und miteinander verglichen. Sortieren von Datensätzen in der Zerlegungsgruppe Datensätze werden nach dem Zerlegungsschlüsselfeld sortiert. Sie können nach der Zerlegungsgruppenoperation eine Gruppenpriorisierungsoperation hinzufügen, um anzugeben, welche Datensätze führend sind. Nicht vergessen Die Reihenfolge ist wichtig! Wenn Sie Zerlegungsgruppen unter Verwendung von Datensätzen aus einer ausgeschlossenen Quelle anlegen, sorgen Sie dafür, dass die ausgeschlossenen Datensätze in der Zerlegungsgruppe führend sind. 438 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität Aufbau von Zerlegungsgruppen Zerlegungsgruppen bestehen aus führenden und begleitenden Datensätzen. Der führende Datensatz ist der erste Datensatz in der Zerlegungsgruppe, und alle anderen Datensätze sind begleitend. Der führende Datensatz ist der Datensatz, der den Vergleichsprozess beim Abgleich steuert. Der führende Datensatz wird zuerst mit sämtlichen begleitenden Datensätzen verglichen. Das folgende Beispiel basiert auf einem Zerlegungsschlüssel, der die ersten drei Ziffern einer Postleitzahl verwendet. Phonetische Zerlegungsschlüssel Sie können auch mit den Soundex- und Double-Metaphone-Funktionen Felder anlegen, die phonetische Codes enthalten, die sich dann zum Anlegen von Zerlegungsgruppen für den Abgleich verwenden lassen. Weitere Informationen Phonetische Abgleichskriterien [Seite 498] Management-Console-Handbuch: Data-Quality-Berichte, Übereinstimmungsanteilbericht Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 439 17.4.8.2.1.1 Anlegen von Zerlegungsgruppen Es wird empfohlen, dass Sie die Daten standardisieren, bevor Sie Zerlegungsschlüssel anlegen. Beispielsweise können Daten mit inkonsistenter Groß/Kleinschreibung unterschiedlich behandelt werden. 1. Fügen Sie der Optionsgruppe Gruppenbildung eine Operation "Zerlegungsgruppe" hinzu. 2. Fügen Sie in der Zerlegungsschlüsseltabelle eine Zeile hinzu, indem Sie auf die Schaltfläche "Hinzufügen" klicken. 3. Wählen Sie ein Feld in der Spalte Feld aus, das Sie als Zerlegungsschlüssel verwenden möchten. Die Postleitzahl wird häufig als Zerlegungsschlüssel verwendet. 4. Wählen Sie die Startposition und Länge (Anzahl der Zeichen) aus, die in dem Zerlegungsschlüssel verwendet werden sollen. Mit negativen Ganzzahlen können Sie angeben, dass am Ende der tatsächlichen Länge der Zeichenfolge begonnen werden soll und die Zahl keine Feldlänge angibt. Beispiel: Bei "Feld(-3,3)" werden die letzten 3 Zeichen der Zeichenfolge verwendet, unabhängig davon, ob die Zeichenfolge 10 oder 5 Zeichen lang ist. 5. Fügen Sie weitere Zeilen und Felder nach Bedarf hinzu. 6. Ändern Sie die Reihenfolge der Zeilen, indem Sie eine Zeile auswählen und auf die Schaltflächen Nach oben und Nach unten klicken. Die richtige Reihenfolge der Zeilen stellt sicher, dass die Felder im Zerlegungsschlüssel in der richtigen Reihenfolge verwendet werden. Die Anlage des Zerlegungsschlüssels ist nun abgeschlossen. 17.4.8.2.2 Kandidatenauswahl Um die Verarbeitung in einem Übereinstimmungsjob zu beschleunigen, hängen Sie vor der Durchführung des Abgleichs Datensätze mit der Operation "Kandidatenauswahl" (Optionsgruppe "Gruppenbildung") in der MatchTransformation von einer relationalen Datenbank an eine bestehende Datensammlung an. Beim Anhängen werden die Datensätze in keiner Weise logisch gruppiert. Sie werden einfach Datensatz für Datensatz an das Ende der Datensammlung angehängt, bis die Sammlung die angegebene Größe erreicht. Nehmen Sie beispielsweise an, dass Sie eine neue Quelle von Datensätzen haben, die Sie mit Ihrem DataWarehouse in einem Batch-Job vergleichen möchten. In diesem Warehouse können Sie Datensätze auswählen, die mit den Zerlegungsschlüsseln der neuen Quelle übereinstimmen. Damit wird die Anzahl der Vergleiche, die die Match-Transformation durchführen muss, eingeschränkt. Hierzu ein vereinfachtes Beispiel zur Veranschaulichung: Nehmen Sie an, dass mit Ihrem Job eine neue Quelldatenbank – eine kleinere, regionale Datei – mit einer großen, nationalen Datenbank verglichen wird, die in jedem der etwa 43.000 Postleitzahlen 15 Datensätze enthält. Nehmen Sie weiter an, dass Sie Zerlegungsgruppen ausschließlich auf der Grundlage der Postleitzahl bilden möchten. 440 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität Tabelle 189: Hinweise Regional National Gesamt Ohne die Kandidatenauswahl liest die Match-Transformation alle Datensätze beider Datenbanken. 1.500 750.000 751.500 Mit der Kandidatenauswahl werden nur die Datensätze gele sen, die in eine Zerlegungsgruppe aufgenommen würden. 1.500 Ca. 600 (40 x 15) 2.100 17.4.8.2.2.1 Datastores und Kandidatenauswahl Zum Verwenden der Kandidatenauswahl müssen Sie eine Verbindung zu einem gültigen Datastore herstellen. Sie können eine Verbindung zu einem beliebigen SQL-basierten Datastore oder persistenten Cache-Datastore herstellen. Welche dieser Optionen mehr Vorteile bietet, ist davon abhängig, ob die sekundäre Quelle statisch (d.h., sie wird nicht oft aktualisiert) oder dynamisch (d.h., sie wird oft aktualisiert) ist. Persistente Cache-Datastores Persistenter Cache verhält sich wie jeder andere Datastore, aus dem Sie die Kandidatengruppe laden können. Ist die sekundäre Quelle, aus der Sie Kandidaten auswählen, relativ statisch (d.h., sie ändert sich nur selten), empfiehlt sich möglicherweise die Anlage eines persistenten Caches, der als Sekundärtabelle verwendet wird, anstatt die sekundäre Quelle direkt zu verwenden. So verbessert sich möglicherweise die Leistung. Möglicherweise erzielen Sie auch Leistungsgewinne, indem Sie ein Flatfile für den persistenten Cache verwenden (dieses Format ist leichter zu durchsuchen als RDBMS). Ist die sekundäre Quelle keine RDBMS, z.B. ein Flatfile, können Sie sie nicht als "Datastore" verwenden. In diesem Fall können Sie einen persistenten Cache aus diesem Flatfile anlegen und anschließend den persistenten Cache für die Kandidatenauswahl verwenden. Hinweis Ein persistenter Cache, der für die Kandidatenauswahl verwendet wird, muss durch einen Datenfluss im Doppelbyte-Modus angelegt werden. Zu diesem Zweck müssen Sie die Gebietsschema-Einstellung im Data- Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 441 Services-Gebietsschema-Auswahlelement ändern (setzen Sie die Codepage auf utf-8). Führen Sie den Job aus, um den persistenten Cache zu generieren. Anschließend können Sie die Codepage ggf. auf die ursprüngliche Einstellung zurücksetzen. Cachegröße Leistungsgewinne durch Verwendung des persistenten Caches sind auch von der Größe der sekundären Quelldaten abhängig. Mit dem Anstieg der Größe der in den persistenten Cache geladenen Daten verringern sich möglicherweise die Leistungsgewinne. Auch wenn die ursprüngliche sekundäre Quelltabelle ordnungsgemäß indiziert und für Geschwindigkeit optimiert ist, bietet die Anlage eines persistenten Caches (oder eines vorab geladenen Caches) aus dieser Tabelle möglicherweise keine Vorteile. Weitere Informationen Persistenter Cache (Datastores) [Seite 85] 17.4.8.2.2.2 Automatisch generierte vs. benutzerdefiniertes SQL In manchen Situationen kann die Match-Transformation die SQL für Sie generieren, in anderen Situationen müssen Sie eine eigene SQL anlegen. Abhängig ist dies davon, welche Optionen Sie auswählen und wie Ihre sekundäre Tabelle (die Tabelle, aus der Sie Übereinstimmungskandidaten auswählen) eingerichtet ist. Verwenden Sie die nachstehende Tabelle, um festzustellen, ob Sie eine automatisch generierte SQL verwenden können oder eine eigene SQL anlegen müssen. Hinweis In den folgenden Szenarios bezieht sich „Eingabedaten“ auf Zerlegungsschlüsselfelder, die aus einer Transformation vor der Match-Transformation (wie der Query-Transformation) stammen, oder auf Zerlegungsschlüsselfelder, die von der Operation "Generierung von Zerlegungsgruppen" innerhalb der MatchTransformation stammen. Tabelle 190: Szenario Automatisch generiert oder benutzerde finiert? In Ihren Eingabedaten gibt es ein einziges Zerlegungsschlüsselfeld, und dasselbe Feld ist in Ihrer sekundären Tabelle enthalten. Automatisch generieren In Ihren Eingabedaten gibt es mehrere Zerlegungsschlüsselfelder, und dieselben Felder sind in Ihrer sekundären Tabelle enthalten. Automatisch generieren 442 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität Szenario Automatisch generiert oder benutzerde finiert? In Ihren Eingabedaten gibt es mehrere Zerlegungsschlüsselfelder, und in Ihrer se kundären Tabelle ist ein einziges Zerlegungsschlüsselfeld enthalten. Automatisch generieren In Ihren Eingabedaten gibt es ein einziges Zerlegungsschlüsselfeld, und in Ihrer sekundären Tabelle sind mehrere Zerlegungsschlüsselfelder enthalten. Benutzerdefiniert In Ihren Eingabedaten gibt es mehrere Zerlegungsschlüsselfelder, aber in Ihrer sekundären Tabelle wird ein anderes Format oder eine andere Anzahl von Feldern verwendet. Benutzerdefiniert Sie möchten aus mehreren Eingabequellen auswählen. Benutzerdefiniert 17.4.8.2.2.3 Zerlegungsschlüssel und Kandidatenauswahl Wir empfehlen die Anlage einer Zerlegungsschlüsselspalte in der sekundären Tabelle (die Tabelle mit den Datensätzen, die Sie mit den Eingabedaten im Datenfluss vergleichen möchten), die dem Zerlegungsschlüssel entspricht, mit dem Sie die Zerlegungsgruppen in der Match-Transformation anlegen. Dies erleichtert die Einrichtung der Kandidatenauswahloperation erheblich. Außerdem sollten alle diese Spalten indiziert werden. Darüber hinaus empfehlen wir, dass Sie die Datenbank, aus der Sie auswählen, von einem einzelnen Zerlegungsschlüsselfeld anlegen und ausfüllen, statt Teilzeichenfolgen von Datenbankfeldern abzurufen, um den Zerlegungsschlüssel anzulegen. Dadurch kann die Leistung der Kandidatenauswahl verbessert werden. Hinweis Datensätze, die bei der Kandidatenauswahl extrahiert werden, werden an das Ende einer bestehenden Zerlegungsgruppe angehängt (sofern Sie Zerlegungsgruppen verwenden). Wenn Sie also die Datensätze nach der Kandidatenauswahloperation nicht mit einer Gruppenpriorisierungsoperation neu sortieren, werden die Datensätze von der ursprünglichen Quelle immer die führenden Datensätze in den Zerlegungsgruppen sein. Wenn Sie die Kandidatenauswahl bei einer ausgeschlossenen Quelle verwenden, müssen Sie die Datensätze neu sortieren, damit die Datensätze von der ausgeschlossenen Quelle die führenden Datensätze sind. 17.4.8.2.2.4 Einrichten der Kandidatenauswahl Wenn Sie die Kandidatenauswahl für einen Echtzeitjob verwenden, achten Sie darauf, die Auswahl der Option Datensätze in Gruppen zerlegen in der Operation "Zerlegungsgruppe" der Match-Transformation aufzuheben. Um die Verarbeitung in einem Echtzeit-Übereinstimmungsjob zu beschleunigen, verwenden Sie die Operation "Kandidatenauswahl" (Optionsgruppe zur Gruppenbildung) in der Match-Transformation, um vor dem Abgleichen Datensätze aus einer relationalen Datenbank an eine bestehende Datensammlung anzuhängen. Beim Anhängen werden die Datensätze in keiner Weise logisch gruppiert. Sie werden einfach Datensatz für Datensatz an das Ende der Datensammlung angehängt, bis die Sammlung die angegebene Größe erreicht. 1. Wählen Sie in der Operation "Kandidatenauswahl" einen gültigen Datastore aus der Drop-Down-Liste Datastore. Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 443 2. Wählen Sie in der Drop-Down-Liste Cachetyp aus den folgenden Werten: Option Beschreibung Kein_Cache Erfasst Daten zu einem bestimmten Zeitpunkt. Die Daten werden erst geändert, wenn der Job neu gestartet wird. Pre_Load_Cache Verwenden Sie diese Option für statische Daten. 3. Wählen Sie abhängig von der Struktur der Eingabedaten und der sekundären Tabelle eine der folgenden Vorgehensweisen: ○ Wählen Sie SQL automatisch generieren. Wählen Sie anschließend die Option Zerlegungsspalte aus Datenbank verwenden, wenn eine Datenbank vorhanden ist, und wählen Sie eine Spalte aus der DropDown-Liste Feld für Zerlegungsschlüssel. Hinweis Wenn Sie die Option SQL automatisch generieren wählen, sollte die sekundäre Tabelle eine Zerlegungsschlüsselspalte enthalten, und Sie sollten die Option Zerlegungsspalte aus Datenbank verwenden aktivieren. Andernfalls ist die angelegte SQL möglicherweise fehlerhaft. ○ Wählen Sie Benutzerdefiniertes SQL anlegen, und klicken Sie auf die Schaltfläche SQL-Editor starten, oder geben Sie Ihre SQL im Fenster zur SQL-Bearbeitung ein. 4. Wenn Sie Ihre Datensätze aus der Eingabequelle verfolgen möchten, wählen Sie Konstanten Quellwert verwenden. 5. Geben Sie einen Wert ein, der Ihre Quelle in der Option Wert der physischen Quelle darstellt, und wählen Sie dann ein Feld, das diesen Wert in der Drop-Down-Liste Wert der physischen Quelle enthält. 6. Fügen Sie in der Tabelle Spaltenzuordnung so viele Zeilen wie erforderlich hinzu. Jede Zeile ist ein Feld, das zur Sammlung hinzugefügt wird. a. Wählen Sie ein Feld in der Spalte Zugeordneter Name. b. Wählen Sie eine Spalte aus Ihrer sekundären Tabelle (oder aus einer benutzerdefinierten Abfrage) in der Option Spaltenname, die denselben Datentyp enthält, der in der Spalte Zugeordneter Name angegeben ist. Wenn Sie die Zerlegungsschlüssel in der Optionsgruppe "Zerlegungsgruppe" bereits definiert haben, werden die zur Anlage des Zerlegungsschlüssel verwendeten Felder hier aufgeführt, und die Spalte "Zerlegungsgruppe" ist auf JA gesetzt. 17.4.8.2.2.5 Schreiben von benutzerdefiniertem SQL Verwenden von Platzhaltern Um komplexe SQL-Anweisungen zu vermeiden, sollten Sie in der WHERE-Klausel Platzhalter verwenden (die mit echten Eingabedaten ersetzt werden). Angenommen, die Kundendatenbank enthält ein Feld mit der Bezeichnung "MatchKey" und der Datensatz, der den Bereinigungsprozess durchgeht, erhält das Feld MATCH_KEY. Dieses Feld hat den Platzhalter [MATCHKEY]. Die Datensätze, die in der Kundendatenbank ausgewählt und an die vorhandene Datensammlung angehängt werden, enthalten denselben Wert in "MatchKey" wie im MATCH_KEY der Transaktion. Gehen wir in diesem Fall davon aus, dass es sich bei dem tatsächlichen Wert um eine 10-stellige Telefonnummer handelt. 444 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität Im Folgenden sehen Sie ein Beispiel dafür, wie Ihre SQL aussehen würde, wenn an der Stelle des Platzhalters [MATCHKEY] eine tatsächliche Telefonnummer steht. SELECT ContactGivenName1, ContactGivenName2, ContactFamilyName, Address1, Address2, City, Region, Postcode, Country, AddrStreet, AddrStreetNumber, AddrUnitNumber FROM TblCustomer WHERE MatchKey = '123-555-9876'; Achtung Es muss sichergestellt werden, dass die SQL-Anweisung für eine hohe Leistung optimiert ist und gültige Ergebnisse generiert. Dies wird nicht über die Operation zur Kandidatenauswahl gewährleistet. Ersetzen der Platzhalter durch tatsächliche Werte Nach dem Test der SQL mit tatsächlichen Werten müssen diese durch Platzhalter ersetzt werden (beispielsweise [MATCHKEY]. Ihre SQL sollte nun der folgenden Darstellung ähneln. SELECT ContactGivenName1, ContactGivenName2, ContactFamilyName, Address1, Address2, City, Region, Postcode, Country, AddrStreet, AddrStreetNumber, AddrUnitNumber FROM TblCustomer WHERE MatchKey = [MATCHKEY]; Hinweis Platzhalter können nicht für Listenwerte verwendet werden, beispielsweise in einer IN-Klausel: WHERE status IN ([status]) Wenn [Status] einer Werteliste entspricht, schlägt diese SQL-Anweisung fehl. 17.4.8.2.3 Vergleichstabellen Vergleichstabellen sind Sätze von Regeln, in denen definiert wird, welche Datensätze verglichen werden sollen. Sozusagen eine zusätzliche Möglichkeit zur Anlage von Zerlegungsgruppen. Sie verwenden die Werte Ihrer logischen Quelle, um festzulegen, welche Datensätze verglichen werden und welche nicht. Durch die Verwendung von Vergleichstabellen können Sie Datensätze innerhalb von Quellen vergleichen, Datensätze quellübergreifend vergleichen oder eine Kombination beider Vergleiche verwenden. 17.4.8.2.3.1 Einrichten von Vergleichstabellen Schließen Sie unbedingt ein Feld ein, das einen logischen Quellwert enthält, bevor Sie der Match-Transformation (in der Match-Ebenenoptionsgruppe) eine Vergleichstabellenoperation hinzufügen. Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 445 Sie sehen hier ein Beispiel, wie Sie eine Vergleichstabelle einrichten können. Angenommen, Sie haben zwei IDs (A und B) und möchten nur zwischen Quellen vergleichen, nicht innerhalb der Quellen. 1. Wenn im Bereich "Vergleich" keine Vergleichstabelle vorhanden ist, klicken Sie mit der rechten Maustaste auf Vergleich <Ebenenname> , und wählen Sie Hinzufügen Vergleichen . 2. Stellen Sie die Option Standardaktion auf Keine_Übereinstimmung ein, und geben Sie Ohne in der Option Logischer Standardquellwert ein. Damit wird die Match-Transformation angewiesen, nicht alles zu vergleichen, sondern die durch die Tabelleneinträge festgelegten Vergleichsregeln zu befolgen. Hinweis Gehen Sie bei der Wahl der Namen für die logische Quelle bedachtsam vor. Wenn Sie „Ohne“ bei der Option Logischer Standardquellwert eingeben, ist keine Ausführung möglich, wenn Sie eine Quell-ID mit dem Namen „Ohne“ haben. 3. Fügen Sie in der Tabelle Aktionen vergleichen eine Zeile hinzu, und setzen Sie dann Führender Wert auf A, und setzen Sie Begleitender Wert auf B. 4. Setzen Sie Aktion auf Vergleichen. Hinweis Berücksichtigen Sie dies bei allen logischen Quellwerten. Bei den oben eingegebenen Beispielwerten wird angenommen, dass A immer die führende ID ist. Wenn Sie erwarten, dass ein führender Datensatz einen anderen Wert als A hat, richten Sie den Tabelleneintrag so ein, dass er diesen Wert und den begleitenden ID-Wert berücksichtigt. Bedenken Sie, dass der führende Datensatz der Datensatz ist, der in einer Sammlung zuerst gelesen wird. Wenn Sie die Optionen Führender Wert oder Begleitender Wert in der Vergleichstabelle leer lassen, bedeutet dies, dass Sie alle Quellen vergleichen möchten. Ein führender Wert A und ein leerer begleitender Datensatz mit einer Vergleichsaktion sorgen deshalb dafür, dass ein Datensatz von A mit allen anderen begleitenden Datensätzen verglichen wird. Manchmal können Daten in Sammlungen anders sortiert werden (oder nicht sortiert werden, je nach Fall), als von der Vergleichstabelle erwartet wird. Dies kann dazu führen, dass beim Abgleichsprozess doppelte Datensätze nicht gefunden werden. In dem Beispiel bedeutet die Art und Weise, in der Sie die Tabellenzeile der Vergleichsaktion einrichten, dass Sie erwarten, dass der führende Datensatz einen führenden Wert A haben sollte. Wenn der führende Datensatz jedoch einen Wert B aufweist und der begleitende einen Wert A, werden sie nicht verglichen. Um Situationen zu berücksichtigen, in denen ein führender Datensatz beispielsweise einen Wert B und der begleitende Datensatz einen Wert A aufweist, schließen Sie eine weitere Zeile in die Tabelle ein, die das Gegenteil ausführt. Damit ist sichergestellt, dass alle Datensätze mit einem Wert A oder B verglichen werden, ungeachtet dessen, ob es sich dabei um den führenden oder den begleitenden Datensatz handelt. Hinweis Allgemein gilt, dass Sie bei Verwendung einer unterdrückten Quelle einen Vergleich innerhalb der anderen Quellen durchführen sollten. Dies stellt sicher, dass alle Übereinstimmungen dieser Quellen unterdrückt werden, wenn festgestellt wird, dass ein Datensatz in der unterdrückten Quelle dupliziert wird, ungeachtet dessen, bei welchem Datensatz es sich um den führenden Datensatz handelt. 446 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität 17.4.8.3 Anordnen und Priorisieren von Datensätzen Möglicherweise haben Sie Datenquellen, wie ein eigenes Data-Warehouse, denen Sie mehr vertrauen als den Datensätzen aus einer anderen Quelle, beispielsweise einer gemieteten Quelle. Eventuell bevorzugen Sie auch neuere Datensätze gegenüber älteren Datensätzen oder vollständigere Datensätze gegenüber Datensätzen mit leeren Feldern. Wie auch immer Ihre Präferenzen aussehen, mithilfe von Prioritäten können Sie diese im Abgleichprozess ausdrücken. In anderen Fällen möchten Sie vielleicht sicherstellen, dass die Datensätze in einer bestimmten Reihenfolge zu einer Operation wie "Abgleich" oder "Optimaler Datensatz" fließen. Beispielsweise sollen die Übereinstimmungsgruppen so geordnet sein, dass der erste Datensatz der neueste Datensatz der Gruppe ist. In diesem Fall können Sie die Datensätze auf der Basis eines Datumsfelds sortieren. Was auch immer die Motivation ist, es stehen zwei Möglichkeiten zum Anordnen der Datensätze entweder vor oder nach dem Vergleichsprozess zur Verfügung: ● Sortieren von Datensätzen in Zerlegungsgruppen oder Übereinstimmungsgruppen mithilfe eines Werts in einem Feld. ● Verwenden von Abzugswertpunktzahlen. Diese können pro Feld, pro Datensatz oder auf der Basis der Zugehörigkeit zu einer Eingabequelle definiert werden. Match-Editor Zum Definieren der Prioritäten und Anordnen der Datensätze können Sie die Operation "Gruppenpriorisierung" verwenden, die in der Operation "Gruppenbildung" und "Verarbeitung nach Abgleich" jeder Übereinstimmungsebene im Match-Editor zur Verfügung steht. Prioritätstypen Es gibt unterschiedliche Prioritätstypen, die zu berücksichtigen sind: Tabelle 191: Priorität Kurze Beschreibung Datensatzpriorität Priorisiert Datensätze aus einer Eingabequelle gegenüber Datensätzen aus anderen Eingabequel len. Abzugswert Weist Datensätzen, in denen ein bestimmtes Feld leer ist, eine niedrigere Priorität zu. Anordnung vor dem Abgleich Wenn Sie Zerlegungsgruppen anlegen, können Sie nicht nur nach dem Zerlegungsschlüssel sortieren, sondern auch die Operation Designer-Handbuch Datenqualität Gruppenbildung Gruppenpriorisierung für die Anordnung (oder Sortierung) nach einem PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 447 Feld einrichten. Damit wird sichergestellt, dass der Datensatz mit der höchsten Priorität der erste (führende) Datensatz in der Zerlegungsgruppe ist. Es empfiehlt sich zudem, dass unterdrückte Eingabequellen die führenden Datensätze in einer Zerlegungsgruppe sind. Anordnung nach dem Abgleich Nachdem alle Übereinstimmungsgruppen von der Match-Transformation angelegt wurden, und wenn die Reihenfolge wichtig ist, können Sie eine Operation „Gruppenpriorisierung“ vor einer Operation „Gruppenstatistik“, „Optimaler Datensatz“ und „Eindeutige ID“ verwenden, um sicherzustellen, dass der Stammdatensatz der erste Datensatz in der Übereinstimmungsgruppe ist. Tipp Wenn Sie keinen Abzugswert verwenden, ist die Reihenfolge für Sie möglicherweise nicht wichtig, und Sie schließen keine Operation "Gruppenpriorisierung" vor den Operationen nach dem Abgleich ein. Sie erzielen jedoch möglicherweise eine bessere Leistung bei einer Operation "Optimaler Datensatz", wenn Sie die Datensätze priorisieren und anschließend die Option Nur einmal pro Ziel senden auf "Ja" setzen. Abzugswert Wenn zwei Datensätze vorhanden sind, möchten Sie möglicherweise den Datensatz behalten, dessen Daten vollständiger sind. Sie können einen Abzugswert verwenden, um Datensätzen mit leeren Feldern eine niedrigere Priorität zuzuweisen. Die Verwendung eines Abzugswerts ist geeignet, wenn ein leeres Feld nicht verhindern soll, dass ein Datensatz einem anderen entspricht, und wenn Sie den vollständigeren Datensatz behalten möchten. Beispiel: Angenommen, Sie möchten einen Datensatz sogar dann als Übereinstimmung akzeptieren, wenn die Felder für das Namenspräfix, den ersten Vornamen, den zweiten Vornamen, das primäre Suffix und/oder die Sekundärnummer leer sind. Auch wenn Sie diese Datensätze in den Übereinstimmungsgruppen akzeptieren, können Sie ihnen für jedes leere Feld eine niedrigere Priorität zuweisen. 17.4.8.3.1 Anordnen von Datensätzen durch Sortieren nach einem Feld Sie müssen die Eingabefelder in der Match-Transformation, die Sie als Grundlage für die Sortierung verwenden möchten, zugeordnet haben, da sie sonst in der Drop-Down-Liste des Feldes nicht angezeigt werden. Verwenden Sie diese Methode zum Sortieren von Datensätzen, wenn für Sie die Vollständigkeit der Daten nicht wichtig ist. 1. Geben Sie einen Priorisierungsnamen ein, und wählen Sie den Tab "Prioritätsfolge". 448 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität 2. Wählen Sie in der Tabelle Prioritätsfelder ein Feld aus der Drop-Down-Liste in der Spalte Eingabefelder. 3. Wählen Sie in der Spalte Feldreihenfolge die Option Aufsteigend oder Absteigend, um die Art der Reihenfolge anzugeben. Wenn Sie beispielsweise eine Quelle des Typs "Normal" mit einer Quelle des Typs "Ausgeschlossen" vergleichen und zum Sortieren der Datensätze ein Feld des Typs "Quell-ID" verwenden, müssen Sie darauf achten, dass die Datensätze von der Quelle des Typs "Ausgeschlossen" in der Zerlegungsgruppe zuerst kommen. 4. Wiederholen Sie Schritt 2 für jede hinzugefügte Zeile. 5. Sortieren Sie die Zeilen in der Tabelle Prioritätsfelder mit den Schaltflächen Nach oben und Nach unten. Die erste Zeile ist die primäre Sortierpriorität, und der Rest ist die sekundäre Sortierpriorität. 17.4.8.3.2 Punktzahlsystem für Abzugswerte Bei den Abzugswerten handelt es sich um ein Punktzahlsystem. Sie können für jedes leere Feld einen beliebigen Abzugswert in Form einer nicht negativen Ganzzahl festlegen. Sie haben die Möglichkeit, für jedes leere Feld denselben Abzugswert festzulegen oder Feldern, die sie als wichtiger einstufen, einen höheren Abzugswert zuzuweisen. Wenn Sie beispielsweise Sendungen an Studenten planen, die vornehmlich in Etagenwohnungen oder Wohnheimen leben, könnten Sie einen höheren Abzugswert für ein leeres Feld "Vorname1" oder eine fehlende Wohnungsnummer zuweisen. Tabelle 192: Feld Abzugswert Namenspräfix 5 Vorname1 20 Vorname2 5 Suffix primär 5 Sekundärnummer 20 Demnach würden die Datensätze unten in der gezeigten Reihenfolge eingeordnet werden (ausgehend von der Tatsache, dass sie aus derselben Quelle stammen, sodass die Datensatzpriorität keine Rolle spielt). Obwohl im ersten Datensatz die Felder "Namenspräfix", "Vorname2" und "Suffix primär" leer sind, soll er als MasterDatensatz dienen, da er die Daten enthält, die als wichtiger eingestuft werden: "Vorname1" und "Sekundärnummer". Tabelle 193: Namens Vorname1 Vorname2 Nachname Primärer Primärer Suffix Sekundär Abzugswert für präfix (5) (20) (5) Name primär nummer leeres Feld Bereich (20) Maria Designer-Handbuch Datenqualität Ramirez 100 Main 6 5 + 5 + 5 = 15 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 449 Namens Vorname1 Vorname2 Nachname Primärer Primärer Suffix Sekundär Abzugswert für präfix (5) (20) (5) Name primär nummer leeres Feld Bereich (20) Ms. Maria Ms. A Ramirez 100 Main St Ramirez 100 Main St 20 6 20 + 5 = 25 17.4.8.3.3 Abzugswert im Zusammenspiel mit Datensatzpriorität Die Datensatzprioritäts- und Abzugswertpunktzahlen werden zusammengenommen und als eine einzige Punktzahl betrachtet. Nehmen Sie beispielsweise an, dass Datensätze aus Ihrer Hausdatenbank hohe Priorität, Datensätze mit leeren Feldern aber gleichzeitig eine niedrige Priorität haben sollen. Ist die Zugehörigkeit zu einer Quelle wichtiger, selbst wenn einige Felder leer sind? Oder ist es wichtiger, dass Datensätze so vollständig wie möglich sind, selbst wenn sie nicht aus der Hausdatenbank stammen? In den meisten Fällen wird Hausdatensätzen Priorität gegenüber leeren Feldern eingeräumt. Damit dies geschieht, legen Sie einen hohen Abzugswert für die Zugehörigkeit zu einer Mietquelle fest, und einen niedrigeren Abzugswert für leere Felder: Tabelle 194: Quelle Datensatzpriorität Feld Abzugswert Hausquelle 100 Vorname1 20 Mietquelle A 200 Vorname2 5 Mietquelle B 300 Suffix primär 5 Mietquelle C 400 Sekundärnummer 20 Bei diesem Punktesystem hat ein Datensatz aus der Hausquelle immer Vorrang vor einem Datensatz aus einer Mietquelle, selbst wenn der Hausdatensatz leere Felder aufweist. Nehmen Sie beispielsweise an, dass sich die Datensätze unten in derselben Übereinstimmungsgruppe befinden. Obwohl der Hausdatensatz fünf leere Felder enthält, erhält er nur 155 Abzugspunkte (100 + 5 + 20 + 5 + 5 + 20), während der Datensatz aus Quelle A 200 Abzugspunkte erhält. Der Hausdatensatz weist somit den niedrigeren Abzugswert und damit die höhere Priorität auf. 450 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität Tabelle 195: Quelle Vor Vor Nach Primärer Primärer Sekun Postleit Daten name1 name2 name Bereich Name ÌVyŸN÷#\¶˝“À±ßñ zahl ÌVy‘Nr%\¢˝‹À®ÿ‹îÂÂfl˛Lïº wert mer Haus Quelle A Rita Quelle B Rita A Smith 100 Bren Smith 100 Bren Smith 100 Bren Abzugs Summe tät 55343 100 55 155 12A 55343 200 0 200 12 55343 300 10 310 Sie können die Punktzahlen bearbeiten, um die Priorität ganz nach Ihren Wünschen zu setzen. Wenn Sie im Beispiel oben einen Mietdatensatz mit Daten für den Vornamen einem Hausdatensatz ohne Daten für den Vornamen vorziehen, könnten Sie die Abzugswertpunktzahl für fehlende Vornamen auf 500 festlegen, sodass ein leeres Vornamenfeld mehr Gewicht hat als die Zugehörigkeit zu einer Quelle. 17.4.8.3.4 Definieren von Priorität und Abzugswert mithilfe von Feldwerten Stellen Sie sicher, dass Sie Eingabefelder berücksichtigen, die Prioritäts- oder Abzugswerte enthalten. Diese Aufgabe informiert Match darüber, welche Felder die Prioritäts- und Abzugswerte für die Datensätze enthalten und ob diese Werte auf den Datensatz anzuwenden sind. 1. Fügen Sie zum Abschnitt "Gruppenbildung" oder "Verarbeitung nach Abgleich" im Match-Editor eine Gruppenpriorisierungsoperation hinzu. 2. Geben Sie ggf. den Namen der Priorisierung ein, und wählen Sie den Tab Datensatzvollständigkeit aus. 3. Wählen Sie die Option Datensätze abhängig von Datenvollständigkeit sortieren. 4. Wählen Sie die Option Felder für Priorität und Abzugswert definieren aus. ○ Abzugswerte nur für Felder definieren: Mit dieser Option können Sie eine Standarddatensatzpriorität und einen Standardabzugswert pro Feld auswählen, um die Prioritätspunktzahl zu generieren. ○ Priorität und Abzugswert abhängig von Eingabequelle definieren: Mit dieser Option können Sie die Priorität und den Abzugswert auf der Basis der Zugehörigkeit zu einer Eingabequelle definieren. 5. Wählen Sie bei der Option Feld für Datensatzpriorität ein Feld aus, das den Datensatzprioritätswert enthält. 6. Wählen Sie bei der Option Feld für Anwendung von Abzugswerten ein Feld aus, das den Indikator Y oder N für die Anwendung eines Abzugswerts auf einen Datensatz enthält. 7. Geben Sie bei der Option Standarddatensatzpriorität einen Standardwert für die Datensatzpriorität an, der verwendet werden soll, wenn ein Datensatzprioritätsfeld leer ist oder wenn Sie kein Datensatzprioritätsfeld angeben. 8. Wählen Sie einen Wert für Standard für Anwendung von Abzugswerten ("Ja" oder "Nein"). Dies legt fest, ob die Match-Transformation einen Abzugswert auf einen Datensatz anwendet, wenn Sie kein Feld für die Anwendung von Abzugswerten ausgewählt haben, oder wenn das Feld für einen bestimmten Datensatz leer ist. 9. Wählen Sie in der Tabelle Abzugswertpunktzahl ein Feld aus der Spalte Eingabefeld aus, dem Sie Abzugswerte zuweisen möchten. 10. Geben Sie in der Spalte Abzugswert einen Abzugswert ein, der auf jeden Datensatz angewendet werden soll, der keinen Wert in dem Feld enthält, das Sie in der Spalte Eingabefeld ausgewählt haben. Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 451 17.4.8.3.5 Definieren von Abzugswerten nach Feld Mit dieser Aufgabe können Sie die standardmäßige Prioritätspunktzahl für jeden Datensatz und Abzugswerte pro Feld definieren, um Ihre Abzugswertpunktzahl zu generieren. 1. Fügen Sie zum Abschnitt "Gruppenbildung" oder "Verarbeitung nach Abgleich" im Match-Editor eine Gruppenpriorisierungsoperation hinzu. 2. Geben Sie ggf. den Namen der Priorisierung ein, und wählen Sie den Tab Datensatzvollständigkeit aus. 3. Wählen Sie die Option Datensätze abhängig von Datenvollständigkeit sortieren. 4. Wählen Sie die Option Abzugswerte nur für Felder definieren. 5. Geben Sie in der Option Standarddatensatzpriorität eine Standarddatensatzpriorität ein, die bei der Abzugswertpunktzahl für jeden Datensatz verwendet wird. 6. Wählen Sie einen Wert für Standard für Anwendung von Abzugswerten ("Ja" oder "Nein"). Dies legt fest, ob die Match-Transformation einen Abzugswert auf einen Datensatz anwendet, wenn Sie kein Feld für die Anwendung von Abzugswerten ausgewählt haben, oder wenn das Feld für einen bestimmten Datensatz leer ist. 7. Wählen Sie in der Tabelle Abzugswertpunktzahl ein Feld aus der Spalte Eingabefeld aus, dem Sie Abzugswerte zuweisen möchten. 8. Geben Sie in der Spalte Abzugswert einen Abzugswert ein, der auf jeden Datensatz angewendet werden soll, der keinen Wert in dem Feld enthält, das Sie in der Spalte Eingabefeld ausgewählt haben. 17.4.8.4 Priorisieren von Datensätzen basierend auf einer Mitgliedschaft in der Quelle Sie werden jedoch vielleicht lieber Ihre Quellen priorisieren (durch Sortieren einer Zerlegungsgruppe oder mithilfe von Punktzahlen von Abzugswerten). Dann müssen Sie sicherstellen, dass Ihre Quelldatensätze des Typs "Unterdrücken" die führenden Datensätze in der Zerlegungsgruppe und beim Vergleichsprozess sind. Nehmen wir beispielsweise an, dass Sie eine gemeinnützige Stiftung sind und dass Sie an Ihre aktuellen Spender und an Namen aus zwei gemieteten Quellen ein Bittschreiben versenden. Wenn in Ihrer internen und einer gemieteten Quelle ein Name erscheint, verwenden Sie bevorzugt den Namen aus Ihrer internen Quelle. Nehmen wir ferner an, dass Sie für eine der gemieteten Quellen, Quelle B, einen Rabatt für alle Datensätze aushandeln können, die Sie nicht verwenden. Sie möchten möglichst wenige Datensätze von Quelle B verwenden, sodass Sie einen größtmöglichen Rabatt erzielen können. Deshalb möchten Sie Datensätzen von Quelle B die von allen drei Quellen geringste Priorität zuweisen. Tabelle 196: Quelle Priorität Eigene Quelle Höchste Gemietete Quelle A Mittel Gemietete Quelle B Geringste 452 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität Quellen vom Typ "Unterdrücken" und Vollständigkeit der Datensätze Wenn Sie Punktzahlen von Abzugswerten verwenden möchten, sollen Ihre Quellen vom Typ "Unterdrücken" einen Punktewert von geringer Priorität haben. Damit wird es wahrscheinlich, dass normale Datensätze, die einem Unterdrückungsdatensatz entsprechen, in einer Übereinstimmungsgruppe untergeordnete Übereinstimmungen sind, und deshalb werden sie ebenfalls unterdrückt. Innerhalb jeder Übereinstimmungsgruppe wird jeder Datensatz, der eine geringere Priorität aufweist als ein Datensatz aus einer Unterdrückungsquelle, als Unterdrückungsdatensatz angesehen. Gehen wir beispielsweise davon aus, dass Sie Dateien gegen die DMA Mail Preference File (eine Liste von Leuten, die keine Werbeaussendungen erhalten möchten) ausführen. Sie würden die DMA-Quelle als Unterdrückungsquelle identifizieren und ihr eine Priorität null zuweisen. Tabelle 197: Quelle Priorität DMA-Unterdrückungsquelle 0 Eigene Quelle 100 Gemietete Quelle A 200 Gemietete Quelle B 300 Angenommen, Match fand Ihre übereinstimmenden Datensätze in den Eingabedatensätzen. Tabelle 198: Quelle Priorität Ramirez Eigene 100 Ramirez Quelle B 300 Übereinstimmender Datensatz (nur Namensfelder) Maria Ms. Ms. Maria A Ramirez Quelle A 200 Ms. Maria A Ramirez DMA 0 Die folgende Übereinstimmungsgruppe würde hergestellt. Basierend auf ihrer Priorität würde Match den Datensätzen die abgebildete Rangfolge zuordnen. Demzufolge wäre der Datensatz von der Unterdrückungsdatei (die DMA-Quelle) der Stammdatensatz, und die anderen wären untergeordnete Unterdrückungsübereinstimmungen und würden somit ebenfalls unterdrückt. Tabelle 199: Quelle Priorität DMA 0 (Stammdatensatz) Eigene 100 Quelle A 200 Quelle B 300 Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 453 17.4.8.4.1 Definieren von Abzugswerten aufgrund der Mitgliedschaft in einer Quelle Mit dieser Aufgabe können Sie Prioritätspunktzahlen und Abzugswerte für leere Felder einer Eingabequelle zuweisen und dadurch diese Punktzahlen auf alle zu der betreffenden Quelle gehörenden Datensätze anwenden. Achten Sie jedoch darauf, zuerst die Eingabequellen zu definieren, bevor Sie versuchen, diese Aufgabe auszuführen. 1. Fügen Sie zum Abschnitt "Gruppenbildung" oder "Verarbeitung nach Abgleich" im Match-Editor eine Gruppenpriorisierungsoperation hinzu. 2. Geben Sie ggf. den Namen der Priorisierung ein, und wählen Sie den Tab Datensatzvollständigkeit aus. 3. Wählen Sie die Option Datensätze abhängig von Datenvollständigkeit sortieren. 4. Wählen Sie die Option Priorität und Abzugswert abhängig von Eingabequelle definieren aus. 5. Wählen Sie in der Tabelle Quellattribute eine Quelle aus der Auswahlliste aus. 6. Geben Sie in der Spalte Priorität einen Wert ein, um der Quelle eine Datensatzpriorität zuzuweisen. Beachten Sie, dass die Priorität umso höher ist, je niedriger die Punktzahl ist. Sie weisen beispielsweise einer Quelle vom Typ "Unterdrückung" eine sehr niedrige Punktzahl (beispielsweise 0) zu. 7. Wählen Sie in der Spalte Abzugswert anwenden "Ja" oder "Nein" aus, um festzulegen, ob für Datensätze dieser Quelle ein Abzugswert angewandt werden soll. 8. Geben Sie unter der Option Standarddatensatzpriorität eine Priorität ein, die hinsichtlich der Abzugswertpunktzahl für alle Datensätze verwendet wird, die nicht Mitglied einer Quelle sind. 9. Wählen Sie einen Wert für Standard für Anwendung von Abzugswerten ("Ja" oder "Nein"). Hierdurch wird bestimmt, ob Abzugswerte auf einen Datensatz angewandt werden, der kein Mitglied einer Quelle ist. 10. Wählen Sie in der Tabelle Abzugswertpunktzahl ein Feld aus der Spalte Eingabefeld aus, dem Sie Abzugswerte zuweisen möchten. 11. Geben Sie in der Spalte Abzugswert einen Abzugswert ein, der auf jeden Datensatz angewendet werden soll, der keinen Wert in dem Feld enthält, das Sie in der Spalte Eingabefeld ausgewählt haben. 17.4.8.5 Datenrettung Bei der Datenrettung werden vorübergehend Daten von einem begleitenden Datensatz in den führenden Datensatz kopiert, nachdem die beiden Datensätze miteinander verglichen wurden. Die Daten, die kopiert werden, befinden sich im begleitenden Datensatz, fehlen jedoch ganz oder teilweise im führenden Datensatz. Bei der Datenrettung wird die Übereinstimmung von Leerelementen bzw. Initialen von übereinstimmenden Datensätzen verhindert, die Sie nicht abgleichen möchten. Gehen wir als Beispiel von der folgenden Übereinstimmungsgruppe aus. Wenn Sie die Datenrettung nicht aktiviert haben, würden alle Datensätze in der ersten Tabelle zu derselben Übereinstimmungsgruppe gehören, weil der führende Datensatz, der ein leeres Namensfeld enthält, mit beiden anderen Datensätzen übereinstimmt. Tabelle 200: Datensatz 1 (führender Da tensatz) 454 Name Adresse Postleitzahl 123 Main St. 54601 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität Datensatz Name Adresse Postleitzahl 2 John Smith 123 Main St. 54601 3 Jack Hill 123 Main St. 54601 Wenn Sie die Datenrettung aktiviert haben, würde die Software "John Smith" vorübergehend vom zweiten Datensatz in den führenden Datensatz kopieren. Das Ergebnis: Datensatz Nr. 1 stimmt mit Datensatz Nr. 2 überein, aber Datensatz Nr. 1 stimmt nicht mit Datensatz Nr. 3 überein (weil "John Smith" nicht mit "Jack Hill" übereinstimmt). Tabelle 201: Datensatz Name Adresse Postleitzahl 1 (führender Datensatz) John Smith (vom Datensatz unten kopiert) 123 Main St. 54601 2 John Smith 123 Main St. 54601 3 Jack Hill 123 Main St. 54601 Im folgenden Beispiel wird gezeigt, wie dies für eine ausgeschlossene Quelle verwendet wird. Gehen wir davon aus, dass die ausgeschlossene Quelle eine Liste mit nicht Adressen ist, deren Empfänger keine Werbung möchten. In diesem Fall würden Sie die ausgeschlossene Quelle als höchste Priorität einstufen und die Datenrettung nicht aktivieren. Auf diese Weise schließt die Software alle Datensätze aus, die mit den Datensätzen der ausgeschlossenen Quelle übereinstimmen. Der ausgeschlossene Datensatz "123 Main St" würde beispielsweise mit "123 Main St #2" und "123 Main St Apt C" übereinstimmen; beide Datensätze würden ausgeschlossen. 17.4.8.5.1 Datenrettung und Initialen Wenn das Namensfeld eines führenden Datensatzes Initialen statt eines vollständigen Namens enthält, leiht sich die Software vorübergehend den vollständigen Namen aus, sofern sie diesen im entsprechenden Feld eines übereinstimmenden Datensatzes findet. Dies ist eine Form der Datenrettung. Nehmen Sie zur Veranschaulichung an, dass die folgenden drei Datensätze potenziell übereinstimmende Datensätze darstellen (die Software hat diese beispielsweise als Mitglieder einer Zerlegungsgruppe auf Basis von Adress- und Postleitzahlendaten zusammengefasst). Hinweis Die Übernahme von Daten für Initialen erfolgt nur für die Vor- und Nachnamenfelder. Datensatz Vorname Nachname Adresse Hinweise 357 J L 123 Main Führender Datensatz 391 Juanita Lopez 123 Main 839 Joanne London 123 Main Designer-Handbuch Datenqualität Rangniedrigster Datensatz PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 455 Der erste Übereinstimmungsvergleich erfolgt zwischen dem führenden Datensatz (357) und dem nächsten ranghöheren Datensatz (391). Diese zwei Datensätze werden als Übereinstimmung bezeichnet. "Juanita" und "Lopez" werden vorübergehend in die Namensfelder von Datensatz Nr. 357 kopiert. Der nächste Vergleich findet zwischen Datensatz 357 und dem nächsten rangniedrigeren Datensatz (839) statt. Dank Datenrettung lauten die Namensdaten des führenden Datensatzes jetzt "Juanita Lopez" ("ausgeliehen" aus dem ersten Vergleich). Daher wird Datensatz 839 vermutlich nicht als Übereinstimmung mit Datensatz 357 angesehen. Durch die Beibehaltung von mehr Informationen für den führenden Datensatz trägt die Datenrettung zur besseren Qualität der Übereinstimmungsergebnisse bei. Initialen und Unterdrückungsdatensätze Wenn es sich beim führenden Datensatz jedoch um einen Unterdrückungsdatensatz handelt, sollten Sie eventuell die Datenrettung deaktivieren. Sie erhöhen damit die Wahrscheinlichkeit, dass alle Datensätze identifiziert werden, die mit den Initialenunterdrückungsdaten übereinstimmen. Wenn Sie beispielsweise Namen, die aus den Initialen JL bestehen, unterdrücken möchten (wie im Fall oben), möchten Sie nach allen Übereinstimmungen mit JL suchen, ungeachtet der Reihenfolge, in der die Datensätze in der Zerlegungsgruppe vorgefunden werden. Wenn Sie die Datenrettung für die Datensätze dieser Unterdrückungsquelle deaktiviert haben, geschieht während dieser zwei Übereinstimmungsvergleiche Folgendes: Datensatz Vorname Nachname Adresse Hinweise 357 J L 123 Main Führender Datensatz 391 Juanita Lopez 123 Main 839 Joanne London 123 Main Rangniedrigster Datensatz Der erste Übereinstimmungsvergleich erfolgt zwischen dem führenden Datensatz (357) und dem nächsten ranghöheren Datensatz (391). Diese zwei Datensätze werden als Übereinstimmung bezeichnet, da "JL" aus dem führenden Datensatz und "Juanita Lopez" als Übereinstimmung angesehen werden. Der nächste Vergleich findet zwischen dem führenden Datensatz (357) und dem nächsten rangniedrigeren Datensatz (839) statt. Dieses Mal werden diese zwei Datensätze ebenfalls als Übereinstimmung eingestuft, da "JL" aus dem führenden Datensatz mit "Joanne London" übereinstimmt. Da die beide Datensätze 391 und 839 mit dem führenden Unterdrückungsdatensatz übereingestimmt haben, werden sie beide als Unterdrückungsübereinstimmungen gekennzeichnet und daher nicht in die Ausgabe eingeschlossen. 17.4.8.5.2 Steuern der Datenrettung mit einem Feld Sie können mit einem Feld steuern, ob die Datenrettung aktiviert ist. Wenn der Wert des Feldes für einen Datensatz "J" lautet, ist die Datenrettung aktiviert. Ordnen Sie vorher das Feld der Match-Transformation zu, die Sie verwenden möchten. 456 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität 1. Öffnen Sie den Match-Editor für eine Match-Transformation. 2. Klicken Sie im Fenster "Transformationsoptionen" auf den Tab Datenrettung. 3. Wählen Sie zunächst die Option "Datenrettung aktivieren" und dann einen Standardwert für diese Datensätze. Der Standardwert wird in den Fällen verwendet, in denen das gewählte Feld für einen bestimmten Datensatz nicht ausgefüllt wird. 4. Wählen Sie die Option Datenrettung nach Feld festlegen und anschließend ein Feld aus dem Drop-DownMenü. 17.4.8.5.3 Steuern der Datenrettung nach Quelle Sie können die Mitgliedschaft in einer Eingabequelle verwenden, um zu steuern, ob die Datenrettung für einen bestimmten Datensatz aktiviert oder deaktiviert ist. Stellen Sie sicher, dass die Eingabequellen vorher angelegt wurden. 1. Öffnen Sie den Match-Editor für eine Match-Transformation. 2. Klicken Sie im Fenster "Transformationsoptionen" auf den Tab Datenrettung. 3. Wählen Sie die Option Datenrettung aktivieren, und wählen Sie einen Standardwert für diese Datensätze aus. Der Standardwert wird verwendet, wenn die Eingabequelle eines Datensatzes in den folgenden Schritten nicht angegeben wird. 4. Wählen Sie die Option Datenrettung nach Quelle festlegen. 5. Wählen Sie in der Tabelle eine Quelle und dann einen Wert für "Datenrettung ausführen" für jede Quelle, die Sie verwenden möchten. 17.4.9 Übereinstimmungskriterien 17.4.9.1 Überblick über Übereinstimmungskriterien Mit Übereinstimmungskriterien legen Sie auf jeder Übereinstimmungsebene die Schwellenwerte für den Abgleich fest und definieren, wie verschiedene Typen von Daten, wie zum Beispiel numerische, fehlende und Namensdaten, verarbeitet werden (Ihre Business-Regeln). Sie können alle diese Aufgaben in der Optionsgruppe "Kriterien" des Match-Editors ausführen. Übereinstimmungskriterien Für die Match-Transformation stellen die Übereinstimmungskriterien die Felder dar, die Sie vergleichen möchten. Wenn Sie beispielsweise den Abgleich für die ersten zehn Zeichen eines Vornamens und die ersten fünfzehn Zeichen des Nachnamens durchführen möchten, müssen Sie zwei Kriterien anlegen, die diese Anforderungen angeben. Über Kriterien können Sie der Match-Transformation mitteilen, welche Art von Daten sich im Eingabefeld befinden und welche Typen von Operationen daher für diese Daten auszuführen sind. Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 457 Vordefinierte Kriterien im Vergleich zu benutzerdefinierten Kriterien Es gibt zwei Arten von Kriterien: ● Vordefinierte Kriterien stehen für Felder zur Verfügung, die normalerweise für den Abgleich verwendet werden, beispielsweise Name, Adresse und andere Daten. Durch die Zuweisung eines Kriteriums zu einem Feld kann die Match-Transformation feststellen, welcher Typ von Daten sich im Feld befindet, und interne Operationen zur Optimierung der Daten für den Abgleich durchführen, ohne die eigentlichen Eingabedaten zu ändern. ● Benutzerdefinierte Data Cleanse-Ausgabefelder (nicht anbieterspezifische Daten) stehen als vordefinierte Kriterien zur Verfügung. Ordnen Sie die benutzerdefinierten Ausgabefelder aus Data Cleanse zu, sodass die benutzerdefinierten Felder auf dem Tab "Kriterienfelder" des Match-Editors angezeigt werden. Alle anderen Typen von Daten (wie Teilenummern oder andere proprietäre Daten), für die keine vordefinierten Kriterien vorhanden sind, sollten als benutzerdefinierte Kriterien gekennzeichnet werden. Bestimmte Funktionen können für benutzerdefinierte Schlüssel ausgeführt werden, beispielsweise Abkürzungs-, Teilzeichenfolgen- und numerische Abgleiche, allerdings kann die Match-Transformation manche feldübergreifende Vergleiche wie verschiedene Namensabgleichfunktionen nicht ausführen. Übereinstimmungskriterienoptionen vor dem Vergleich Ein Großteil der Datenstandardisierung sollte in den Adressbereinigungs- und Data Cleanse-Transformationen stattfinden. Die Match-Transformation kann jedoch einige Vorverarbeitungsschritte pro Kriterium ausführen (nur für Abgleichzwecke ohne Auswirkung auf die eigentlichen Daten), um genauere Übereinstimmungen zu liefern. Die Optionen zum Steuern dieser Standardisierung befinden sich auf den Tabs „Optionen“ und „Vergleiche mehrerer Felder“ des Match-Editors. Hierzu gehören: ● Diakritische Zeichen konvertieren ● Text in Zahlen konvertieren ● In Großbuchstaben konvertieren ● Interpunktion entfernen ● Gebietsschema Weitere Informationen zu diesen Optionen finden Sie im Abschnitt zur Match-Transformation im Referenzhandbuch. 17.4.9.1.1 Hinzufügen und Anordnen von Übereinstimmungskritierien Sie können jeder Übereinstimmungsebene in der Match-Transformation so viele Kriterien wie gewünscht hinzufügen. 1. Wählen Sie die entsprechende Übereinstimmungsebenen- oder Übereinstimmungskriterienoptionsgruppe in der Optionsübersicht des Match-Editors aus, und klicken Sie mit der rechten Maustaste darauf. 2. Wählen Sie Kriterien aus. 3. Geben Sie einen Namen für die Kriterien in das Feld Kriterienname ein. 458 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität Sie können den Standardnamen für vordefinierte Kriterien übernehmen, allerdings sollten Sie bei Wahl von benutzerdefinierten Kriterien einen aussagekräftigen Kriteriennamen eingeben. 4. Wählen Sie auf dem Tab Kriterienfelder aus der Liste Verfügbare Kriterien die Kriterien aus, die die abzugleichenden Daten am besten repräsentieren. Wenn bei den verfügbaren Kriterien nicht fündig werden, wählen Sie die benutzerdefinierten Kriterien aus. 5. Wählen Sie in der Tabelle Kriterienfeldzuordnung den Namen eines zugeordneten Eingabefelds aus, das die Daten enthält, die mit diesen Kriterien abgeglichen werden sollen. 6. Klicken Sie auf den Tab Optionen. 7. Konfigurieren Sie die Vorvergleichsoptionen und Vergleichsregeln. Vergessen Sie nicht, die Match- und Nichtübereinstimmungspunktzahl festzulegen, da diese erforderlich sind. 8. Wenn der Vergleich mehrerer Felder (feldübergreifend) aktiviert werden soll, klicken Sie auf den Tab Vergleiche mehrerer Felder und wählen die Option Mehrere Felder vergleichen aus. a. Bestimmen Sie, wie der Vergleich mehrerer Felder auszuführen ist: ○ Mit allen gewählten Feldern in anderen Datensätzen: Vergleicht jedes Feld mit allen in der Tabelle ausgewählten Feldern in allen Datensätzen. ○ Mit identischem Feld in anderen Datensätzen: Vergleicht jedes Feld nur mit demselben Feld in allen Datensätzen. b. Wählen Sie in der Tabelle Zusätzliche zu vergleichende Felder Eingabefelder aus, die die Daten enthalten, die in den Vergleich mehrerer Felder für die jeweiligen Kriterien einbezogen werden sollen. Tipp Sie können für den Vergleich mehrerer Felder benutzerdefinierte Namen für die Übereinstimmungskriterienfelder verwenden, indem Sie in der Spalte Benutzerdefinierter Name die entsprechenden Eingaben vornehmen. Hinweis Bei Aktivierung des Vergleichs mehrerer Felder werden entsprechende Übereinstimmungsstandardfelder aus der Tabelle Kriterienfeldzuordnung auf dem Tab Kriterienfelder entfernt. Wenn Sie diese in den Abgleichprozess einbeziehen möchten, fügen Sie sie der Tabelle Zusätzliche zu vergleichende Felder hinzu. 9. Konfigurieren Sie die Vorvergleichsoptionen für den Vergleich mehrerer Felder. 10. Um die Kriterien in der Optionsübersicht des Match-Editors (oder der Match-Tabelle) anzuordnen, wählen Sie ein Kriterium aus, und klicken Sie auf die Schaltfläche Nach oben bzw. Nach unten. 17.4.9.1.2 Einrichten der Standardkriterien für die Übereinstimmung Stellen Sie sicher, dass Sie das Anlegen und Zuordnen in Übereinstimmungsstandardfeldern der Data CleanseTransformation ausgeführt haben. 1. Fügen Sie in der Match-Transformation das Übereinstimmungskriterium "Person1_Vorname1" ein, indem Sie es aus der Kategorie "Person" auswählen. Der Editor fügt dieses Kriterium und die zugehörigen Standardkriterien für die Übereinstimmung automatisch zur Tabelle Kriterienfeldzuordnung hinzu. Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 459 2. Wählen Sie ein Feld in der Spalte Zugeordneter Name des Eingabefelds, das die zu vergleichenden Daten am besten repräsentiert. Führen Sie diese Schritte für Vorname2 vollständig aus, verwenden Sie dabei jedoch folgende Kriterien: ● Vorname2_Person1 ● ÜBEREINSTIMMUNGSSTD1_VORNAME2_PERSON1 ● ÜBEREINSTIMMUNGSSTD2_VORNAME2_PERSON1 ● ÜBEREINSTIMMUNGSSTD3_VORNAME2_PERSON1 Sie können Übereinstimmungsstandards auch für die Felder „Vorname“, „Genealogischer Namenszusatz“, „Akademischer Grad“, „Unternehmen“ und „Unternehmensort“ verwenden. 17.4.9.2 Abgleichmethoden Ihnen stehen einige Methoden zur Verfügung, um Ihre Kriterien so einzurichten und zu sortieren, dass Sie die gewünschten übereinstimmenden Ergebnisse erhalten. Jede dieser Methoden hat Vor- und Nachteile, wägen Sie die Verwendung also gut ab. Tabelle 202: Abgleichmethode Beschreibung Regelbasiert Ermöglicht Ihnen, festzulegen welche Kriterien eine Übereinstimmung bedingen. Die Einrichtung dieser Methode ist einfach. Gewichtete Punkt zahl Bietet die Möglichkeit, einem Kriterium Wichtigkeit oder Gewichtung zuzuweisen. Bei der gewichteten Punktzahl wird jedoch vor der Bestimmung einer Übereinstimmung jede Regel ausgewertet, was zu einer höheren Verarbeitungszeit führen kann. Kombinationsme thode Die relativen Vor- und Nachteile ähneln denen der beiden anderen Methoden. 17.4.9.2.1 Ähnlichkeitsgrad Der Ähnlichkeitsgrad ist ein Prozentsatz, der darüber Aufschluss gibt, wie ähnlich sich Daten sind. Dieser Prozentsatz wird beim Datensatzvergleich intern von der Anwendung berechnet. Ob die Anwendung die Datensätze als Übereinstimmung einstuft, hängt von den Übereinstimmungs- und Nichtübereinstimmungspunktzahlen ab, die Sie in der Optionsgruppe "Kriterien" festlegen (sowie von anderen Faktoren, die hier jedoch noch nicht beleuchtet werden sollen). Beispiel An diesem Beispiel wird veranschaulicht, die Ähnlichkeitsgrade bestimmt werden. Beachten Sie dabei Folgendes: ● Die Vergleichstabelle unten dient nur als Beispiel. Bei der gewichteten Vergleichsmethode funktioniert der Abgleichprozess beispielsweise anders. ● Nur der erste Vergleich wird als Übereinstimmung eingestuft, da der Ähnlichkeitsgrad der Übereinstimmungspunktzahl entspricht oder diese übertrifft. Der letzte Vergleich gilt als Nichtübereinstimmung, da der Ähnlichkeitsgrad unter der Nichtübereinstimmungspunktzahl liegt. 460 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität ● Wenn ein einzelnes Kriterium nicht ausreicht, um über Übereinstimmung oder Nichtübereinstimmung zu entscheiden (wie im Falle des zweiten Vergleichs in der Tabelle unten), untersucht der Prozess gegebenenfalls das nächste Kriterium. Tabelle 203: Vergleich Keine Übereinstim Übereinstimmung Ähnlichkeitspunkt mung Übereinstimmung? zahl Smith > Smith 72 95 100 % Ja Smith > Smitt 72 95 80 % Hängt von anderen Kriterien ab Smith > Smythe 72 95 72 % Nein Smith > Jones 72 95 20 % Nein 17.4.9.2.2 Regelbasierte Methoden Bei der regelbasierten Abgleichung ermitteln Sie Übereinstimmungen innerhalb eines Kriteriums nur anhand Ihrer Übereinstimmungs- bzw. Nichtübereinstimmungspunktzahlen. Beispiel Das nachstehende Beispiel zeigt, wie Sie diese Methode in der Match-Transformation einrichten. Tabelle 204: Kriterien Datensatz A Datensatz B Nichtüber Überein D|ł-?Û8—å\?6/xł�3Æ stimmung mung Ähnlich D|ł#?×8…å[?1/ałµ¸flck³Z zahl Vorname1 Mary Mary 82 101 100 Nachname Smith Smitt 74 101 80 E-Mail [email protected] [email protected] 79 80 91 Durch Eingeben eines Wertes von 101 für die Übereinstimmungspunktzahl aller Kriterien mit Ausnahme des letzten Kriteriums ergeben die Kriterien "Vorname1" und "Nachname" niemals eine Übereinstimmung, können aber eine Nichtübereinstimmung ergeben. Indem die Optionen Übereinstimmungspunkte und Punktzahl bei Nichtübereinstimmung für die E-Mailkriterien ohne Abstand zueinander festgelegt werden, muss es sich bei allen Vergleichen, die das letzte Kriterium erreichen, entweder um eine Übereinstimmung oder um eine Nichtübereinstimmung handeln. Eine Übereinstimmungspunktzahl von 101 stellt sicher, dass die Datensätze bei diesen Kriterien nicht als übereinstimmend gelten, da sich zwei Felder nicht um mehr als 100 Prozent ähneln können. Nicht vergessen Die Reihenfolge ist wichtig! Aus Leistungsgründen sollten Sie das Kriterium, das mit größter Wahrscheinlichkeit für die Entscheidung "Übereinstimmung" bzw. "Nichtübereinstimmung" verantwortlich Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 461 ist, in der Reihenfolge der Kriterien an erster Stelle anordnen. Dies kann dazu beitragen, die Anzahl der Kriterienvergleiche zu reduzieren. 17.4.9.2.3 Gewichtete Vergleichsmethode Bei einer regelbasierten Übereinstimmungsmethode weist die Anwendung allen Kriterien die gleiche Bedeutung (oder Gewichtung) zu. Wenn also ein Kriterium nicht der festgelegten Punktzahl bei Übereinstimmung entspricht, bestimmt die Anwendung, dass die Datensätze nicht übereinstimmen. Wenn Sie die Gewichtete Vergleichsmethode anwenden, verwenden Sie die Gesamtbeitrags-Punktzahl für die Bestimmung der Übereinstimmung, im Gegensatz zur alleinigen Verwendung von Punktzahlen bei Übereinstimmung und Nichtübereinstimmung. Gewichtungswerte Mithilfe von Gewichtungswerten können Sie einzelnen Kriterien Gewichtungen zuweisen. Je höher der Wert, desto mehr Gewichtung hat dieses Kriterium bei der Bestimmung von Übereinstimmungen. Im Allgemeinen sind Kriterien, die mehr Gewicht haben können als andere, Kontonummern, Sozialversicherungsnummern, Kundennummern, Postleitzahl1 und Adressen. Hinweis Alle Gewichtungswerte für alle Kriterien, die diese aufweisen, müssen insgesamt 100 ergeben. Sie brauchen nicht für alle Kriterien Gewichtungswerte zu haben. Sie können den Gewichtungswert eines Kriteriums in der Option "Beitrag zu gewichteter Punktzahl" in der Optionsgruppe "Kriterien" definieren. Beitrag und Gesamtbeitrags-Punktzahl Die Match-Transformation generiert die Beitragspunktzahl für alle Kriterien, indem der Gewichtungswert, den Sie mit dem Ähnlichkeitsgrad (entspricht dem Prozentsatz) zuweisen, multiplizieren. Diese einzelnen Beitragspunktzahlen werden dann addiert, um die Gesamtbeitrags-Punktzahl zu erhalten. Gewichtete Übereinstimmungspunktzahl Bei der gewichteten Vergleichsmethode werden Übereinstimmung nur durch Vergleichen der GesamtbeitragsPunktzahl mit der gewichteten Übereinstimmungspunktzahl bestimmt. Wenn die Gesamtbeitrags-Punktzahl größer oder gleich der gewichteten Übereinstimmungspunktzahl ist, werden die Datensätze als Übereinstimmung 462 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität angesehen. Wenn die gewichtete Gesamtpunktzahl kleiner ist als die gewichtete Übereinstimmungspunktzahl, werden die Datensätze als Nichtübereinstimmung angesehen. Sie können die gewichtete Übereinstimmungspunktzahl in der Option Gewichtete Übereinstimmungspunktzahl der Optionsgruppe "Ebene" festlegen. Beispiel Die folgende Tabelle dient als Beispiel dafür, wie der gewichtete Vergleich eingerichtet werden kann. Beachten Sie die verschiedenen Punktzahltypen, die wir behandelt haben. Beachten Sie außerdem Folgendes: ● Beim Einrichten des gewichteten Vergleichs muss die Option Punktzahl bei Nichtübereinstimmung auf -1 gesetzt werden, und die Option Punktzahl bei Übereinstimmung muss auf 101 gesetzt werden. Diese Werte stellen sicher, dass anhand dieser Punktzahlen weder eine Übereinstimmung noch eine Nichtübereinstimmung gefunden wird. ● Wir haben den E-Mail-Kriterien, die ihm die höchste Bedeutung zuweisen, einen Gewichtungswert zugewiesen. Tabelle 205: Kriterien Datensatz A Datensatz B Nicht Überein ˇÍ:«˚½µËfi”»mh stimmung stimmung Ähnlich keitsgrad Gewicht ungswert Vorname Maria Mary -1 101 100 25 25 Nachname Smith Smitt -1 101 80 25 20 E-Mail msmith@ sap.com -1 101 84 50 42 ms@ sap.com Beitragspunktzahl (Ge wichtungswert Ähnlich keit X) Gesamtbeitrags-Punkt zahl: 87 Wenn die gewichtete Übereinstimmungspunktzahl 87 ist, dann wird jeder Vergleich, dessen GesamtbeitragsPunktzahl 87 lautet, als eine Übereinstimmung angesehen. In diesem Beispiel ist der Vergleich eine Übereinstimmung, da die Gesamtbeitrags-Punktzahl 87 lautet. 17.4.9.2.4 Kombinationsmethode Diese Methode kombiniert die regelbasierte Abgleichsmethode mit der Abgleichsmethode für gewichteten Vergleich. Tabelle 206: Kriterien Datensatz A Datensatz B Nichtüber ˇÍ£ «½µÚfi”»nh mung Überein stimmung Ähnl.Punktzahl Gewicht ungswert Vorname Maria Mary 59 101 100 25 25 Nachname Smith Hope 59 101 22 N/A (Keine Überein stimmung) N/A Designer-Handbuch Datenqualität Gewichtungspunktzahl (tatsächliche Ähnlichkeit X Gewichtungswert) PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 463 Kriterien Datensatz A Datensatz B Nichtüber einstimmung Überein stimmung Ähnl.Punktzahl Gewicht ungswert E-Mail-Ad resse ms@ sap.com msmith@ sap.com 49 101 N/A N/A Gewichtungspunktzahl (tatsächliche Ähnlichkeit X Gewichtungswert) N/A Gesamtge +WŠìıi¹BÕÏÕ{µÇ(üı punktzahl N/A 17.4.9.3 Abgleichen von Geschäftsregeln Ein wichtiger Bestandteil des Abgleichungsprozesses besteht darin festzustellen, wie mit verschiedenen Formen von Daten und den Unterschieden zwischen ihnen umgegangen werden soll. Wenn beispielsweise alle Felder eines Datensatzes mit allen Feldern eines anderen Datensatzes übereinstimmen mit Ausnahme eines Feldes, das in einem der Datensätze leer und in dem anderen Datensatz nicht leer war, sollen diese Datensätze dann als Übereinstimmungen gelten? Herauszufinden, was Sie in derartigen Situationen tun möchten, ist Bestandteil des Vorgangs zum Definieren Ihrer Geschäftsregeln. Die meisten Ihrer Geschäftsregeln definieren Sie in den Übereinstimmungskriterien, einige namensbasierte Optionen werden jedoch in der Optionsgruppe "Übereinstimmungsebene" festgelegt. 17.4.9.3.1 Abgleich von Zeichenfolgen, Abkürzungen und Anfangsbuchstaben Zum Definieren Ihrer Business-Regeln gehört auch, Einstellungen für den Abgleich von Zeichenfolgen, Abkürzungen und Initialen vorzunehmen. Weitere Informationen über das Festlegen von Punktzahlen für die folgenden drei Optionen finden Sie in den Abschnitten zu Übereinstimmungskriterien im Referenzhandbuch. Tabelle 207: Option Beschreibung Abgleichspunktzahl für Initialen Ermöglicht den Abgleich von Anfangsbuchstaben mit ganzen Wörtern. Beispielsweise kann „Internationale Gesundheitsan bieter“ mit „IGA“ abgeglichen werden. Abgleichspunktzahl für Abkürzungen Ermöglicht den Abgleich von ganzen Wörtern mit Abkürzun gen. Beispielsweise kann „Internationale Gesundheitsanbie ter“ mit „IGA“ abgeglichen werden. Abgleichspunktzahl für Teilzeichenfolgen Ermöglicht den Abgleich zwischen längeren Zeichenfolgen und kürzeren Zeichenfolgen. Beispielsweise kann die Zeichen folge „Mayfield Painting und Sand Blasting“ mit „Mayfield painting“ abgeglichen werden. 464 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität 17.4.9.3.2 Erweiterter Abgleich mit Abkürzungen Der erweiterte Abgleich mit Abkürzungen bietet Funktionalität für Situationen, die von den Optionen Abgleichspunktzahl für Initialen, Abgleichspunktzahl für Teilzeichenfolgen und Abgleichspunktzahl für Abkürzungen nicht abgedeckt sind. Beispielsweise können die folgenden Situationen auftreten: ● Angenommen, die Daten enthalten Ortschaften wie La Crosse und New York. Dieselben Ortschaften sind jedoch auch als LaCrosse und NewYork (ohne Leerzeichen) aufgelistet. Beim normalen Abgleich können Sie diese Bezeichnungen (La Crosse/LaCrosse und New York/NewYork) aufgrund der Leerzeichen nicht als 100prozentige Übereinstimmung definieren. (Dies sind normalerweise 94- und 93-prozentige Übereinstimmungen.) ● Angenommen, die Daten enthalten Metropolitan Life und MetLife (eine Abkürzung und Kombination von Metropolitan Life). Die Option Abgleichspunktzahl für Abkürzungen kann die Kombination der beiden Wörter nicht erkennen. Wenn einer dieser Fälle in den Daten auftreten kann, verwenden Sie die Option Abgleichspunktzahl für Abkürzungen (erw.). Funktionsweise der Abgleichspunktzahl Die Punktzahl, die Sie bei der Option Abgleichspunktzahl für Abkürzungen (erw.) festlegen, stellt den Ähnlichkeitsgrad bei der Berücksichtigung dieser Typen von Abkürzungen und Kombinationen in den Daten ein. Bei der Abgleichspunktzahl wird ein Abzugswert für die nicht übereinstimmenden Teile des Worts hinzugefügt. Je größer die Zahl, desto kleiner der Abzugswert. Die Punktzahl 100 bedeutet keinen Abzugswert und die Punktzahl 0 bedeutet den maximalen Abzugswert. Beispiel Tabelle 208: Zeichen folge 1 Zeichenfolge 2 Ähnlich "−<ÆÌ^‰ð(®›5È݃$ÞeÛ.} zahl bei Ab "−0ÆÌR‰í(¾›-è¸ spunktzahl 0 Ähnlich "−<ÆÌ^‰ð(®›5È݃$ÞeÛ.} zahl bei Ab "−0ÆÌR‰í(¾›-ÈÛƒ:Þ{ÛÅ—L zahl 50 Ähnlich "−<ÆÌ^‰ð(®›5È݃$ÞeÛ.} zahl bei Ab "−0ÆÌR‰í(¾›-è¸ spunktzahl 100 MetLife Metropolitan Life 58 79 100 MetLife Met Life 93 96 100 MetLife MetropolitanLife 60 60 60 Designer-Handbuch Datenqualität Hinweise Diese Punktzahl ergibt sich aus dem Zei chenfolgenvergleich. Der erweiterte Ab kürzungsabgleich wurde nicht benötigt oder verwendet, weil beide zu vergleichen den Zeichenfolgen aus genau einem Wort bestehen. PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 465 17.4.9.3.3 Namensabgleich Im Rahmen der Anlage der Business-Regeln müssen Sie definieren, wie Namen im Abgleichprozess verarbeitet werden sollen. Die Match-Transformation bietet viele Möglichkeiten, um sicherzustellen, dass beispielsweise Namensvariationen oder mehrere Namen berücksichtigt werden. Hinweis Im Gegensatz zu anderen Business-Regeln werden diese Optionen in der Optionsgruppe für Übereinstimmungsebenen eingerichtet, weil sie sich auf alle entsprechenden auf dem Namen basierenden Übereinstimmungskriterien auswirken. Zwei Namen; zwei Personen Mit der Option Anzahl erforderlicher Namensübereinstimmungen können Sie steuern, wie der Abgleich bei Übereinstimmungsschlüsseln mit mehreren Namen ausgeführt wird (z.B. Vergleich von "John und Mary Smith" mit "Dave und Mary Smith"). Wählen Sie aus, ob nur ein einziger Name übereinstimmen muss, damit die Datensätze als übereinstimmende Datensätze identifiziert werden, oder ob die Match-Transformation alle Personen mit Ausnahme des ersten von ihr geparsten Namens ignorieren soll. Mit dieser Methode können Sie angeben, dass entweder nur eine Person übereinstimmen muss oder beide Personen übereinstimmen müssen, damit der Datensatz übereinstimmt. Zwei Namen; eine Person Mit der Option Vornamen1 mit Vornamen2 vergleichen können Sie auch die Vornamen1-Daten (Vorname) des ersten Datensatzes mit den Vornamen2-Daten (Weitere Vornamen) des zweiten Datensatzes vergleichen. Mit dieser Option kann die Match-Transformation übereinstimmende Datensätze wie die im Folgenden teilweise dargestellten Datensätze korrekt identifizieren. In der Regel stellen diese Datensatzpaare Söhne oder Töchter dar, die nach ihren Eltern benannt, jedoch unter ihrem zweiten Vornamen bekannt sind. Tabelle 209: Datensatznummer Vorname Weitere Vornamen Nachname Adresse 170 Leo 198 Tom Thomas Smith 225 Pushbutton Dr Smith 225 Pushbutton Dr Nachnamen mit Bindestrich Mit der Option Übereinstimmung bei Nachnamen mit Bindestrich können Sie steuern, wie der Abgleich ausgeführt wird, wenn ein Feld für den Nachnamen einen Nachnamen mit Bindestrich enthält (z.B. Vergleich von "Smith- 466 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität Jones" mit "Jones"). Wählen Sie aus, ob beide Namen übereinstimmen müssen oder ob nur ein Name übereinstimmen muss, damit die Datensätze als Übereinstimmung bezeichnet werden. 17.4.9.3.3.1 Anpassen von zusammengesetzten Nachnamen Die „Abgleichspunktzahl für Teilzeichenfolgen (approx.)“ hilft bei der Einrichtung des Vergleichs von zusammengesetzten Nachnamen. Die „Abgleichspunktzahl für Teilzeichenfolgen (approx.)“ wird Wörtern zugewiesen, die nicht mit anderen Wörtern in einer Vergleichszeichenfolge übereinstimmen. Diese Option lockert einige Anforderungen der Option „Abgleichspunktzahl für Teilzeichenfolgen“ auf folgende Weise: ● Anfangswörter müssen nicht genau übereinstimmen. ● Die übereinstimmenden Wörter können Initialen- und Abkürzungsanpassungen enthalten (z.B. Rodriguez und RDZ). ● Übereinstimmende Wörter müssen in derselben Reihenfolge auftreten, aber vor und nach den übereinstimmenden Wörtern können nicht übereinstimmende Wörter sein. ● Die "Abgleichspunktzahl für Teilzeichenfolgen (approx.)" wird den übrig gebliebenen Wörtern und Leerzeichen in der Vergleichszeichenfolge zugewiesen. Mit der Option "Abgleichspunktzahl für Teilzeichenfolgen (approx.)" wird die Punktzahl bei einigen gefundenen Übereinstimmungen erhöht, wenn die "Abgleichspunktzahl für Teilzeichenfolgen" verwendet wird. Beispiel Beim Vergleich von CRUZ RODRIGUEZ und GARCIA CRUZ DE RDZ lauten die Ähnlichkeitspunktzahlen wie folgt: ● Ohne Vornahme von Anpassungen lautet die Ähnlichkeitspunktzahl 48. ● Wenn Sie die "Abgleichspunktzahl für Teilzeichenfolgen" auf 80 und die Abkürzungspunktzahl auf 80 setzen, lautet die Ähnlichkeitspunktzahl 66. ● Wenn Sie "Abgleichspunktzahl für Teilzeichenfolgen (approx.)" auf 80 und die Abkürzungspunktzahl auf 80 setzen, lautet die Ähnlichkeitspunktzahl 91. 17.4.9.3.4 Numerischer Datenabgleich Bestimmen Sie anhand der Option Numerische Wörter stimmen exakt überein, ob Daten, die aus einer Mischung von Zahlen und Buchstaben bestehen, genau übereinstimmen sollen. Sie können auch angeben, wie diese Daten übereinstimmen müssen. Diese Option wird am häufigsten bei Adressdaten und Kundendaten, wie Teilenummern, angewendet. Der numerische Abgleich wird folgendermaßen durchgeführt: 1. Die Zeichenfolge wird zunächst in Wörter aufgelöst. Dieser Vorgang findet bei allen Interpunktions- und Leerzeichen statt; anschließend wird den Wörtern ein numerisches Attribut zugewiesen. Ein numerisches Wort ist ein Wort, das mindestens eine Ziffer zwischen 0 und 9 enthält. "4L" wird beispielsweise als numerisches Wort betrachtet, "VierL" dagegen nicht. 2. Der numerische Abgleich wird entsprechend der (unten beschriebenen) gewählten Optionseinstellung durchgeführt. Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 467 Optionswerte und Funktionsweise Tabelle 210: Optionswert Beschreibung Jede_Position Bei diesem Wert müssen numerische Wörter genau übereinstimmen; die Position des Wortes ist dabei jedoch nicht von Bedeutung. Beispiel: ● Vergleich von Straßenadressen: "4932 Main St # 101" und "# 101 4932 Main St" gelten als Übereinstimmung. ● Vergleich von Straßenadressen: "4932 Main St # 101" und "# 102 4932 Main St" gelten nicht als Übereinstimmung. ● Teilebeschreibung: "ACCU 1.4L 29BAR" und "ACCU 29BAR 1.4L" gelten als Übereinstim mung. Dieselbe_Position Bei diesem Wert müssen numerische Wörter genau übereinstimmen; diese Option unterscheidet sich jedoch insofern von der Option "Jede_Position", als die Position des Wortes von Bedeutung ist. Beispiel: 608-782-5000 gilt als übereinstimmend mit 608-782-5000, allerdings nicht mit 782-608-5000. Interpunktion_überall_be rücksichtigen Bei diesem Wert wird eine Zerlegung in Wörter bei allen Interpunktions- und Leerzeichen vorge nommen außer beim Dezimaltrennzeichen (Punkt oder Komma), sodass Dezimalzahlen grund sätzlich nicht zerlegt werden. Die Zeichenfolge 123.456 gilt beispielsweise im Gegensatz zu zwei numerischen Wörtern als ein numerisches Wort. Die Position des numerischen Wortes ist nicht von Bedeutung; Dezimaltrennzeichen beeinflus sen jedoch den Abgleichvorgang. Beispiel: ● Teilebeschreibung: "ACCU 29BAR 1.4L" und "ACCU 1.4L 29BAR" gelten als Übereinstim mung. ● Teilebeschreibung: "ACCU 1,4L 29BAR" und "ACCU 29BAR 1.4L" gelten nicht als Überein stimmung, weil sich in beiden Fällen zwischen der 1 und der 4 ein Dezimaltrennzeichen be findet. ● Interpunktion_überall_ig norieren Finanzdaten: "25,435" und "25.435" gelten nicht als Übereinstimmung. Dieser Wert ist ähnlich wie der Wert "Interpunktion_überall_berücksichtigen", mit dem Unter schied, dass Dezimaltrennzeichen den Abgleichvorgang nicht beeinflussen. Beispiel: ● Teilebeschreibung: "ACCU 29BAR 1.4L" und "ACCU 1.4L 29BAR" gelten als Übereinstim mung. ● Teilebeschreibung: "ACCU 1,4L 29BAR" und "ACCU 29BAR 1.4L" gelten ebenfalls als Über einstimmung, obwohl sich zwischen der 1 und der 4 ein Dezimaltrennzeichen befindet. ● Teilebeschreibung: "ACCU 29BAR 1.4L" und "ACCU 1.5L 29BAR" gelten nicht als Überein stimmung. 17.4.9.3.5 Abgleich leere Felder In den Geschäftsregeln können Sie steuern, wie die Match-Transformation Feldvergleiche behandelt, wenn ein verglichenes Feld oder beide verglichenen Felder leer sind. 468 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität Im zweiten Datensatz unten ist beispielsweise das erste Namensfeld leer. Soll die Match-Transformation diese Datensätze als Übereinstimmung oder nicht als Übereinstimmung werten? Was wäre, wenn des erste Namensfeld in beiden Datensätzen leer wäre? Datensatz 1 Datensatz 2 John Doe _____ Doe 204 Main St 204 Main St La Crosse WI La Crosse WI 54601 54601 Die Match-Transformation enthält einige Optionen, über die Sie steuern können, wie diese verglichen werden. Diese Optionen sind: ● Aktion bei zwei leeren Feldern ● Punktzahl bei zwei leeren Feldern ● Aktion bei einem leeren Feld ● Punktzahl bei einem leeren Feld Aktion in leerem Feld Für die "Operationsoptionen" können folgende Werte ausgewählt werden: Tabelle 211: Option Beschreibung Auswertung Bei Auswahl von "Auswertung" führt die Match-Transformation eine Bewertung mithilfe der Option Punktzahl bei einem leeren Feld oder Punktzahl bei zwei leeren Feldern durch. Ignorieren Bei Auswahl von "Ignorieren" trägt die Punktzahl für diese Feldregel nicht zur gewichteten Gesamtpunkt zahl für den Datensatzvergleich bei. Anders ausgedrückt, die beiden oben angezeigten Datensätze könn ten trotz des leeren Felds noch als Duplikate betrachtet werden. Punktzahlen bei leerem Feld Über die Optionen für "Punktzahl" wird gesteuert, wie die Match-Transformation Feldvergleiche bewertet, wenn das Feld in einem der beiden Datensätze leer ist. Sie können einen Wert von 0 bis 100 eingeben. Um Ihnen bei der Entscheidung, welche Punktzahl Sie eingeben, zu helfen, legen Sie fest, ob Sie möchten, dass die Match-Transformation ein leeres Feld einen Ähnlichkeitswert von 0 Prozent, 100 Prozent (oder einen Wert dazwischen) im Vergleich zu einem ausgefüllten Feld oder einem anderen leeren Feld vergibt. Ihre Antwort hängt wahrscheinlich davon ab, welches Feld Sie vergleichen. Für ein leeres Feld eine hohe Punktzahl zu vergeben könnte ratsam sein, wenn Sie beispielsweise einen Abgleich mit einem Vornamen oder einem zweiten Vornamen oder einem Unternehmensnamen durchführen. Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 469 Beispiel Nachfolgend finden Sie einige Beispiele zur Illustration der Auswirkung Ihrer Einstellungen dieser Abgleichsoptionen für leere Felder auf die Gesamtpunktzahl der Datensätze. Aktion bei einem leeren Feld für Feld "Vorname1" auf "Ignorieren" gesetzt Wenn Sie die Optionen für leere Felder auf "Ignorieren" setzen, verteilt die Match-Transformation den diesem Feld zugeteilten Beitrag auf andere Kriterien und berechnet die Beiträge für die anderen Felder neu. Tabelle 212: Verglichene Felder Datensatz A Datensatz B % Ähnlichkeit Beitrag 54601 Punktzahl (pro Feld) Postleitzahl 54601 100 20 (oder 22) 22 Adresse 100 Water St 100 Water St 100 40 (oder 44) 44 Nachname Hamilton 94 30 (oder 33) 31 Vorname1 Mary — 10 (oder 0) Hammilton — Gewichtete Punktzahl: 97 Aktion bei einem leeren Feld für Feld "Vorname1" auf "Auswertung" gesetzt; "Punktzahl bei einem leeren Feld auf 0 gesetzt Tabelle 213: Verglichene Felder Datensatz A Datensatz B % Ähnlichkeit Beitrag Punktzahl (pro Feld) Postleitzahl 54601 54601 100 20 20 Adresse 100 Water St 100 Water St 100 40 40 Nachname Hamilton 94 30 28 Vorname1 Mary 0 10 0 Hammilton Gewichtete Punktzahl: 88 Aktion bei einem leeren Feld für Feld "Vorname1" auf "Auswertung" gesetzt; "Punktzahl bei einem leeren Feld" auf 100 gesetzt Tabelle 214: Verglichene Felder Datensatz A Datensatz B % Ähnlichkeit Beitrag Punktzahl (pro Feld) Postleitzahl 54601 54601 100 20 20 Adresse 100 Water St 100 Water St 100 40 40 Nachname Hamilton 94 30 28 Vorname1 Mary 100 10 10 Hammilton Gewichtete Punktzahl: 98 470 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität 17.4.9.3.6 Vergleich mehrerer Felder (feldübergreifender Vergleich) In den meisten Fällen verwenden Sie ein einzelnes Feld für den Vergleich. So wird beispielweise Feld1 im ersten Datensatz mit Feld1 im zweiten Datensatz verglichen. In manchen Fällen bietet sich jedoch der Vergleich mehrerer Felder an. Angenommen, Sie möchten Telefonnummern im Feld "Telefonnummer" mit den Nummern in den Feldern für Fax-, Mobil- und Privattelefonnummer vergleichen. Dies ist mit dem Vergleich mehrerer Felder möglich. Wenn Sie den Vergleich mehrerer Felder auf dem Tab "Vergleiche mehrerer Felder" für ein Übereinstimmungskriterium im Match-Editor aktivieren, können Sie auswählen, die ausgewählten Felder entweder mit allen ausgewählten Feldern in jedem Datensatz oder nur mit demselben Feld in jedem Datensatz zu vergleichen. Hinweis Der Match-Editor führt standardmäßig mehrere Feldvergleiche für Felder durch, in denen Übereinstimmungsstandards verwendet werden. Beispielsweise wird Person1_Vorname1 automatisch mit Person1_Vorname_Übereinstimmungsstd1-6 verglichen. Der Vergleich mehrerer Felder muss nicht explizit aktiviert sein, und es ist keine zusätzliche Konfiguration erforderlich, um einen Vergleich mehrerer Felder mit Übereinstimmungsstandard-Feldern durchzuführen. 17.4.9.3.6.1 Vergleichen ausgewählter Felder mit allen ausgewählten Feldern in anderen Datensätzen Wenn Sie jedes ausgewählte Feld mit allen ausgewählten Feldern in anderen Datensätzen vergleichen, werden alle Felder, die in den jeweiligen Übereinstimmungskriterien definiert sind, miteinander verglichen. Nicht vergessen „Ausgewählte“ Felder umfassen das Kriteriumfeld und die anderen von Ihnen definierten Felder in der Tabelle Zusätzliche zu vergleichende Felder. ● Wenn ein oder mehrere Feldvergleiche den Einstellungen für die Punktzahl bei Match entsprechen, werden die zwei verglichenen Zeilen als Übereinstimmungen angesehen. ● Wenn ein oder mehr Feldvergleiche die Punktzahl bei Nichtübereinstimmung überschreiten, wird die Regel als erfolgreich angesehen und alle anderen definierten Kriterien/gewichtete Vergleiche werden ausgewertet, um festzustellen, ob die zwei Zeilen als Übereinstimmungen eingestuft werden. Beispiel Beispiel für das Vergleichen ausgewählter Felder mit allen ausgewählten Feldern in anderen Datensätzen Die Eingabedaten enthalten zwei Felder für Unternehmen. Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 471 Zeilen-ID Unternehmen1 Unternehmen2 1 FirstLogic Postalsoft 2 SAP BusinessObjects FirstLogic Wenn die Punktzahl bei Match auf 100 und die Punktzahl bei Nichtübereinstimmung auf 99 eingestellt sind, werden diese zwei Datensätze als Übereinstimmung angesehen. Im Folgenden werden der Vergleichsprozess und die Ergebnisse zusammengefasst. ● Zuerst wird Zeile 1 Unternehmen1 (FirstLogic) mit Zeile 2 Unternehmen1 (SAP) verglichen. Normalerweise würden die Zeilen diesen Vergleich nicht bestehen, da jedoch der Vergleich mehrerer Felder aktiviert ist, wird noch keine Übereinstimmungsentscheidung getroffen. ● Als Nächstes wird Zeile 1 Unternehmen2 mit Zeile 2 Unternehmen2 und so weiter verglichen, bis alle anderen Vergleiche zwischen allen Feldern in allen Zeilen ausgeführt wurden. Da Zeile 1 Unternehmen1 (FirstLogic) und Zeile 2 Unternehmen2 (FirstLogic) sich zu 100 % gleichen, werden die zwei Datensätze als Übereinstimmung angesehen. 17.4.9.3.6.2 Vergleich von ausgewählten Feldern mit denselben Feldern in anderen Datensätzen. Wenn Sie jedes ausgewählte Feld mit demselben Feld in anderen Datensätzen vergleichen, wird jedes im Tab "Vergleiche mehrerer Felder" für ein Übereinstimmungskriterium definierte Feld nur mit demselben Feld in anderen Datensätzen verglichen. Innerhalb dieses Kriteriums wird somit eine ODER-Bedingung für die Übergabe der Kriterien festgelegt. Jedes Feld wird zum Ermitteln einer Übereinstimmung verwendet: Wenn Feld_1, Feld_2, oder Feld_3 die Übereinstimmungskriterien erfüllt, gelten die Datensätze als übereinstimmend. Die Punktzahl für "Keine Übereinstimmung" für ein Feld erfüllt die Kriterien nicht automatisch nicht, wenn Sie den Vergleich mehrerer Felder verwenden. Nicht vergessen „Ausgewählte“ Felder enthalten das Kriterienfeld sowie die anderen Felder, die Sie in der Tabelle Zusätzliche zu vergleichende Felder definieren. Beispiel Beispiel für einen Vergleich ausgewählter Felder mit demselben Feld in anderen Datensätzen Ihre Eingabedaten enthalten Felder für Telefon-, Fax- und Handynummer. Stimmen die Daten eines dieser Eingabefelder mit Daten in den Zeilen überein, gelten die Daten als Übereinstimmungen. Zeilen-ID Telefonnummer Faxnummer Handynummer 1 608-555-1234 608-555-0000 608-555-4321 2 608-555-4321 608-555-0000 608-555-1111 Bei einer Match-Punktzahl (Punktzahl bei Übereinstimmung) von 100 und einer Punktzahl bei Nichtübereinstimmung von 99 würde weder die Telefonnummer noch die Handynummer die Übereinstimmungskriterien erfüllen, falls Sie einzeln definiert werden. Da jedoch alle drei Felder in einem Kriterium definiert werden und die ausgewählten Datensätze mit denselben Datensätzen verglichen werden, 472 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität bedeutet die Tatsache, dass die Faxnummer 100 % Ähnlichkeit aufweist, dass diese Datensätze übereinstimmen. Hinweis Im Beispiel oben wird bei Auswahl der Option für identischem Feld in anderen Datensätzen die Handynummer in Zeile 1 und die Telefonnummer in Zeile 2 nicht als Übereinstimmung betrachtet da in diesem Fall nur ein Vergleich innerhalb desselben Felds durchgeführt wird, Falls ein feldübergreifender Vergleich erforderlich ist, wählen Sie stattdessen die Option Allen ausgewählten Felder in anderen Datensätzen aus. 17.4.9.3.7 Proximitätsabgleich Mit dem Proximitätsabgleich besteht die Möglichkeit, Datensätze auf der Basis ihrer Proximität anstatt des Vergleichs der Zeichenfolgendarstellung von Daten abzugleichen. Sie können einen Abgleich ist auf der Basis der geografischen, numerischen und Datumsproximität ausführen. Weitere Informationen Übereinstimmung anhand der geografischen Proximität [Seite 473] Übereinstimmung anhand der numerischen oder Datumsproximität [Seite 475] 17.4.9.3.7.1 Übereinstimmung anhand der geografischen Proximität Die geografische Proximität findet doppelte Datensätze auf der Grundlage der geografischen Nähe mit Hilfe von Informationen über Breiten- und Längengrade. Hier geht es nicht um die Fahrtstrecke, sondern um die geografische Entfernung. Bei dieser Option werden WGS-84-(GPS)-Koordinaten verwendet. Die Option der geografischen Proximität verfügt über folgende Funktionen: ● Suchen eines Objekts innerhalb eines bestimmten Radiusbereichs. Diese Funktion kann für ein Unternehmen hilfreich sein, das ein Mailing an Kunden innerhalb einer bestimmten Entfernung von seinem Geschäftsstandort versenden möchte. ● Suchen nach dem nächsten Standort. Diese Funktion kann einem Verbraucher bei der Suche nach einem Ladenstandort in der Nähe seines Wohnorts helfen. Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 473 17.4.9.3.7.2 Einrichten des Geoproximitätsabgleichs – Kriterienfelder Um die Felder für den Geoproximitätsabgleich auszuwählen, führen Sie folgende Schritte aus: 1. Gehen Sie zum Match-Editor, und fügen Sie ein neues Kriterium hinzu. 2. Blenden Sie unter "Verfügbare Kriterien" die Option Geografisch ein. 3. Wählen Sie BREITENGRAD_LÄNGENGRAD aus. Dadurch stehen zwei Kriterienfelder für die Zuordnung zur Verfügung. 4. Ordnen Sie das richtige Breiten- und Längengradfeld zu. Sie müssen beide Felder zuordnen. 17.4.9.3.7.3 Einrichten des Abgleichs der geografischen Proximität – Kriterienoptionen Bevor Sie diese Option verwenden können, müssen die Felder "Breitengrad" und "Längengrad" zugeordnet sein. Führen Sie diese Schritte durch, um den Abgleich der geografischen Proximität durchzuführen: 1. Wählen Sie unter "Daten vergleichen mit" die Option Geoproximität aus. Hierdurch werden die Optionen unter "Vergleichsregeln" gefiltert, so dass nur die zutreffenden Optionen angezeigt werden. 2. Legen Sie die Option "Entfernungseinheit" auf eine der folgenden Einheiten fest: ○ Meilen ○ Fuß ○ Kilometer ○ Meter 3. Geben Sie die Max. Entfernung ein, die für den Bereich berücksichtigt werden soll. 4. Legen Sie die Punktzahl bei max. Entfernung fest. Hinweis Eine Entfernung, die "Max. Entfernung" entspricht, erhält die Punktzahl von "Punktzahl bei max. Entfernung". Eine beliebige Entfernung, die unterhalb der max. Entfernung liegt, erhält eine proportionale Punktzahl zwischen der Punktzahl bei max. Entfernung und 100. Beispielsweise weist eine Proximität von 10 Meilen eine höhere Punktzahl als die von 40 Meilen auf. Hinweis Wenn sich die Daten für „Max. Entfernung“ von Zeile zu Zeile ändern, sollten Sie die Daten unter Verwendung des Felds Option_Feld_Algorithmus_Geoproximität_<logischer_Name> _Max_Entfernung dynamisch eingeben. 474 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität Weitere Informationen Referenzhandbuch: Dynamische Transformationseinstellungen Referenzhandbuch: Transformationen, Data Quality, Match, Eingabefelder 17.4.9.3.7.4 Übereinstimmung anhand der numerischen oder Datumsproximität Mit den Optionen für die numerische Proximität bei der Match-Transformationen werden Duplikate auf der Grundlage numerischer Datenähnlichkeit gefunden. Sie können Duplikate anhand von numerischen Werten oder Datumswerten finden. Im Tab "Editor für Übereinstimmungskriterien" stehen folgende Optionen für den numerischen und Datumsabgleich zur Verfügung: Numerische Differenz Findet Duplikate anhand der numerischen Differenz für numerische oder Datumswerte. Mit dieser Option können Sie beispielsweise Duplikate anhand von Datumswerten in einem bestimmten Bereich unabhängig von einer Zeichenähnlichkeit suchen (z.B. 35 Tage mehr oder weniger). Numerische prozentuale Differenz Findet Duplikate anhand der prozentualen numerischen Differenz für numerische Werte. Nachfolgend werden zwei Beispiele gezeigt, in denen dies nützlich sein könnte: ● Finanzdaten: Sie können Finanzdaten suchen, um alle monatlichen Hypothekenzahlungen zu finden, die innerhalb von 5 Prozent eines vorgegebenen Wertes liegen. ● Produktdaten: Sie können Produktdaten suchen, um alle Stahlstangen zu finden, deren Durchmesser innerhalb einer Toleranz von 10 % eines vorgegebenen Wertes liegt. 17.4.10 Übereinstimmungsnachverarbeitung 17.4.10.1 Optimaler Datensatz In den meisten Fällen der Datenkonsolidierung werden Daten übereinstimmenden Datensätzen, d.h. Mitglieder von Übereinstimmungsgruppen, über eine Schlüsselkomponente gerettet und an einen optimalen Datensatz oder an alle übereinstimmenden Datensätze gesendet. Sie können diese Funktionen durchführen, indem Sie eine Sende-Abgleichoperation für den optimalen Datensatz hinzufügen. Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 475 Die Operationen werden innerhalb von Übereinstimmungsgruppen durchgeführt. Die Funktionen, die Sie mit der Operation des optimalen Datensatzes durchführen, umfassen das Bearbeiten oder Verschieben der in den Stammdatensätzen und untergeordneten Datensätzen von Übereinstimmungsgruppen enthaltenen Daten. Übereinstimmungsgruppen sind Gruppen von Datensätzen, die auf Grundlage der von Ihnen angelegten Kriterien von der Match-Transformation als übereinstimmend ermittelt wurden. Ein Stammdatensatz ist der erste Datensatz in der Übereinstimmungsgruppe. Sie können diesen Datensatz festlegen, indem Sie die Operation "Gruppenpriorisierung" vor der Operation des optimalen Datensatzes ausführen. Die untergeordneten Datensätze sind die restlichen Datensätze in einer Übereinstimmungsgruppe. In der folgenden Übereinstimmungsgruppe wird die Verwendung von Stammdatensätzen und untergeordneten Datensätzen dargestellt: Tabelle 215: Datensatz Name Rufnummer Datum 11. Apr. 2001 Gruppenrang 1 John Smith 2 John Smyth 788-8700 12. Okt. 1999 Untergeordnet 3 John E. Smith 788-1234 22. Feb. 1997 Untergeordnet 4 J. Smith 788-3271 Stamm Untergeordnet Da es sich hierbei um eine Übereinstimmungsgruppe handelt, werden alle Datensätze als übereinstimmend betrachtet. Wie Sie sehen, ist jeder Datensatz etwas anders. Einige Datensätze haben leere Felder, andere haben ein jüngeres Datum, alle haben unterschiedliche Telefonnummern. Eine gemeinsame Operation, die in dieser Übereinstimmungsgruppe durchgeführt werden kann, ist das Verschieben aktualisierter Daten in alle Datensätze in einer Übereinstimmungsgruppe. Sie können die Daten in den Stammdatensatz, in alle untergeordneten Mitglieder der Übereinstimmungsgruppe oder in alle Mitglieder der Übereinstimmungsgruppe verschieben. Hierfür wäre die aktuelle Telefonnummer ein gutes Beispiel. Ein weiteres Beispiel ist das Retten nützlicher Daten aus übereinstimmenden Datensätzen, bevor diese verworfen werden. Wenn Sie beispielsweise eine Führerscheindatei mit Ihrer Hausdatei vergleichen, können Sie ggf. Daten zum Geschlecht oder Geburtsdatum zu Ihrem Hausdatensatz hinzufügen. Zuerst Datensätze mit höherer Priorität senden Die Operationen, die Sie in der Operationsgruppe des optimalen Datensatzes einrichten, sollten stets mit dem Mitglied der Übereinstimmungsgruppe mit der höchsten Priorität beginnen (Stamm) und dann Stück für Stück nach unten bis zum letzten untergeordneten Satz fortgesetzt werden. So wird gewährleistet, dass die Daten aus dem höher priorisierten Datensatz bis hin zum niedriger priorisierten Datensatz gerettet werden können. Stellen Sie also sicher, dass Ihre Datensätze korrekt priorisiert sind, indem Sie vor Ihrer Operation für den optimalen Datensatz eine Sende-Abgleichoperation für die "Gruppenpriorisierung" hinzufügen. 476 PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. Designer-Handbuch Datenqualität 17.4.10.1.1 Strategien des optimalen Datensatzes Wir liefern Ihnen Strategien, die Ihnen beim schnellen und einfachen Einrichten einiger gängigerer Operationen mit optimalen Datensätzen behilflich sind. Wenn keine dieser Strategien Ihrem Bedarf entspricht, können Sie eine benutzerspezifische Strategie des optimalen Datensatzes mithilfe eines eigenen Python-Codes anlegen. Strategien des optimalen Datensatzes können auch als Kriterien für Aktionen in anderen Bereichen genutzt werden. Wenn die Kriterien nicht erfüllt werden, wird keine Aktion ausgeführt. Beispiel In unserem Beispiel, das das Aktualisieren eines Telefonfelds mit aktuellen Daten behandelt, können wir die Datumsstrategie mit der neuesten Priorität verwenden, um den Stammdatensatz mit der aktuellsten Telefonnummer in der Übereinstimmungsgruppe zu aktualisieren. Letztgenanntes (Aktualisieren des Stammdatensatzes mit der aktuellsten Telefonnummer) ist die Aktion. Sie können auch alle Datensätze in der Übereinstimmungsgruppe (Master und alle Untergeordneten) oder nur die Untergeordneten aktualisieren. Einschränkung Bei der Datumsstrategie wird das Datum nicht parst, da nicht bekannt ist, wie das Datum formatiert ist. Formatieren Sie das Datum unbedingt als JJJMMTT vor, damit die Zeichenfolgenvergleiche einwandfrei ausgeführt werden. Sie können dazu auch eine benutzerdefinierte Strategie unter Verwendung eines Python-Codes einrichten, um das Datum zu parsen, und einen Datumsvergleich verwenden. 17.4.10.1.1.1 Benutzerdefinierte Strategien für optimalen Datensatz und Python In den vordefinierten Strategien für optimalen Datensatz generiert die Match-Transformation automatisch den Python-Code, den sie für die Verarbeitung verwendet. Dieser Code umfasst Variablen, die für die Verarbeitung erforderlich sind. Allgemeine Variablen Der generierte Python-Code enthält die folgenden allgemeinen Variablen: Variable Beschreibung SRC Gibt das Quellfeld an. DST Gibt das Zielfeld an. RET Gibt den Rückgabewert an, der anzeigt, ob die Strategie erfolgreich war (muss entweder "T" oder "F" sein). Designer-Handbuch Datenqualität PUBLIC © 2015 SAP SE oder ein SAP-Konzernunternehmen. Alle Rechte vorbehalten. 477 Variablen NEWDST und NEWGRP Verwenden Sie die Variablen NEWDST und NEWGRP, damit das Senden von Daten in der Aktion für optimalen Datensatz unabhängig von den Strategiefeldern ist. Wenn Sie diese Variablen nicht angeben, müssen auch die Strategiefelddaten aktualisiert werden. Variable Beschreibung NEWDST Indikator für neues Ziel. Diese Zeichenfolgenvariable hat den Wert "T", wenn der Zieldatensatz neu ist oder sich seit der letzten Auswertung der Strategie geändert hat, und den Wert "F", wenn der Zieldatensatz sich seit der letzten Auswertung nicht geändert hat. Die Variable NEWDST ist nur nützlich, wenn Sie an mehrere Ziele senden, beispielsweise mit der Angabe ALL oder SUBS bei der Option Sendeziel. NEWGRP Indikator für neue Gruppe. Diese Zeichenfolgenvariable hat den Wert "T", wenn die Übereinstimmungsgruppe sich seit der letzten Auswertung der Strategie geändert hat, und den Wert "F", wenn die Übereinstimmungsgruppe sich seit der letzten Auswertung nicht geändert hat. Beispiel für NEWDST Der folgende Python-Code wurde aus einer NICHT_LEER-Strategie mit den folgenden Optionseinstellungen generiert: Option Einstellung Strategie des optimalen Datensatzes NICHT_LEER Strategiepriorität Die Prioritätsoption ist für die NICHT_LEER-Strategie nicht verfügbar. Strategiefeld NORTH_AMERICAN_PHONE1_NORTH_AMERICAN_PHONE_ STANDARDIZED. Sendeziel ALL Nur einmal pro Ziel senden JA Der Python-Code sieht wie folgt aus. # Setup local temp variable to store updated compare condition dct = locals() # Store source and destination values to temporary variables # Reset the temporary variable when the destination changes if (dct.has_key('BEST_RECORD_TEMP') and NEWDST.GetBuffer() == u'F'): DESTINATION = dct['BEST_RECORD_TEMP'] else: DESTINATION = DST.GetField(u'NORTH_AMERICAN_PHONE1_NORTH_AMERICAN_PHONE_STANDARDIZED') SOURCE = SRC.GetField(u'NORTH_AMERICAN_PHONE1_NORTH_AMERICAN_PHONE_STANDARDIZED') if len(SOURCE.st
© Copyright 2025 ExpyDoc