Quantcast
Channel: Kompetenzen – NTT DATA Blog Europe
Viewing all articles
Browse latest Browse all 155

IPLM @ Datenbankstammtisch an der HTW Dresden

$
0
0

An der HTW Dresden findet einmal im Monat ein sogenannter „Datenbankstammtisch“ statt. Da mich der prägnante Name neugierig gemacht hat, wollte ich schon seit geraumer Zeit teilnehmen. Zum 212. Stammtisch am 17.01.2018 habe ich es nun endlich geschafft!

Der Stammtisch wird organisiert von Prof. Dr. Gräfe (Professur für DV-Anwendungen / Datenbanksysteme) und findet im Gebäude der HTW Dresden in der Nähe des Hauptbahnhofs statt. Die Teilnahme ist kostenlos und es ist keine Anmeldung erforderlich. Als sehr angenehm empfand ich die lockere Atmosphäre des Stammtischs. Es waren ca. 18 Teilnehmer anwesend, von Studenten über Doktoranden und Professoren bis hin zu „normalen“ Datenbank-affinen Personen aus der freien Wirtschaft. Zu Beginn präsentierte der Referent sein Thema, anschließend gab es eine kurze Pause mit Schnittchen und Stammtisch-tauglichen Getränken, anschließend gab es eine Frage- bzw. Diskussions-Runde.

Die Liste der geplanten und vergangenen Stammtische enthält eine lange Reihe namhafter Referenten und interessanter Themen. Das Thema diesmal war „Enterprise Datenbank – vergessen, oder ?“ und wurde vorgetragen von Jürgen Bittner von der SQL Projekt AG Dresden. Das zum Vortrag gehörige Paper ist sehr lesenswert und entspricht in etwa dem, was Jürgen Bittner vorgestellt hat.

Zur Veranschaulichung des Begriffs „Enterprise DB“ möchte ich an dieser Stelle eine Passage aus dem o.g. Paper von Jürgen Bittner zitieren:

„Das grundlegende Ziel der Verarbeitung von Daten, alle Sachverhalte einmalig zu erfassen, die Daten möglichst einmalig zu speichern mit all ihren relevanten Beziehungen und die vielfache Verwendung diese Daten zu ermöglichen […]. Korrektheit, Aktualität und Konsistenz der Daten sollten helfen, die Wirksamkeit gesellschaftlicher Prozesse, vor allem in der Betriebswirtschaft und Produktion zu verbessern.“

Bereits im Jahr 1975 wurde die 3-Ebenen-Architektur der Enterprise-DB gem. ANSI/X3/SPARC spezifiziert, wurde jedoch nie in einem Produkt realisiert. JürgenBittner skizziert in seinem Vortrag, wie sich die Konzepte der IT-Architektur wieder auf dieses – bereits in Vergessenheit geratene – Konzept zubewegen.

Eines der Probleme in Konzern-IT-Landschaften, die die Enterprise-DB angehen soll, ist die mehrfach-Erfassung derselben Objekte in verschiedenen Systemen. Objekte – z.B. „Teile“ – müssen oft in verschiedenen IT-Systemen vorhanden sein, da jedes System andere Prozesse des Unternehmens abdeckt und damit auch andere Attribute des Objekts bearbeitet werden oder dieselben Attribute zu einem anderen Zeitpunkt.

Eine parallele Pflege kann zwar durch geeignete Unternehmensprozesse und IT-Schnittstellen unterbunden werden, das Problem der Mehrfach-Speicherung in den „Silos“ der Einzel-Applikationen bleibt jedoch.

Das eindeutige Zuordnen von Objekten aus verschiedenen Systemen ist oft ein nicht-triviales Problem und wurde an dem „Klotz mit Loch“ diskutiert. Der „Klotz mit Loch“ repräsentiert dabei eine Beschreibung eines Teils in Form von Metadaten. Je nach Interpretation können dabei jedoch viele unterschiedliche Objekte damit gemeint sein.

Mittlerweile gibt es sehr mächtige Tools und Algorithmen zum Auffinden von Ähnlichkeiten, z.B. über die Objekt-Geometrie. Dennoch sind nicht-erkannte Duplikate laut Herrn Bittner immer noch ein Problem in Unternehmen. Dabei können redundante Objekte oft nur mit enormem Aufwand erkannt und bereinigt werden, auch dann, wenn sie in ein-und-demselben System angelegt wurden.

Eines der Ziele der Enterprise-DB ist daher, diese Duplikate gar nicht erst entstehen zu lassen.

Jürgen Bittner zeigt auf, wie sich konkret die Konzepte der IT-Architektur gewandelt haben und sich damit der Enterprise-DB annähern. Wegweisende Schritte waren dabei:

  • Die Data-Warehouse-Architektur (mit ETL),
  • die EAI-Architektur und
  • das Master Data Management („MDM“), das derzeit in aller Munde ist.

Wie auch die Enterprise-DB will das MDM Datensätze mit besonders hoher Qualität herstellen – sog. „golden records“. Mit „golden records“ stehen exakte, konsistente und nutzbare Daten zur Verfügung. Solche Daten­sätze sind oft nur sehr schwer herzustellen, dies wurde in der Diskussionsrunde des Daten­bank­stamm­tisches am Beispiel des Objekts „Adresse“ diskutiert. Nicht nur innerhalb Deutschlands ist eine Validierung dieses Objekts nicht unbedingt trivial. Ein Beispiel für eine mögliche Validierung wäre „passt die PLZ zum Wohnort“, vgl. 4-stellige Postleitzahl vor der Wiedervereinigung. Bezogen auf andere Länder kommen jedoch noch ganz andere Aspekte hinzu, so ist es in der Schweiz beispielsweise zulässig, dass eine Straße zwei (verschiedene) Namen hat wobei beide rechtliche Gültigkeit besitzen.

MDM und Enterprise-DB unterscheiden sich jedoch grund­sätzlich darin »wie« man zu den „golden records“ kommt. Laienhaft gesprochen hat das MDM den Fokus auf der Nach­bereitung von Datensätzen die in anderen Applikationen ent­standen sind, also eine Art Nachbessern. Das Konzept der Enterprise-DB dagegen ist eher vorbeugender Natur.

Die Spekulationen darüber, was nach dem MDM kommt, sind schwierig. Jürgen Bittner ist jedoch davon überzeugt, dass sich die Konzepte und Architektur-Patterns in der IT weiter in Richtung Enterprise-DB bewegen werden.

Einer der Gründe dafür, warum er überzeugt davon ist, ist der Stromverbrauch für die Datenspeicherung. So stand z.B. eine (von mir nicht geprüfte Zahl) im Raum, dass in-memory-Datenbanken 100-mal mehr Strom brauchen als konventionelle SSD-Speicher. Da die Menge der gespeicherten Daten weiterhin stark zunimmt, könnte das der begrenzende Faktor in Zukunft werden. Die redundanzfreie Ablage von Daten würde damit wieder stärker an Bedeutung gewinnen.

Jürgen Bittner betonte aber ebenso, dass es auch starke Hinderungsgründe gegen die Enterprise-DB gibt, sodass auch weiterhin  Kompromisse überwiegen könnten.

Ein wichtiger nächster Schritt in Richtung Enterprise-DB wäre die Unterstützung von semantischen Modellierungen in Form von Tools und Sprachen. Erste Ansätze dazu existieren bereits.

Ich habe für mich jedenfalls einige wichtige und interessante Aspekte mitgenommen. Zum einen die Tatsache, dass es sich manchmal doch lohnt, sich das anzuhören, was die „alten Hasen“ der Branche zu sagen haben. Andererseits muss ich die Informationen erst einmal sacken lassen. Die nachfolgend bewusst kommentar- und erklärungslos dargestellte Graphik soll die Punkte veranschaulichen, die ich gerade gedanklich zu sortieren versuche:

Insgesamt bin ich von der Veranstaltung „Datenbankstammtisch“ als solches sehr beeindruckt und möchte mich hiermit ganz herzlich bei Herrn Prof. Dr. Gräfe und Jürgen Bittner bedanken. Die vorgestellte Problematik begegnet mir tagtäglich in meinen Kundenprojekten. Und es ist sinnvoll, sich hin-und-wieder die Gesamtsituation zu vergegenwärtigen. In diesem Fall besteht die Möglichkeit, dass wir etwas nachlaufen (der Datenqualität) was wir besser von Anfang an sicherstellen sollten – z.B. durch geeignete Konzepte, wie der Enterprise-DB.

Falls Sie Anmerkungen oder Fragen zu diesem Beitrag haben, freue ich mich auf einen Kommentar von Ihnen.

 


Viewing all articles
Browse latest Browse all 155