Abgrenzung von OLAP, BI und DSS
Ähnlich einem System für Business Intelligence (BI) gehört auch die OLAP-Methode (Online Analytical Processing) zum wirtschaftsinformatischen Bereich DSS (Decision Support System). Ein sogenannter OLAP-Würfel dient dabei nicht selten der BI als Grundlage. OLAP kann daher als Bestandteil dieser digitalen Geschäftsanalytik betrachtet werden. Verglichen mit dem gesamten Prozess der Business Intelligence, welcher auch externe Daten auswertet, bezieht OLAP grundsätzlich nur Analysen über interne Datenbanken und Daten der operativen Systeme (zum Beispiel ERP- & CRM-Software).
- Häufig wird von einem OLAP-Würfel (OLAP Cube) gesprochen. Dabei handelt es sich um ein visuelles Konzept eines würfelartigen Datengitters.
- Der Hauptvorteil eines OLAP-Würfels ist die transparente Darstellung eines mehrdimensionalen Datenbezugs, bei dem historische, leistungs- und bereichsbezogene Datenstrukturen aus verschiedenen Perspektiven betrachtet werden.
- Als analytisches Werkzeug ist OLAP durch die gezielten, mehrdimensionalen Abfragen dort erfolgreich, wo in kurzer Zeit Trends, Prognosen und Simulationen ausgewertet werden müssen.
- Anders als bei zweidimensionalen Abfragen können so beispielsweise Umsätze für bestimmte Regionen in einem definierten Zeitraum und mit zugehöriger Verkaufszahl in einer Übersicht konzentriert werden.
Datenquellen, Datenmodellierung und Datenhaltung in OLAP Systemen
Um Geschäftsdaten über Business Intelligence auswerten zu können, müssen diese standardisiert in einem Speichersystem abgelegt werden. Nutzbare Datenströme entspringen dabei sowohl den operativen Systemen als auch manuell hinterlegten Sammlungen.
Eingespeist werden Datenstrukturen entweder in einer Datenbank oder sie werden direkt von der Software an das OLAP-System zur Verarbeitung weitergegeben. Für eine ausbalancierte Lastenverteilung bei Analyseprozessen wird eine Client-Server-Architektur eingesetzt; die Datenhaltung erfolgt auf einem Server, die Abfrage über eine Benutzerschnittstelle, dem Client.
Datengrundlage Data Mart & Data Cube
Für OLAP spielen historische bzw. transaktionale Daten eine nebensächliche Rolle. Deswegen greift ein solches System am besten auf aktuelle Daten der operativen Systeme zu oder es werden sogenannte Data Marts und Data Cubes aus dem bestehenden Data Warehouse erschaffen. Dieser Prozess lässt sich grob als Raffinerie erklären, bei dem aus einem vollumfassenden Datensilo kleinere Teileinheiten entnommen werden, die Data Marts oder Data Cubes.
Diese sind auf einen bestimmten Themenbereich oder einen funktionalen Zusammenhang zugeschnitten und enthalten nur die jeweils relevantesten Unternehmensdaten für das Analysevorhaben. Ein Unterschied zwischen den Data Marts und Data Cubes für OLAP zeichnet sich durch deren relationale Struktur ab.
Mehrdimensionale Datenmodellierung
Verglichen mit Data Marts ist der Data Cube eine mehrdimensionale Datenkonfiguration. Der Data Mart wird typischerweise aus klassischen relationalen Datenbanken in Tabellenstruktur angelegt. Diese Ansicht ermöglicht jedoch nicht mehr als zwei Dimensionen (zum Beispiel „Umsatz“ und „Produkte“). Bei einem mehrdimensionalen Daten-Würfel wird die Matrix des Data Marts mit einer gewissen Tiefe verfeinert und die hierarchische Verknüpfung zwischen den Dateneinheiten verschmilzt: Sie werden einander auf mehreren Dimensionen zugeordnet.
- Es entstehen also beispielsweise 3D-Strukturen aus „Umsatz“, „Produkte“ und „Zeitraum“ – daher auch der Name Data Cube. Die Einheiten der drei Dimensionen bedingen einander.
- Wird nun ein Zeitraum festgelegt, erhält der Analyst die zugeordneten Daten der beiden anderen Dimensionen.
- Ein Vorteil von BI Cubes, wie die OLAP Würfel auch genannt werden, ist die schier unendliche Hinzunahme von kombinierbaren Dimensionen.
- Werden Daten eines Geschäftsprozesses benötigt, der aus fünf Dimensionen besteht, würde ein OLAP-Würfel beispielsweise „Verkaufsregion“, „Umsatz“, „Produkte“, „Absatz“ und „Zeitraum“ kombinieren.
Datenhaltung über ROLAP, MOLAP & HOLAP
Werden Datenbanken für Online Analytical Processing eingesetzt unterscheidet sich deren Struktur und Verwendung. Zum einen sorgen relationale Systeme (ROLAP) für eine hohe Kompatibilität zu den meisten Datenbankstrukturen. Für die multidimensionale Ansicht werden einfache Relationen verknüpft oder mehrdimensionale Data Cubes extrahiert. ROLAP-Systeme bleiben bei hohen Nutzerzugriffen und ausgelasteten Anwendungsbereichen relativ stabil und weisen eine hohe Datenkapazität auf.
Beim multidimensionalen OLAP (MOLAP) bestehen Datenbanken, deren Datenstruktur von Haus aus mehrdimensional verstanden wird. Das sorgt im analytischen Verarbeitungsprozess für eine höhere Performanz als mit ROLAP-Systemen. Die Datenkapazität bei reinem MOLAP liegt jedoch unter dem des rationalen OLAP.
Um einen Ausgleich zu finden, lassen sich HOLAP-Prozesse einsetzen. Es handelt sich um einen Hybrid aus den kapazitiven Vorteilen des ROLAP-Systems und der Effizienz von MOLAP. Dieses System eignet sich, wenn komplexe und weitgefasste Datenstrukturen innerhalb kurzer Zeit ausgewertet werden müssen.
Optimale Integration eines OLAP-Systems
Je nachdem welche Schnittstellen genutzt werden soll, bieten sich verschiedene Möglichkeiten zur Anbindung an die bestehenden Systeme an. Sinnvoll sind jedoch OLAP-Funktionen in Komplettlösungen der Unternehmenssoftware. Dadurch können Daten schnittstellenlos von der Software bezogen werden. Die aufwändige Pflege eines Data Warehouses fällt dann beispielsweise für ERP-Komplettlösungen weg und Datenbestände werden nicht redundant erzeugt.
- Denn die unterschiedliche Abteilungen greifen zwar auf verschiedene Funktionen zurück, verwenden jedoch dieselbe Software und demzufolge auch dieselben Datensätze.
- Es muss also auch nicht darauf geachtet werden, ob die Daten z.B. für MOLAP oder ROLAP kompatibel sind.
- Der Anbieter einer solchen Lösung achtet auf eine einheitliche Datenstruktur, die von seiner OLAP-Funktion verstanden wird.
- Außerdem sind häufig auch andere Funktionen der Business Intelligence inklusive, die sich gegenseitig stützen und auch bei einem Software-Update weiterhin kompatibel bleiben.
Funktionen und Einstellungen eines OLAP-Würfels
Präzision, Flexibilität und Skalierbarkeit stellen die Kerndisziplinen des OLAP-Prozesses. Darum lassen sich BI Cubes, nachdem Sie für einen Schwerpunkt erstellt wurden, schärfer ausrichten. Die Modellierung dieser Datenstrukturen geschieht unter anderem über die folgenden Prozesse:
Slicing (Separierung)
Beim Slicing wird dem Würfel eine „Scheibe abgeschnitten“. Das bedeutet im Fachterminus, dass der OLAP Cube entlang einer seiner Dimensionen auf eine akute Einheit reduziert wird (zum Beispiel: Dimension = Zeit; Einheit = 01.10.2020). Die übrigen Dimensionen aggregieren nun Daten, welche jeweils einen Schnittpunkt mit dieser Einheit bilden. Beispielsweise werden alle verkauften Produkte und alle Umsätze für die herausgenommene Zeiteinheit 01.10.2020 gesammelt.
Dicing (Segmentierung)
Ähnlich dem Slicing werden beim Dicing eine oder mehrere Dimensionen um bestimmte Einheiten verkürzt, sodass beispielsweise auf der Dimension Produkte die Einheiten „Schuhe“, „Taschen“ und „T-Shirts“ wegfallen. Es bildet sich also ein neuer Würfel, mit einem verminderten Volumen.
Pivoting/Rotating (Fokussierung)
Bildlich gesprochen wird der OLAP-Würfel gedreht, sodass mindestens eine der anderen Dimensionen sichtbar wird. Es geht also um die Fokussierung auf bestimmte Datenansichten.
Drill-Down (Vertiefung)
Der Würfel wird beim Drill-Down erst dem Slicing oder Dicing unterzogen. Das reduzierte Volumen wird durch Detaileinheiten verdichtet, sodass der Analyst praktisch in den separierten oder segmentierten Ausschnitt „einzoomt“. Beispielsweise würde die herausgenommene Einheit 01.10.2020 zu einer eigenständigen Dimension werden, in der nun die Uhrzeiten des Tages als Einheit fungieren.
Drill-Up/Roll-Up (Vergröberung)
Drill-Up bildet den gegenteiligen Prozess von Drill-Down. Durch „Auszoomen“ fallen Detaileinheiten weg und die Dimensionen verlaufen mit gröberen Stufen. Einheiten wie Tage fassen sich beispielsweise nun als Woche zusammen.
Die wichtigsten Kriterien bei OLAP
- Mehrkontenfähigkeit: Da Online Analytical Processing verschiedene Auswerter unterstützt, sollte ein solches System mehrkontenfähig sein. Die konkreten Kosten einer OLAP-Lösung werden daher vor allem an der Anzahl der Benutzer ausgerichtet.
- Performanz: Um Entscheidungsprozesse in Controlling oder auf Managementebene kurzfristig zu unterstützen, sollten Abfragen nicht länger als fünf Sekunden, komplexe Abfragen nicht länger als 20 Sekunden dauern. Das Reporting muss ebenfalls innerhalb kürzester Zeit abgeleitet und flexibel zusammenzustellen sein.
- Transparenz & intuitive Navigation: Eine Abgrenzung zwischen systematischer Verarbeitung, innerhalb oder separat zur Datenspeicher-Architektur, und der übersichtlichen Bedienoberfläche sorgt für einen leicht nachvollziehbaren OLAP-Prozess.
- Lastverteilung: Durch eine Client-Server-Architektur werden Ressourcen und Kapazitäten nach dem tatsächlichen Verwendungszweck beansprucht.
- Skalierbarkeit: Ein Tool für OLAP sollte eine beliebige Anzahl an Dimensionen und deren Kombinationsmöglichkeiten einrichten können. Wichtig ist auch, dass die Dimensionen strukturell und funktional einheitlich aufgebaut sind, damit keine Berechnungsfehler oder Datenverluste entstehen.