Evaluierung der SAP HANA Technologie - Torsten Müller - E-Book

Evaluierung der SAP HANA Technologie E-Book

Torsten Müller

0,0
15,99 €

oder
-100%
Sammeln Sie Punkte in unserem Gutscheinprogramm und kaufen Sie E-Books und Hörbücher mit bis zu 100% Rabatt.

Mehr erfahren.
Beschreibung

Fachbuch aus dem Jahr 2014 im Fachbereich Informatik - Internet, neue Technologien, Note: 1.0, Ludwig-Maximilians-Universität München, Sprache: Deutsch, Abstract: In der heutigen Zeit ist das größte und wichtigste Kapital eines Unternehmens sein Wissen, auf dessen Grundlage oft wichtige Entscheidungen der Unternehmensspitze getroffen werden. Dieses Wissen ist in Form von Daten in meist unzähligen Datenbanken abgelegt. Gerade bei großen Konzernen häuft sich über die Jahre eine sehr große Datenmenge an, wodurch es immer schwieriger und kostenintensiver wird, auf diese Daten gezielt zuzugreifen. Bei noch mehr Daten, die für die nahe Zukunft erwartet werden, wird dieses Problem noch gravierender und somit eine immer größere Herausforderung für die Unternehmen. Die bisherigen Verfahren um diese Datenmengen sinnvoll und zielgerichtet aufzuarbeiten, basieren meist auf unterschiedlichen Systemen. So werden operative und analytische Daten in unterschiedlichen Datenbanken gespeichert. Sollen diese Daten nun ausgewertet werden, um z.B. zukünftige Unternehmensstrategien festzulegen, werden die Daten in einem aufwendigen Verfahren in ein Data-Warehouse (DWH) importiert. Dieser Prozess kann je nach Datenmenge mehrere Tage in Anspruch nehmen, wodurch die Daten schon wieder „veraltet“ sein könnten und somit für den Entscheidungsträger nur noch bedingt von Nutzen sind. Dieses Problem wurde von IT-Unternehmen erkannt und so wurden verschiedene Systeme entwickelt, um derartige Analysen sehr viel schneller bzw. im Idealfall in sogar Echtzeit durchzuführen. Eines dieser Systeme ist das von der SAP AG entwickelte HANA System, welches auf einer In-Memory-Technologie basiert, um komplexe Analysen von großen Datenmengen zu beschleunigen. In dieser Arbeit soll die HANA Technologie evaluiert werden. Dabei werden die Konzepte, die zur Beschleunigung von daten- und rechenintensiven Analysen notwendig sind beschrieben und mögliche Einsatzgebiete erörtert. Des Weiteren soll eine Applikation mit der HANA Technologie in der Amazon Cloud entwickelt werden, um somit die Einsatzmöglichkeiten besser definieren zu können.

Das E-Book können Sie in Legimi-Apps oder einer beliebigen App lesen, die das folgende Format unterstützen:

EPUB

Veröffentlichungsjahr: 2014

Bewertungen
0,0
0
0
0
0
0
Mehr Informationen
Mehr Informationen
Legimi prüft nicht, ob Rezensionen von Nutzern stammen, die den betreffenden Titel tatsächlich gekauft oder gelesen/gehört haben. Wir entfernen aber gefälschte Rezensionen.



Impressum:

Copyright (c) 2013 GRIN Verlag GmbH, alle Inhalte urheberrechtlich geschützt. Kopieren und verbreiten nur mit Genehmigung des Verlags.

Bei GRIN macht sich Ihr Wissen bezahlt! Wir veröffentlichen kostenlos Ihre Haus-, Bachelor- und Masterarbeiten.

Jetzt beiwww.grin.com

Inhaltsverzeichnis

 

1 Einleitung

2 Was ist SAP HANA?

2.1 SAP HANA Architektur

2.1.1 Hardware

2.1.2 Software

2.2 In-Memory-Technologie

3 SAP HANA Studio

3.1 Voraussetzungen

3.2 Installation

3.3 Eclipse-Konfiguration

3.4 Amazon Cloud Konfiguration

3.5 Arbeiten mit SAP HANA Studio

4 Entwicklung einer ersten Applikation

4.1 Verbinden mit SAP HANA

4.2 Tabellen und Testdaten

4.3 Package

4.4 Attribute View

4.5 Auswertungen – Data Preview

5 Zusammenfassung

Literaturverzeichnis

Glossar

A. Anhang

a. SQL Scripts

 

I. Abbildungsverzeichnis

 

Abbildung 1: SAP HANA Architektur [SAP13]

Abbildung 2: Zeilenorientierte Speicherung (row-based)

Abbildung 3: Spaltenorientierte Speicherung (column-based)

Abbildung 4: Komprimierung von Daten

Abbildung 5: SAP HANA Datenbank, Client und Studio

Abbildung 6: Download von SAP HANA Client und Studio

Abbildung 7: Installation des SAP HANA Clients

Abbildung 8: Installation SAP HANA Cloud Tools

Abbildung 9: Konfiguration des SAP HANA Cloud Trial Accounts

Abbildung 10: Informationen zur SAP HANA Instanz in der Amazon Cloud

Abbildung 11: Konfigurieren der SAP HANA Instanz im HANA Studio

Abbildung 12: Schema "shop" erstellen

Abbildung 13: Startseite der Modeler Perspektive

Abbildung 14: Neues Package erstellen

Abbildung 15: Erstellen eines Attribute Views

Abbildung 16: Verknüpfung von "users"- und "invoices"-Tabelle

Abbildung 17: Attribute View AV01

Abbildung 18: Auswertung der Umsätze, gruppiert nach Kunde

Abbildung 19: Umsatzentwicklung über alle Rechnungen

 

II. Tabellenverzeichnis

 

Tabelle 1: Vergleich SAP ERP und SAP BW

Tabelle 2: Amazon Cloud-System m2.xlarge [AMA13]

Tabelle 3: Erstellen der "users"- und „invoices“-Tabellen

Tabelle 4: Einfügen von Testdaten

Tabelle 5: SQL-Script zum Anlegen und Befüllen der Tabellen

 

1 Einleitung

 

In der heutigen Zeit ist das größte und wichtigste Kapital eines Unternehmens sein Wissen, auf dessen Grundlage oft wichtige Entscheidungen der Unternehmensspitze getroffen werden. Dieses Wissen ist in Form von Daten in meist unzähligen Datenbanken abgelegt. Gerade bei großen Konzernen häuft sich über die Jahre eine sehr große Datenmenge an, wodurch es immer schwieriger und kostenintensiver wird, auf diese Daten gezielt zuzugreifen. Bei noch mehr Daten, die für die nahe Zukunft erwartet werden, wird dieses Problem noch gravierender und somit eine immer größere Herausforderung für die Unternehmen.

 

Die bisherigen Verfahren um diese Datenmengen sinnvoll und zielgerichtet aufzuarbeiten, basieren meist auf unterschiedlichen Systemen. So werden operative und analytische Daten in unterschiedlichen Datenbanken gespeichert. Sollen diese Daten nun ausgewertet werden, um z.B. zukünftige Unternehmensstrategien festzulegen, werden die Daten in einem aufwendigen Verfahren in ein Data-Warehouse (DWH) importiert. Dieser Prozess kann je nach Datenmenge mehrere Tage in Anspruch nehmen, wodurch die Daten schon wieder „veraltet“ sein könnten und somit für den Entscheidungsträger nur noch bedingt von Nutzen sind.

 

Dieses Problem wurde von IT-Unternehmen erkannt und so wurden verschiedene Systeme entwickelt, um derartige Analysen sehr viel schneller bzw. im Idealfall in sogar Echtzeit durchzuführen. Eines dieser Systeme ist das von der SAP AG[1] entwickelte HANA[2] System, welches auf einer In-Memory-Technologie basiert, um komplexe Analysen von großen Datenmengen zu beschleunigen.

 

In dieser Arbeit soll die HANA Technologie evaluiert werden. Dabei werden die Konzepte, die zur Beschleunigung von daten- und rechenintensiven Analysen notwendig sind beschrieben und mögliche Einsatzgebiete erörtert. Des Weiteren soll eine Applikation mit der HANA Technologie in der Amazon Cloud entwickelt werden, um somit die Einsatzmöglichkeiten besser definieren zu können.

 

2 Was ist SAP HANA?

 

Die Hauptprodukte der SAP AG ist SAP ERP (Enterprise Resource Planning) und SAP BW (Business Warehouse). Beide sind sehr stark miteinander verbunden, nutzen jedoch im Backend nicht die gleichen Datenbanken. Das ERP System wird benutzt, um Kundendaten zu speichern, Bestellungen zu verwalten, Lieferungen zu verfolgen und Rechnungen zu überprüfen. Es werden damit also „Live-Daten“ verwaltet.

 

Ganz anders beim BW System. Dieses System wird für Reports und Analysen benutzt. Hierzu werden Daten aus dem ERP System geladen und aufwendig aufbereitet, um sie dann auswerten zu können. Diese Trennung der Daten wird deshalb vorgenommen, um das Live-System nicht mit aufwendigen Auswertungen zu belasten, was jedoch zu langsamen oder verspäteten Reports führen kann. Diese Probleme sollen mit SAP HANA beseitigt werden.

 

 

Tabelle 1: Vergleich SAP ERP und SAP BW

 

SAP HANA wird als Appliance vermarktet, d.h. das Produkt wird als kombiniertes System aus Soft- und Hardware geliefert. Dadurch soll sichergestellt werden, dass nur von der SAP AG geprüfte Systemteile benutzt werden und somit das bestmögliche Ergebnis erzielt werden kann.

 

HANA arbeitet mit einer speziellen In-Memory-Technologie, wodurch die gesamte Datenbank im Arbeitsspeicher gehalten wird. Dies ist gegenüber normalen Festplatten deutlich schneller.

 

2.1 SAP HANA Architektur

 

Wie bereits erwähnt, wird SAP HANA als Appliance vermarktet. Die Hauptbestandteile des HANA Server-System besteht also zum einen Teil aus der Hardware und zum anderen aus der Software, welche im Folgenden näher beschrieben werden.

 

 

Abbildung 1: SAP HANA Architektur [SAP13]

 

Eine komplette Übersicht über die die HANA Architektur und die zur Verfügung gestellten Schnittstellen ist in Abbildung 1 zu sehen.

 

2.1.1 Hardware

 

Da HANA sehr auf parallele Verarbeitung setzt, gibt SAP vor, dass Server eingesetzt werden, die möglichst viele CPU´s haben, die jeweils mehrere Kerne besitzen.

 

Die meisten Datenbanken (wie z.B. Oracle Database) legen möglichst viele Daten im Hauptspeicher ab, um schnell darauf zugreifen zu können. Dies sind vor allem Tabellen, auf die häufig zugegriffen wird. SAP HANA geht hier einen Schritt weiter und legt die komplette Datenbank in den Hauptspeicher. Aus diesem Grund muss der Hauptspeicher möglichst groß dimensioniert sein. So hat z.B. IBM – einer der Partner im SAP HANA Bereich – 2012 einen Server entwickelt, der insgesamt 100TB Hauptspeicher zur Verfügung hat. Diese Kapazitäten würden ausreichen, um die Daten der weltweit acht größten SAP Kunden zu verarbeiten [IBM12].

 

2.1.2 Software

 

Die SAP HANA Datenbank Software, die auf einem Server installiert wird, vereint mehrere Technologien, die SAP bereits seit längerem im Einsatz hat und die sich im Einsatz bewährt haben:

 

- MaxDB

MaxDB ist ein Relationales Datenbankmanagementsystem (RDBMS), welche bis 2004 unter der Bezeichnung SAP DB bekannt war. MaxDB ist im Vergleich zu anderen großen RDBMS, wie z.B. von Oracle, relativ simpel aufgebaut und hat geringe Systemvoraussetzungen. Die Das Datenbanksystem kann zum Betrieb für SAP ERP, aber auch SAP BW eingesetzt werden. Es hat eine „hohe Zuverlässigkeit und Verfügbarkeit sowie Skalierbarkeit und ein sehr umfangreiches Set von Features“ [MA09, 29].

 

- TREX