Blog

Das *umBlog – Wissenswertes aus der Welt der Daten, Tech-Trends, Termine und Einblicke in unsere unglaubliche Company.

Data Lake: Basis für die Verarbeitung von Big Data

Verfasst am 24.08.2016 von Lukas große Kloenne

Data_Lake_-_Speicher_fur_Big_Data.jpg

Big Data ist heute ein Sammelbegriff für Industrie 4.0, Internet of Things, Machine Learning und Co. Um am Markt nicht ins Hintertreffen zu geraten, sondern sich behaupten zu können oder eine Vorreiterrolle einzunehmen, müssen Unternehmen unzählige Daten generieren und sammeln, um daraus fortlaufend neue (digitale) Geschäftsmodelle entwickeln zu können.

Zwar speichern die meisten Unternehmen in der Regel bereits große Datenmengen. Doch diese befinden sich häufig lediglich in einzelnen Daten-Silos, die nicht oder nur unzureichend miteinander verknüpft sind. Dadurch ist es unmöglich, aus der gesamten Datenmenge das Optimum an Informationen und Erkenntnissen herauszufiltern. Hier verschenken Unternehmen noch zu viel Potential.

Data Lakes statt Datensumpf

Die immer größeren Datenmengen aus einer zunehmenden Anzahl von Quellen erfordern eine entsprechend große Speicherkapazität. Das stellt bestehende Infrastrukturen vor große Herausforderungen, so dass gesammelte Daten oft ungenutzt versumpfen. Die Lösung: ein Data Lake. Hiermit lassen sich Daten in einer einzigen gemeinsamen Speicherplattform sammeln, speichern, verwalten, schützen und analysieren. Daher ist ein Data Lake für eine moderne IT- und Daten-Infrastruktur unerlässlich.

Eine Data-Lake-Strategie ist ein ganzheitlicher Ansatz, der Daten, Anwendungen und Analysen zusammenführt. Strukturierte und unstrukturierte Daten werden unabhängig von Quelle oder Ziel in einen großen Data Lake aufgenommen, katalogisiert, erfasst und kontrolliert. Der Prozess umfasst drei Phasen: erkunden, optimieren und transformieren.

Bildschirmfoto_2016-07-07_um_11.01.29.png

Die Vorteile eines Data Lake

Es gibt viele gute Gründe, die für die Nutzung von Data Lakes sprechen:

  • Data Lakes sind anwenderfreundlich

Anstatt viele verschiedene Speicher zu haben, die nicht oder nur unzureichend miteinander verknüpft sind, ist ein Data Lake ein zentraler Speicher/Speicherort für alle Anwendungen.. So lassen sich Kapazität, Performance und Sicherzeit ohne zusätzliche Komplexität skalieren.

  • Data Lakes erlauben Flexibilität

Data Lakes ermöglichen es Unternehmen, IT-Komponenten zu entkoppeln, um diese auch unabhängig voneinander skalieren zu können. Mithilfe nativer Mechanismen erlauben sie einen offenen, standardbasierten Zugriff auf die Daten.

  • Date Lakes sind kompatibel

Data Lakes funktionieren in Zusammenhang mit zahlreichen Anwendungen, Tools und Technologiegenerationen. Sie sind unabhängig von Anbieter und Plattform und funktionieren mit Windows, Max, Linux, Unix oder Hadoop.

  • Data Lakes sind effizient

Data Lakes ermöglichen die optimierte Auslastung aller IT-Ressourcen. Zudem wird weniger Stellfläche im Rechenzentrum benötigt. Außerdem beseitigen sie Datensilos, parallele Systeme und Duplizierungen.

Up to date: Data Lakes von EMC

Anders als herkömmliche Anbieter von Speicherlösungen, die nur einzelne Komponenten eines Data Lake liefern, stellt EMC eine vollständige und komplett flexible Lösung bereit. EMC bietet verschiedene Data-Lake-Plattformen mit branchenführenden Scale-out-Lösungen für Objekt- und Dateispeicherplattformen.

Der Vorteil unserer Lösungen besteht darin, dass sie mit Datei- oder Objekt-Workloads funktionieren und somit eine einfache, skalierbare, flexible und effiziente Antwort auf Big-Data-Speicheranforderungen geben“, so Maurice Castillo, Senior Manager Sales Mid Market bei EMC.

Mit den Data-Lake-Lösungen von EMC haben Unternehmen ihre sämtlichen Daten an einem zentralen, sicheren Speicherort. Zusätzlich vereinfacht sich der Zugriff auf die Daten und deren Analyse durch die Unterstützung des Branchenstandardprotokolls (Hadoop) sowie durch die zertifizierten Integrationen führender Analyseanbieter wie Cloudera, Hortonworks, Splunk, IBM und vielen mehr.

Kooperation zwischen *um und EMC

In Bereich dieser Speichertechnologien arbeitet The unbelievable Machine Company (*um) seit vielen Jahren eng mit EMC zusammen. Bei der Integration von Data Lakes in eine bestehende IT-Architektur berät *um Unternehmen und bietet zusätzliche Services wie Betrieb und 24x7 Service an, die den Unternehmen den Einsatz und den Nutzung der neuen Speichertechnologie vereinfachen.

Darüber hinaus verfügt *um über eine große Expertise im Bereich Data Science. Kürzlich wurde *um von der Experton Group in den Bereichen „Big Data Consulting“, „Big Data Operations“ und „Big Data Analytics-as-a-Service“ als „Big Data Leader 2016“ ausgezeichnet.

Fragen zu Data Lakes und moderner IT-Infrastruktur? Wir beraten dich gerne!

Aktuelle Blogeinträge

Social Media

Kontakt

The unbelievable Machine
Company GmbH
Grolmanstr. 40
D-10623 Berlin

+49-30-889 26 56-0 +49-30-889 26 56-11 info@unbelievable-machine.com

Kostenloses Whitepaper

Data Thinking:
Erfolgsrezept für den digitalen Wandel

Zum Whitepaper