DataOps wird bleiben. Hier ist der Grund dafür.

DataOps wird bleiben. Hier ist der Grund dafür.

Die Methodik zähmt widerspenstige Pipelines, um den Wert Ihrer Daten zu steigern - damit Sie sich schneller an geschäftliche Veränderungen anpassen können.

Auf die Frage, warum etwas in der Technologiebranche einen langen Atem hat, gibt es eine Vielzahl von Antworten. Manche Dinge gehen viral und verpuffen dann, während andere sich in unser tägliches Leben einfügen und im Laufe der Zeit für uns unverzichtbar werden. Was also unterscheidet das eine vom anderen? Gibt es einen einzigen, guten Indikator dafür, ob etwas Bestand hat?

Eine Möglichkeit, diese Frage in der Technik zu stellen, besteht darin, die Relevanz von Daten über ihren Lebenszyklus hinweg zu betrachten. Je mehr Daten im Laufe der Zeit verwendet, berührt oder verändert werden, desto größer sind die Chancen, dass sie bestehen bleiben.

Nehmen Sie Data Warehouses: Sie stellen einen "Point-in-Time"-Nutzungsmechanismus für Daten dar. Indem sie einen massiven Kreuzungspunkt für Ihre Daten zu einem bestimmten Zeitpunkt schaffen, geben sie Ihnen ein gutes Gefühl dafür, wo Sie gerade stehen. Es ist jedoch schwieriger, zu erkennen, wo Sie waren oder wohin Sie als nächstes gehen werden. Sie sind im Moment sehr gefragt, werden aber an Relevanz verlieren, wenn sie nicht über den gesamten Lebenszyklus der Daten hinweg genutzt werden können.

Data Lakes sind bequeme Wasserstellen für mehrere Teams, die Daten aus einer Quelle, z. B. einer Cloud-Anwendung wie Salesforce, nutzen möchten. Obwohl sie in der Lage sind, Datenänderungen im Laufe der Zeit zu erfassen, sind die manuellen API-Integrationen, die als "Zuflüsse" zu den Data Lakes fungieren, häufig durch ihre ursprünglichen Designzwecke eingeschränkt. Entscheidungen darüber, wie häufig Daten erfasst werden und wie breit diese Daten in einem Unternehmen verfügbar sind, schränken die Relevanz der Daten im Laufe der Zeit ein. Wenn sich die Interessen weiterentwickeln und sich die Wartungszyklen verlängern, sehen Data Lakes manchmal eher wie Dateninseln aus.

Das Gleiche gilt für das Stammdatenmanagement (MDM). Denken Sie einmal darüber nach, wie statisch oder in der Zeit eingefroren das Konzept des traditionellen MDM ist. Es stellt die Frage: "Was ist meine 360-Grad-Sicht auf diesen Kunden im Moment?" Doch die Antwort auf diese Frage ändert sich im Laufe der Zeit. Da Datenquellen kommen und gehen, entwickelt sich der perfekte Stammsatz weiter. MDM basiert auf der sich ständig ändernden Historie vieler verschiedener Datenquellen, deren Relevanz im Laufe der Zeit zu- und abnimmt.

DataOps ist anders, denn es ist eine Methodik - ein Akt der Zähmung widerspenstiger Datenpipelines, um Daten in einem Unternehmen in Wert zu verwandeln. Und auch wenn dabei manchmal veraltete Tools oder Praktiken zum Einsatz kommen, so hat diese Methode doch eine enorme Ausdauer, wenn man sie an ihrer Relevanz für Daten im Laufe der Zeit misst. Noch lange nachdem die Natur eine Schneeflocke als gefrorenes Wasser vom Himmel fallen lässt, wird die Praxis des Datenbetriebs uns zu einer perfekteren Einheit mit unseren Daten führen, während sich diese im Laufe der Zeit verändern. Das ist das Geschäft des Datenbetriebs - und es wird bleiben.

Wie können Unternehmen DataOps also zu ihrem Vorteil nutzen? Ein guter Ausgangspunkt ist, herauszufinden, wer im Unternehmen Daten benötigt und warum. Dabei stellen einige Unternehmen fest, dass sie möglicherweise mehrere Kopien der gleichen Daten in verschiedenen Teams für unterschiedliche Zwecke erfassen und erstellen. Systemadministratoren erfassen vielleicht stündliche Schnappschüsse von Daten für die Notfallwiederherstellung, während Fulfillment-Teams beispielsweise Teilmengen derselben Daten über die APIs des Systems in ihre Lieferkettensysteme einspeisen können.

Sobald Sie die erste Version einer Datenverbrauchsübersicht für Ihr Unternehmen erstellt haben, sollten Sie die Häufigkeitsanforderungen für jeden Datenverbraucher festlegen. Einige müssen die Daten innerhalb von fünf Minuten in ihren Systemen haben, während andere mit täglichen Zyklen einverstanden sind.

Als nächstes wird häufig eine Data Lake-Strategie entwickelt, bei der Unternehmen Daten aus einer Zielanwendung oder -quelle in einen Data Lake replizieren, der an die Quelle angrenzt, und alle Datenkonsumenten auf diese Replik als primären Verbrauchspunkt für ihre Daten aus einem bestimmten Ziel verweisen. Auf diese Weise entsteht eine ständig aktualisierte Wasserstelle für jede Datenquelle im Unternehmen. Sobald sich genügend Data Lakes um gemeinsame Wasserstellen herum gebildet haben, entwickeln Unternehmen in der Regel eine "Data Fabric"-Strategie, die Data Lakes zu einem zusammenhängenden, sich entwickelnden Datengeflecht im Unternehmen verbindet, Datensätze mit Token versieht und die sich ständig weiterentwickelnden Datenquellen zu einem echten 360-Grad-Bild eines Zielunternehmens zusammenführt. Im Gegenzug können Sie dieses Bild im Laufe der Zeit analysieren, um Muster und Chancen zu erkennen.

DataOps ist ein sich ständig weiterentwickelnder Prozess, der es einem Unternehmen ermöglicht, sich immer besser auf die Signale einzustellen, die verschiedene Datenquellen über die Geschwindigkeit und den Zustand des Unternehmens aussenden. Und obwohl es keine Einheitslösung für jedes Unternehmen gibt, wird sich DataOps durchsetzen. Diejenigen, die sich auf sinnvolle Weise damit beschäftigen, werden sich einen Wettbewerbsvorteil verschaffen und sich schneller an die Veränderungen in ihrem Unternehmen anpassen können.

Entwickler Jobs in Deutschland

Das könnte dich auch interessieren