
Bei Big Data sollte es nicht um
Marketing-Übertreibungen gehen
Begriffe, wie Big Data oder KI sind seit geraumer Zeit täglich zu lesen. Sehr großzügig wird mit diesen Begriffen umgegangen.
Aber eben nicht Alles, was da beschrieben wird, ist Big Data oder KI.
Unter der Überschrift “Big Insights Not Big Data: Why We Should Stop Talking About File Size“ erfasst Kalev Leetaru bei Forbes eine sehr kritische Betrachtung über Big Data.
Was bedeutet Big Data wirklich?
Aufgrund der stetig verfügbaren preiswerten Speicherangebote, der allumfassenden Datensets und des großen Volumenbedarfes benutzerfreundlicher Austauschformate, wie zum Beispiel XML und JSON, werden Datenmengen maßlos angehäuft.
„In unserem datengetriebenen Wettrüsten haben wir die einfache Tatsache aus den Augen verloren, dass„ Big Data “entstanden ist, um Erkenntnisse zu gewinnen, die im kleineren Maßstab nicht möglich sind.“
Leetaru stellt jedoch fest, dass in der Werbung nur möglichst riesige Datenmengen und nicht die Qualität der gewonnen Erkenntnisse im Vordergrund stehen.

Platform or Product

Multi or Mono

Königsweg oder Holzweg
„Nur wenige Analysen verwenden jedes Feld in einem Datensatz. Tatsächlich handelt es sich bei der überwiegenden Mehrheit der “Big Data” ‑Analysen in Wirklichkeit um sehr viele “Small Data” ‑Analysen, wenn es um die tatsächlich verbrauchte Datenmenge geht.“
Leetaru beschreibt weiter sehr anschaulich an dem Beispiel einer Studie bei Twitter, wie bei der Verarbeitung eines Megadatensatzes peu a peu durch die fehlende Relevanz der Daten und der unvollständige Datensätze, aus Big Data kaum verwertbare Informationen entstanden sind.
„Die heutige Big-Data-Welt konzentriert sich zu sehr auf die Dateigröße der zu analysierenden Datensätze und nicht auf die tatsächlichen Datenpunkte bzw. die Erkenntnisse, die sie liefern sollen. Wenn ein 1‑Megabyte-Dataset dieselben Erkenntnisse liefert wie ein 1‑Petabyte-Dataset (1015Byte), ist „Big Data“ möglicherweise nicht die beste Lösung für dieses Problem.“
facere.berlin verfolgt konsequent den Weg der Minimierung des Datenvolumens. Wir forschen an der Auflösung, Abstrahierung, Semantik und der Assoziationsanalyse komplexer Inhalte in Dokumenten, um möglichst wenige, aber dafür hoch relevante und zweckgebundene Daten für Geschäftsprozesssteuerungen zu erhalten.facere.berlin process design GmbH
Nur so ist es möglich, die Effizienz und Individualisierung von Geschäftsprozessen zu steigern, personelle und technische Ressourcen zu schonen und die Transparenz erheblich zu verbessern.