Skip to Content

Was ist eine Time-Series Database (TSDB)?

Vector illustration concept of time management isolated on blue background with long shadow.

Wenn Sie minutenweise, tagtäglich oder andere Datenanalysen anzeigen müssen, verwenden Sie eine Zeitreihendatenbank. Eine Zeitreihendatenbank speichert Datenpunkte mit den zugehörigen Zeitstempeln, sodass den Benutzern Trends innerhalb eines bestimmten Zeitraums angezeigt werden können. Sie wird häufig bei der Visualisierung zeitbasierter Informationen und Analysen verwendet.

Was ist eine Time-Series-Datenbank?

In einer Zeitreihendatenbank enthält jeder Datensatz einen Zeitstempel. Der Zeitstempel kann verwendet werden, um einen einzelnen Datenpunkt oder in der Grafik und Analyse anzuzeigen. Die Zeitreihendatenbank wird speziell für Informationen verwendet, die einen Datumsbereich erfordern, z. B. die Wetterverfolgung oder die Abfrage nach bestimmten Ereignissen, die zu Überwachungszwecken protokolliert werden.

Was ist eine Zeitreihen-Kollektion?

Eine Zeitreihendatenbank speichert alle Daten, aber eine Zeitreihensammlung ist eine Datenscheibe, die aus der Datenbank entnommen und an die Anwendung zurückgegeben wird. Zeitreihensammlungen werden in Form eines Datensatzes aus der Datenbank abgerufen, und der Datensatz enthält Datenpunkte für den angegebenen Datumsbereich. Der Benutzer oder die Anwendung sendet den Zeitbereich als Eingabe an die Datenbank, und die Datenbank gibt eine Sammlung für jeden Datenpunkt zurück, der in den angegebenen Bereich fällt.

So funktioniert eine Datenbank der Zeitreihe

In der Regel wird eine Zeitreihendatenbank erstellt, um große Datenmengen für zukünftige Analysen zu erfassen. Benutzer legen ihren Datumsbereich in einer Anwendung fest, und die Datenbank gibt einen Satz von Datenpunkten zurück. Die Datenbank funktioniert, indem sie Daten in Intervallen erfasst. Ein Aktien-Ticker kann beispielsweise jede Minute Änderungen in einem Aktienkurs anzeigen. Die Datenbank speichert den Aktiennamen, den Preis und den Zeitstempel, um den Aktienpreis für Analysen und historische Informationen jede Minute zu erfassen.

Daten, die aus einer Zeitreihendatenbank abgerufen werden, sortieren Datensätze in chronologischer Reihenfolge, sodass Entwickler Visualisierungen ohne großen Overhead erstellen können. Datenbanken sind leistungsstarke Server, sodass sie einen Datensatz viel schneller sortieren können als eine Front-End-Webanwendung. Die Zeitreihendatenbank nimmt Eingaben aus der Anwendung entgegen, um zu bestimmen, wie die Daten sortiert werden sollen, sodass Entwickler den Benutzern Analysen anzeigen können. Beispielsweise kann ein Benutzer Daten über die Aktienkurse für einen bestimmten Datumsbereich anfordern und in aufsteigender Reihenfolge sortieren.

Beliebte Datenbanken der Zeitreihe: Vergleiche

Jede Datenbank der Zeitreihe verfügt über eine Backend-Engine, die zum Speichern und Abrufen von Daten verwendet wird. Die Engine muss schnell und effizient sein, um große Datenmengen zu speichern und sie mit sehr geringer Latenz abrufen zu können. Sie könnten zeitbasierte Daten in einer herkömmlichen Datenbank speichern, aber mehrere auf dem Markt erhältliche Datenbanken der Zeitreihe sind speziell für das Abfragen und Speichern dieser Art von Daten konzipiert.

Warum InfluxDB verwenden: Open-Source-TSDB

Open-Source-Datenbanken werden von einigen Entwicklern bevorzugt, da sie die Codebasis forkieren und ihre eigenen Änderungen am Basisprodukt vornehmen können. InfluxDB ist eine Open-Source-Zeitreihendatenbank, die jede Sekunde Tausende von Datenpunkten speichern kann. Wenn Sie Infrastrukturen wie IoT-Geräte für industrielle Anwendungen überwachen möchten, ist InfluxDB eine gute Wahl.

Prometheus versus InfluxDB

Der Hauptunterschied zwischen InfluxDB und Prometheus ist die Art und Weise, wie Daten abgerufen werden. Mit InfluxDB sendet eine Anwendung kontinuierlich Daten an die Datenbank, in der sie gespeichert und abgerufen wird. Prometheus funktioniert über eine API, bei der die Anwendung Daten weitergibt, und die Datenbank verwendet die API, um sie dann nach gespeicherten Daten abzufragen. Für große Unternehmen mit Systemen an zahlreichen Standorten ermöglicht die Cloud-basierte API von Prometheus Entwicklern das Hochladen von Daten von mehreren Standorten, an denen sie in einem zentralen Dashboard überprüft werden können.

ZeitskalaDB vs. InfluxDB

InfluxDB ist eine NoSQL-Datenbank, während TimescaleDB eine relationale Datenbank ist. Relationale Datenbanken funktionieren sehr anders als NoSQL-Datenbanken. Eine relationale Datenbank funktioniert mit Tabellen und Schlüsseln, die zum Verbinden von in jeder Tabelle gespeicherten Daten verwendet werden können. Es ist wichtig zu wissen, wie eine Datenbank ihre Daten speichert, da die Art und Weise, wie sie abgerufen wird, unterschiedliche Syntax verwendet. Wenn Sie die Daten kennen, die gespeichert werden, und sie in Tabellen organisieren können, ist TimescaleDB eine praktikable Option.

Elasticsearch versus InfluxDB

Zur Steigerung der Performance ist Elasticsearch eine gängige Engine, die in Unternehmensanwendungen verwendet wird. Seine Performance ist etwas besser als InfluxDB, da es Indizes, bei denen es sich um Karten zu Daten handelt, die in Elasticsearch als „Dokument“ gespeichert sind, zerkleinern kann. Elasticsearch sollte für große Datensätze verwendet werden, bei denen Anwendungen und Benutzer Datensätze abrufen, die Millionen von Datenpunkten aus einer Vielzahl von Zeitstempeln umfassen können. Elasticsearch ist beispielsweise für die Überprüfung von Protokolldateien nützlich, die zur Überwachung einer großen Unternehmensnetzwerkumgebung auf verdächtige Benutzeraktivitäten verwendet werden.

Wann Zeitreihendatenbanken verwendet werden sollten

Die meisten Datenbanken der Zeitreihe werden zur Überwachung von Hardware oder Software verwendet, sodass eine große Sammlung von Daten zur Analyse bestimmter Ereignisse verwendet werden kann. Um ein klares Bild von Ereignissen in einer Umgebung zu erhalten, benötigen Sie viele Daten, die aus zahlreichen Quellen gesammelt werden. IoT-Sensoren können beispielsweise Temperaturdaten von mehreren Maschinen erfassen. Eine Zeitreihendatenbank speichert die Temperatur für jede Minute des Tages, sodass Ingenieure Anomalien erkennen und beheben können, bevor die Maschine ausfällt.

Relationale Datenbanken im Vergleich zu Datenbanken der Zeitreihe

Die meisten Datenbanken der Zeitreihe verwenden NoSQL-Dokumente zum Speichern von Daten, was eine gängige Möglichkeit ist, unstrukturierte Daten zu speichern. Unstrukturierte Daten bedeuten, dass Entwickler Daten wie einen Zeitstempel und einen Namen speichern können, ohne die Einschränkungen bei der Organisation der Daten in definierten Tabellenzeilen. Relationale Datenbanken erfordern, dass Entwickler Daten unter Verwendung bestimmter Strukturen speichern, sodass sie keine praktikablen Optionen für Zeitreihendaten mit unbekannten Werten und Datentypen sind. Ein Entwickler konnte beispielsweise keinen Zeichenfolgewert in einer Zeitstempelspalte mithilfe einer relationalen Datenbank speichern, aber dies kann mit einer NoSQL-Datenbank der Zeitreihe erfolgen.

NoSQL-Datenbanken im Vergleich zu Datenbanken der Zeitreihe

Bei unbekannten Werten ist eine NoSQL-Datenbank die bevorzugte Methode. Sie sollten eine Datenbank auswählen, die NoSQL unterstützt, z. B. InfluxDB oder Elasticsearch. Diese Time-Series-Datenbanken bieten Massen-Daten-Storage mit schneller Performance bei Abfragen. Sie sind größtenteils für Großunternehmensanwendungen reserviert und viel schwieriger zu implementieren. Eine falsch konfigurierte NoSQL-Datenbank kann die Performance während der Abfrageverarbeitung beeinträchtigen.

Vorteile von Datenbanken der Zeitreihe

Jede Datenbank speichert Informationen, aber eine Zeitreihendatenbank wurde speziell für zeitbasierte Analysen entwickelt. Der Vorteil einer Zeitreihendatenbank liegt in der Fähigkeit, große Datenmengen mit jedem Datenpunkt zu speichern, der einen Zeitstempel enthält. Da sie auf großen Datensätzen basiert, ist eine Zeitreihendatenbank beim Einfügen neuer Datensätze und beim Abrufen großer Datensätze oft schneller und viel effizienter als eine herkömmliche Datenbank.

Time-Series-Datenbanken sind oft genauer für Abfragen, die Daten und Uhrzeiten betreffen, und speichern Time-Series-Daten viel effizienter. Jedes Unternehmen, das Überwachungsdaten speichern möchte, profitiert von einer Zeitreihendatenbank. Anwendungen profitieren von einer Zeitreihendatenbank, da sie große Datensätze für Analysen, Visualisierungen, finanzielle Trends, Aktivitätsinformationen und Änderungen in einer Umgebung abrufen kann, die tagsüber in unterschiedlichen Intervallen häufig auftritt.

Nachteile von Datenbanken der Zeitreihe

Wie bei jeder fortschrittlichen Infrastruktur sind Datenbanken in Zeitreihen schwieriger zu implementieren und richtig zu konfigurieren. Da es sich bei den meisten von ihnen um NoSQL handelt, leidet eine falsch eingesetzte NoSQL-Datenbank unter schlechter Performance, wenn sie nicht optimiert wird. Bei Konfigurationen muss jemand innerhalb des Unternehmens die richtigen Möglichkeiten zur Optimierung der Datenbank kennen. 

Unternehmen, die Zeitreihendaten speichern möchten, benötigen die Ressourcen, um große Datenmengen zu speichern. Daten können in der Cloud gespeichert werden, aber sie erhöhen die IT-Kosten. Die Infrastruktur zur Unterstützung von Daten-Storage und Datenbankverarbeitung in Zeitreihen kann kostspielig sein.

Fazit

Wenn Sie eine bessere Lösung für zeitbasierte Daten finden möchten, ist eine Zeitreihendatenbank eine gute Wahl. Überprüfen Sie die verschiedenen Arten von Datenbank-Engines, berücksichtigen Sie die Kosten und finden Sie eine, die mit dem Wachstum des Unternehmens und dem Anstieg des Daten-Storage skaliert werden kann. Denken Sie daran, Konfigurationen und Optimierungsoptionen zu überprüfen, um sicherzustellen, dass die Datenbank so effizient wie möglich läuft.

11/2024
Pure Storage Cloud for Azure VMware Solution
Shrink your Azure VMware costs with Pure Storage Cloud, a suite of enterprise-grade data services by Pure Storage.
Lösungsprofil
4 Seiten
KONTAKTIEREN SIE UNS
Fragen, Kommentare?

Haben Sie eine Frage oder einen Kommentar zu Produkten oder Zertifizierungen von Pure?  Wir helfen Ihnen gerne!

Termin für Demo vereinbaren

Vereinbaren Sie einen Termin für eine Live-Demo und sehen Sie selbst, wie Pure Ihnen helfen kann, Ihre Daten in überzeugende Ergebnisse zu verwandeln. 

Rufen Sie uns an: +49 89 26200662
Presse:
 pr@purestorage.com

 

Pure Storage Germany GmbH

Mies-van-der-Rohe-Straße 6

80807 München

Deutschland

info@purestorage.com

SCHLIESSEN
Ihr Browser wird nicht mehr unterstützt!

Ältere Browser stellen häufig ein Sicherheitsrisiko dar. Um die bestmögliche Erfahrung bei der Nutzung unserer Website zu ermöglichen, führen Sie bitte ein Update auf einen dieser aktuellen Browser durch.