Een tijdreeksdatabase biedt real-time toepassingen met recordsets op basis van een tijdsbestek. Hoewel alle databases het opslaan van data met een tijdstempel mogelijk maken, is een tijdreeksdatabase geoptimaliseerd voor recordsets waarbij de data een verhaal in chronologische volgorde vertellen. De duur van een set data kan binnen een paar milliseconden van elkaar zijn, of een tijdreeksdatabase kan worden gebruikt voor datapunten per uur, dagelijks, maandelijks of jaarlijks.
Wat is een Time Series-database?
Hoewel elke database-engine ontwikkelaars in staat stelt een tijdstempel in een record op te slaan, is een tijdreeksdatabase (TSDB) speciaal ontworpen voor recordsets die op een tijdsbestek zijn gericht. Het kan bijvoorbeeld zijn dat u van minuut tot minuut updates nodig hebt in een weerapplicatie. Een tijdreeksdatabase kan gedurende elke minuut data opslaan om weer te geven aan gebruikers. Een TSDB kan een optie zijn in plaats van standaard NoSQL-databases zoals MongoDB wanneer u meer verfijnde, op tijd gebaseerde query's nodig hebt.
Omdat een TSDB voornamelijk wordt gebruikt om data op te halen, zijn deze databases vaak geoptimaliseerd voor lezen en het creëren van nieuwe records. Omdat TSDB's zelden records bijwerken, zijn ze gebouwd om records beter op te halen op basis van een tijdstempel in vergelijking met andere veelvoorkomende databases. TSDB's zijn ook het beste voor realtime toepassingen waarbij gebruikers een lineaire set informatie krijgen op basis van de tijdstempel in elk record.
Hoe werkt een Time Series-database?
De beste manier om te begrijpen hoe een tijdreeksdatabase werkt, is door een voorbeeld te gebruiken. Stel dat u sensoren hebt op een machine die afhankelijk is van de temperatuur. Temperaturen veranderen van minuut tot minuut, zodat een tijdreeksdatabase kan worden gebruikt om de temperatuur en de tijdstempel bij te houden. Andere machine-eigenschappen kunnen worden geregistreerd, waaronder de locatie van de machine, vochtigheid en omgevingstemperatuur.
Terwijl de machine draait, slaan sensoren data op in een TSDB. De TSDB slaat elk record op volgorde op terwijl de sensoren informatie verzamelen. U hoeft geen records bij te werken, maar u moet ze wel ophalen om het systeem te controleren. De TSDB-storage-engine werkt door query's voor grote datasets te optimaliseren en data op te halen op basis van recordtijdstempels. Streams van tijdgestempelde data worden naar analisten gestuurd om machines te monitoren en beslissingen te nemen voor onderhoud.
Voordelen van het gebruik van een Time Series-database
Een TSDB-engine is gebouwd voor het opslaan van grote hoeveelheden data en het leveren van grote records. Realtime applicaties profiteren van de geoptimaliseerde engine van een TSDB voor het elke seconde of minuut ophalen van data. Monitoringoplossingen die voorspellingen van grote datavolumes of realtime informatie vereisen, profiteren van de schaal en snelheid van een tijdreeksdatabase.
Omdat records meestal een klein aantal velden bevatten, is het opvragen van query's vereenvoudigd voor ontwikkelaars. Een TSDB kan duizenden records retourneren, maar de recordset bevat vaak slechts een paar velden. Het beperkte aantal velden en vereenvoudigde query's versnellen de prestaties van realtime applicaties en verminderen de overhead op de databaseserver.
Gebruikssituaties voor Time Series-databases
Industrieën waar IoT gebruikelijk is of grote datapunten met tijdstempels nodig zijn voor voorspellingen en monitoring zijn ideaal voor een tijdreeksdatabase. Productie en andere industrieën waar IoT-sensoren cruciaal zijn voor uptime, werken samen met tijdreeksdatabases om problemen te voorspellen voordat ze diensten onderbreken. Een fabrikant gebruikt bijvoorbeeld IoT-sensorgegevens om te voorspellen wanneer machines onderhoud nodig hebben of binnenkort te maken kunnen krijgen met hardwarestoringen.
Grote netwerkapplicaties kunnen werken met tijdreeksdatabases om storingen te voorspellen of potentiële bedreigingen te identificeren. Kritieke netwerkinfrastructuur kan een grote internetprovider of een datacenter ondersteunen, en tijdgestempelde data kunnen een beveiligingsanalist waarschuwen voor een mogelijke storing wanneer de omgevingstemperaturen te hoog zijn of hardware corrupte informatie stuurt, wat wijst op potentiële downtime. Elke real-time bedrijfskritische applicatie werkt met een tijdreeksdatabase voor prestaties en schaalbaarheid. Als het CPU-gebruik van de server bijvoorbeeld vaak piekt, kan het tijd zijn om het bij te werken of een CPU te vervangen om downtime en systeemcrashes te voorkomen.
Populaire Time Series-databaseoplossingen
Als u niet met een tijdreeksdatabase hebt gewerkt, zijn er verschillende populaire opties om uit te kiezen. Hier zijn een paar TSDB-oplossingen voor uw toepassingen:
- InfluxDB: Deze columnaire oplossing is voor geoptimaliseerde realtime query's en columnaire analyses.
- Prometheus: Deze TSDB is ideaal voor dimensionale data- en visualisatieanalyse. Prometheus-ontwikkelaars bieden een open source monitoringtool en database-engine.
- Tijdschema: Deze populaire TSDB wordt gebruikt voor IoT, sensoren, crypto en AI-analytics.
Conclusie
Aangezien het moeilijk is om van databaseprovider te veranderen, wilt u vanaf het begin de juiste gebruiken. Als uw toepassing realtime analyses of output vereist op basis van tijdgestempelde data, is een tijdreeksdatabase waarschijnlijk geschikt voor u. Of u nu een tijdreeksdatabase, big data-analytics of traditionele database-engines gebruikt, Pure Storage heeft de opslagoplossing om uw real-time, high-volume applicaties te ondersteunen.