Una base de datos de series temporales proporciona aplicaciones en tiempo real con conjuntos de registros basados en un marco temporal. Si bien todas las bases de datos permiten almacenar datos con una marca de tiempo, una base de datos de serie temporal está optimizada para conjuntos de registros en los que los datos cuentan una historia en orden cronológico. La duración de un conjunto de datos puede ser de unos pocos milisegundos entre sí, o una base de datos de series temporales puede usarse para puntos de datos por hora, diarios, mensuales o anuales.
¿Qué es una base de datos de serie temporal?
Cada motor de base de datos permite que los desarrolladores almacenen una marca de tiempo en un registro, pero una base de datos de serie temporal (TSDB) se ha diseñado específicamente para los conjuntos de registros centrados en un marco temporal. Por ejemplo, es posible que necesite actualizaciones minuto a minuto en una aplicación meteorológica. Una base de datos de series temporales puede almacenar datos por minuto para mostrarlos a los usuarios. Una TSDB puede ser una opción en lugar de las bases de datos NoSQL estándar, como MongoDB, cuando se necesitan consultas más refinadas basadas en el tiempo.
Debido a que una TSDB se utiliza principalmente para recuperar datos, estas bases de datos suelen estar optimizadas para las lecturas y la creación de nuevos registros. Debido a que las TSDB rara vez actualizan los registros, se han creado para recuperar mejor los registros basándose en una marca de tiempo en comparación con otras bases de datos comunes. Los TSDB también son mejores para las aplicaciones en tiempo real en las que los usuarios reciben un conjunto lineal de información basado en la marca de tiempo de cada registro.
¿Cómo funciona una base de datos de serie temporal?
La mejor manera de entender cómo funciona una base de datos de series temporales es usar un ejemplo. Supongamos que tiene sensores en una máquina que depende de la temperatura. Las temperaturas cambian minuto a minuto, por lo que se puede usar una base de datos de series temporales para realizar un seguimiento de la temperatura y la marca de tiempo. Se pueden registrar otras propiedades de la máquina, incluida la ubicación de la máquina, la humedad y la temperatura ambiente.
A medida que la máquina funciona, los sensores almacenan los datos en un TSDB. La TSDB almacena cada registro para que los sensores recojan información. No tendría que actualizar los registros, pero tendría que recuperarlos para supervisar el sistema. El motor de almacenamiento TSDB funciona optimizando las consultas para grandes conjuntos de datos y recuperando datos basándose en marcas de tiempo récord. Los flujos de datos con sello de hora se envían a los analistas para supervisar la maquinaria y tomar decisiones de mantenimiento.
Ventajas de usar una base de datos de series temporales
Un motor TSDB se ha creado para almacenar grandes volúmenes de datos y proporcionar grandes conjuntos de registros. Las aplicaciones en tiempo real se benefician del motor optimizado de un TSDB para la recuperación de datos cada segundo o minuto. Las soluciones de supervisión que requieren predicciones de grandes volúmenes de datos o información en tiempo real se benefician de la escala y la velocidad de una base de datos de series temporales.
Como los registros suelen contener un pequeño número de campos, las consultas se simplifican para los desarrolladores. Un TSDB puede devolver miles de registros, pero el conjunto de registros suele contener solo unos pocos campos. El número limitado de campos y las consultas simplificadas aceleran el rendimiento de las aplicaciones en tiempo real y reducen la sobrecarga en el servidor de bases de datos.
Casos de uso de las bases de datos de series temporales
Los sectores en los que el IoT es común o los puntos de datos grandes con marcas de tiempo son necesarios para las predicciones y la supervisión son ideales para una base de datos de series temporales. La fabricación y otros sectores en los que los sensores de IoT son críticos para el tiempo de actividad trabajan con bases de datos de series temporales para predecir los problemas antes de que interrumpan los servicios. Por ejemplo, un fabricante utiliza los datos del sensor del IoT para predecir cuándo la maquinaria necesita mantenimiento o podría sufrir pronto un fallo de hardware.
Las aplicaciones de red grandes pueden funcionar con bases de datos de series temporales para predecir interrupciones o identificar posibles amenazas. La infraestructura de red crítica podría soportar un gran proveedor de servicios de Internet o un centro de datos y los datos con sello de hora podrían alertar a un analista de seguridad de una posible interrupción cuando las temperaturas ambientales son demasiado altas o el hardware envía información dañada, lo que indica un posible tiempo de inactividad. Cualquier aplicación crítica en tiempo real funciona con una base de datos de series temporales para obtener rendimiento y escalabilidad. Por ejemplo, si el uso de la CPU del servidor aumenta con frecuencia, puede que sea el momento de actualizarla o sustituir una CPU para evitar tiempos de inactividad y fallos del sistema.
Soluciones populares de bases de datos de series temporales
Si no ha trabajado con una base de datos de series temporales, puede elegir entre varias opciones populares. Estas son algunas soluciones TSDB para sus aplicaciones:
- EntradaDB: Esta solución columnar es para consultas optimizadas en tiempo real y analíticas columnares.
- Prometheus: Este TSDB es ideal para los análisis de datos dimensionales y de visualización. Los desarrolladores de Prometheus proporcionan una herramienta de supervisión de código abierto y un motor de base de datos.
- Escala de tiempo: Esta popular TSDB se utiliza para IoT , sensores, criptocriptación y análisis de IA.
Conclusión
Como es difícil cambiar de proveedor de bases de datos, querrá usar el adecuado desde el principio. Si su aplicación requiere análisis o resultados en tiempo real basados en datos con marca de tiempo, una base de datos de series temporales probablemente sea adecuada para usted. Tanto si utiliza una base de datos de series temporales, análisis de macrodatos o motores de bases de datos tradicionales, Pure Storage tiene la solución de almacenamiento que admite sus aplicaciones en tiempo real de gran volumen.