Skip to Content

¿Qué es un ingeniero de confiabilidad del sitio?

Un ingeniero de confiabilidad del sitio (SRE) puede ayudar a permitir el éxito de DevOps, ofrecer una mayor visibilidad del estado de los servicios de misión crítica, mejorar los tiempos de respuesta a incidentes y garantizar una alta disponibilidad de todas las aplicaciones. En este artículo, exploraremos qué es un SRE y cómo pueden ayudar a su organización a mejorar la calidad y confiabilidad general de su ciclo de vida de desarrollo de software (SDLC). 

¿Qué es un ingeniero de confiabilidad del sitio?

Un ingeniero de confiabilidad del sitio es responsable del monitoreo, la automatización y la confiabilidad de las operaciones de TI. Utilizan herramientas de desarrollo de software para automatizar las tareas de operaciones de TI, como la administración de cambios, la respuesta a incidentes y la administración del sistema de producción. También son responsables de monitorear el estado de las implementaciones de software y transmitir los registros y datos a los desarrolladores. 

¿Por qué SRE? 

Las iniciales SRE pueden referirse a un ingeniero de confiabilidad del sitio o a la práctica de la ingeniería de confiabilidad del sitio. El propósito de la práctica de SRE es asegurarse de que los servicios y las aplicaciones de una organización estén siempre disponibles, incluso a través de actualizaciones frecuentes realizadas por el equipo de desarrollo. 

El rol de SRE depende en gran medida de herramientas de software y automatización que pueden simplificar las tareas diarias, como el monitoreo de aplicaciones o la administración de sistemas. Cuando los desarrolladores actualizan una aplicación, sus cambios a veces pueden afectar negativamente a la aplicación y disminuir su rendimiento o incluso hacer que se bloquee. Los SRE están allí para estar atentos a estos posibles problemas y asegurarse de que los errores en el código de software o la implementación no afecten la capacidad de la organización para atender satisfactoriamente a sus clientes. 

Una gran parte de las responsabilidades de un SRE es servir como amortiguador y facilitador entre el desarrollo y las operaciones de TI. Los desarrolladores quieren actualizar su software de forma rápida y frecuente, pero los equipos de operaciones quieren moverse un poco más lento para asegurarse de que las actualizaciones no causen problemas. 

Debido a esta necesidad de mantener el mejor equilibrio entre el desarrollo y las operaciones, los SRE deben combinar varios trabajos, incluida la ingeniería de software, las operaciones y la administración de infraestructura, en uno solo. Por lo general, también son muy expertos en crear y administrar redes y sistemas en general, y saben cómo predecir y prevenir costosos tiempos de inactividad e interrupciones del sistema. 

¿Qué hacen los ingenieros de confiabilidad del sitio?

Los SRE trabajan para mantener la disponibilidad, el rendimiento y la confiabilidad de la infraestructura de TI de una organización. Esto incluye el diseño, la implementación y el monitoreo general de los sistemas para mantenerlos en funcionamiento con la máxima eficiencia y siempre poder ofrecer el tipo de experiencias intuitivas y receptivas que los usuarios finales desean.  

Al aprovechar las herramientas de software, los SRE pueden automatizar y optimizar muchas tareas operativas cruciales, como el análisis de registros, la revisión y actualización de aplicaciones y sistemas, la prueba de entornos de producción, etc. También administran de cerca todos los sistemas, detectan y resuelven cualquier problema que surja, y realizan análisis post mortem después de un incidente para analizar lo que sucedió y cómo se puede prevenir en el futuro.  

Otras responsabilidades incluyen: 

  • Consultar con los desarrolladores para garantizar que la confiabilidad esté diseñada e incorporada en cada aplicación.
  • Trabajar con operaciones para ver que las aplicaciones nuevas y actualizadas tengan suficiente soporte de la infraestructura de TI existente.
  • Previsión y planificación para las necesidades de capacidad, así como el rendimiento y la adaptación del sistema
  • Establecer métricas clave como indicadores de nivel de servicio (SLI) y objetivos de nivel de servicio (SLO) para medir el progreso y el éxito a lo largo del tiempo.
  • Mejorar el ciclo de vida del desarrollo de software, especialmente después de incidentes
  • Ayudar a los equipos de desarrollo mediante la escalabilidad del sistema, la implementación de la automatización y la creación de nuevas funciones.
  • Responder y resolver problemas de escalamiento de asistencia

¿SRE es lo mismo que DevOps ?

SRE no es lo mismo que DevOps, pero hay algunas similitudes en los objetivos de cada equipo. Tanto los SRE como los DevOps desean que el desarrollo y las operaciones funcionen de manera más cercana y eficaz. Tanto los SRE como los DevOps favorecen en gran medida la automatización y la optimización del sistema. 

Si bien las prácticas tradicionales de DevOps han llevado a una mejor colaboración general y ciclos de desarrollo de software más rápidos, por lo general, DevOps no ha tenido a nadie en su equipo que sea específicamente responsable de impulsar el desarrollo que mejore o aumente el rendimiento y la confiabilidad del sitio. Aquí es donde brilla el SRE. El único propósito de un SRE es ofrecer (o mantener) confiabilidad y escalabilidad en todo el sistema. 

Cuando DevOps se enfoca en la velocidad y agilidad, los SRE se enfocan en administrar la infraestructura y mantenerla disponible y de alto rendimiento. DevOps es más bien un enfoque cultural en una organización, pero un SRE emplea habilidades altamente especializadas para respaldar DevOps y, al mismo tiempo, garantizar operaciones pico. 

Incluso dentro de la cultura de DevOps, los SRE sirven como puente entre las operaciones de TI y el desarrollo. A menudo actúan como garantía de calidad, pero es un control de calidad proactivo. Los SRE suelen ser un factor crítico que permite que DevOps tenga éxito al ayudar a definir el equilibrio ideal entre la estabilidad del sistema y la velocidad de desarrollo. 

¿Qué habilidades necesita un SRE?

Debido a que los SRE forman el puente entre las operaciones de TI y los desarrolladores, necesitan una gran variedad de habilidades. Muchos de los SRE actuales son ex administradores de sistemas que saben cómo codificar o ex desarrolladores de software con experiencia en el lado de las operaciones. 

Los SRE necesitan saber cómo diseñar y construir sistemas de TI escalables y resilientes. Necesitan comprender una variedad de plataformas de computación en la nube. También necesitan saber cómo configurar protocolos de red y administrar bases de datos. Y lo que es más importante, necesitan excelentes habilidades de resolución de problemas y comunicación. 

Otras habilidades valiosas pueden incluir: 

  • Comprensión profunda de la infraestructura de TI, tanto en la nube como en las instalaciones 
  • Experiencia en tecnología y organización de contenedores
  • Capacidad para entablar relaciones estratégicas con socios, proveedores y colegas de todas las unidades de negocio.
  • Experiencia en lenguajes de codificación, herramientas de monitoreo y control de versiones, bases de datos y sistemas operativos.
  • Administración y mantenimiento de la infraestructura del sitio web
  • Familiaridad con la integración continua/desarrollo continuo (CI/CD )
  • Experiencia con sistemas informáticos distribuidos

¿Los SRE están en demanda?

La respuesta a esta pregunta es un rotundo sí. Los SRE tienen más demanda que nunca, y ese impulso no muestra señales de desaceleración. Los analistas de la industria de Gartner han estimado que para el 2027, el 75 % de las empresas usarán las prácticas de SRE en toda la organización para optimizar las operaciones. Ese porcentaje es un gran salto de solo el 10 % de las empresas que estaban utilizando prácticas de SRE en 2022. 

A medida que las organizaciones mueven cada vez más sus aplicaciones y servicios en línea, los clientes siguen esperando un acceso sin problemas a los servicios sin tiempo de inactividad ni retraso. Los SRE son una parte fundamental para cumplir con esas expectativas, especialmente en las industrias en las que el tiempo de inactividad puede causar repercusiones graves, como la tecnología, la atención de la salud y las finanzas. 

Las grandes organizaciones globales necesitan ingenieros con habilidades de SRE para garantizar la confiabilidad de sus servicios y aplicaciones. Si bien la función tiene muchos requisitos técnicos, la trayectoria profesional de SRE es abierta y puede llevar a funciones de gestión y liderazgo adicionales.

08/2024
Telecom Solutions from Pure Storage
The largest telcos rely on Pure Storage® for mission-critical data services and minimal energy footprint, with innovative technology across all clouds.
Resumen de la solución
2 páginas
CONTÁCTENOS
¿Preguntas, comentarios?

¿Tiene alguna pregunta o comentario sobre los productos o las certificaciones de Pure?  Estamos aquí para ayudar.

Programe una demostración

Programe una demostración en vivo y compruebe usted mismo cómo Pure puede ayudarlo a transformar sus datos en potentes resultados. 

Llámenos: 800-976-6494

Medios de comunicación: pr@purestorage.com

 

Pure Storage, Inc.

2555 Augustine Dr.

Santa Clara, CA 95054

800-379-7873 (información general)

info@purestorage.com

CERRAR
¡Su navegador ya no es compatible!

Los navegadores más antiguos a menudo representan riesgos de seguridad. Para brindar la mejor experiencia posible al utilizar nuestro sitio, actualice a cualquiera de estos navegadores más recientes.