De gemiddelde tijd tussen storingen, of MTBF is de gemiddelde tijd tussen herstelbare storingen van een product of systeem. Het is een belangrijke maatstaf om de frequentie van systeemstoringen te bepalen en een overzicht te geven van de betrouwbaarheid van het systeem.
MTBF kan worden gebruikt om te bepalen hoe succesvol uw team is in het voorkomen of verminderen van potentiële incidenten. Hoe hoger de tijd tussen storingen, hoe betrouwbaarder het systeem is.
Wat meet MTBF? Betrouwbaarheid vs. beschikbaarheid
MTBF speelt een rol bij het volgen van zowel de betrouwbaarheid als de beschikbaarheid van een onderdeel of systeem.
Betrouwbaarheid is de waarschijnlijkheid dat een systeem of onderdeel gedurende een bepaalde periode zal presteren zoals ontworpen zonder defecten. MTBF is een basismaatstaf voor de betrouwbaarheid van een systeem: hoe hoger de MTBF, hoe hoger de betrouwbaarheid van het product. Door MTBF te gebruiken in combinatie met andere storingsgegevens en onderhoudsstrategieën is het gemakkelijker om storingen van bedrijfsmiddelen te voorspellen, aangezien teams beter kunnen bepalen hoe en wanneer preventieve maatregelen moeten worden genomen voordat een storing optreedt.
Beschikbaarheid is het vermogen van een systeem of onderdeel om te functioneren zoals ontworpen wanneer dat nodig is. MTBF gecombineerd met de gemiddelde hersteltijd (MTTR - mean time to restore) kan de waarschijnlijkheid bepalen dat een systeem binnen een bepaald tijdsbestek uitvalt. De beschikbaarheid van een systeem kan worden berekend door de MTBF te delen door de som van MTTR en MTBF.
Beschikbaarheid = MTBF / (MTBF + MTTR)
Hoe MTBF berekenen: Stapsgewijze formule
De MTBF wordt berekend door de totale operationele tijd voor een bepaalde periode te delen door het aantal storingen in diezelfde periode. Zo wordt het berekend:
Om de totale operationele tijd van een systeem te bepalen, moet u het systeem gedurende een bepaalde periode controleren.
- De totale operationele tijd is de totale tijd dat het systeem zonder storing heeft gewerkt.
- Het totale aantal storingen is het aantal keren dat het systeem binnen de gespecificeerde periode is uitgevallen.
Stel bijvoorbeeld dat een systeem in een tijdsbestek van 24 uur drie uur downtime ondervindt tijdens drie afzonderlijke incidenten.
- Totale uptime = (24 - 3) = 21 uur
- Totaal aantal incidenten = 3
- MTBF = totale uptime / aantal incidenten
- MTBF = 21/3 = 7 uur
Hoe MTBF berekenen uit storingspercentage
Zoals hierboven beschreven kan de MTBF worden berekend door de totale uptime te delen door het aantal geregistreerde storingen. Storingspercentage daarentegen is het omgekeerde van MTBF en wordt berekend door het aantal storingen te delen door de totale uptime.
De MTBF kan als volgt worden berekend uit het storingspercentage: MTBF = 1 / storingspercentage
Bijvoorbeeld:
- Storingspercentage = 25 storingen / 1.000 uur bedrijfstijd
- Storingspercentage = 0,025
- MTBF = 1 / 0,025
- MTBF = 40
Wat is een goede MTBF?
Aangezien de tijd tussen storingen voor een systeem of onderdeel kan afhangen van factoren zoals configuraties, bedrijfsomstandigheden, leeftijd en andere externe factoren, is er niet één "goede" MTBF-meting. De MTBF moet daarentegen worden berekend voor uw specifieke activa en zal nauwkeuriger worden naarmate u er meer data over verzamelt.
Wat betekent een hoge MTBF?
Hoewel er natuurlijk geen universeel aanvaarde MTBF-doelstelling is, geldt toch dat hoe hoger de MTBF, hoe beter. Een hoge MTBF geeft aan dat uw systeem of onderdeel zeer betrouwbaar is en minder problemen zal ondervinden tijdens de levensduur ervan - en minder incidenten leiden doorgaans tot minder stilstand en lagere kosten.
Wat betekent een lage MTBF?
Een lage MTBF betekent dat uw systeem waarschijnlijk vaker zal falen en dat de betrouwbaarheid van uw systeem moet worden herzien. Een goed plan voor preventief onderhoud en de toepassing van instrumenten om de MTBF en andere faalgegevens te controleren, kunnen de betrouwbaarheid van het systeem helpen verbeteren.
Voorbeelden voor MTBF-berekening
Laten we vervolgens enkele voorbeelden bekijken van lage, gemiddelde en hoge MTBF met betrekking tot een productiesysteem dat gedurende 30 dagen in bedrijf is.
Lage MTBF
Stel dat het systeem zes keer binnen 30 dagen (720 uur) uitvalt, telkens gedurende vier uur, voor een totale storingstijd van 24 uur.
- Totale uptime = (720 - 24) = 696 uur
- Totaal aantal incidenten = 6
- MTBF = totale uptime / aantal incidenten
- MTBF = 696 / 6 = 116 uur (ongeveer 5 dagen)
Een uitval om de vijf dagen wijst op een uiterst onbetrouwbaar systeem dat de bedrijfsvoering en de klanten vaak zal beïnvloeden.
Gemiddelde MTBF
Stel nu dat het systeem slechts twee keer binnen dezelfde 30 dagen (720 uur) uitvalt, telkens gedurende twee uur, voor een totale storingstijd van vier uur.
- Totale uptime = (720 - 4) = 716 uur
- Totaal aantal incidenten = 2
- MTBF = totale uptime / aantal incidenten
- MTBF = 716 / 2 = 358 uur (ongeveer 15 dagen)
Hoewel dit misschien geen extreem hoge MTBF is, kan één storing per 15 dagen aanvaardbaar zijn voor sommige zakelijke toepassingen.
Hoge MTBF
Overweeg tenslotte een systeem dat slechts eenmaal binnen 30 dagen (720 uur) voor twee uur uitvalt.
- Totale uptime = (720 - 2) = 718 uur
- Totaal aantal incidenten = 1
- MTBF = totale uptime / aantal incidenten
- MTBF = 718 / 1 = 718 uur (ongeveer 30 dagen)
In vergelijking met de andere hier beschreven scenario's kan één storing per 30 dagen worden beschouwd als een hoge MTBF, hetgeen erop wijst dat het systeem zeer betrouwbaar is.
Hoe MTBF berekenen: Drie scenario’s
MTBF is een nuttige betrouwbaarheidsmeter op verschillende gebieden van de technologie. Laten we eens kijken naar enkele scenario's voor cyberbeveiliging, incident response en DevOps.
Berekening van MTBF in cyberbeveiliging
Bij cyberbeveiliging kan de MTBF aangeven dat een systeem het einde van zijn levensduur nadert en dat het risico van een kritieke storing toeneemt.
Stel bijvoorbeeld dat een cyberbeveiligingssysteem gedurende 48 uur wordt geobserveerd. Gedurende die tijd is het systeem vijf keer uitgevallen voor een totale uitvaltijd van acht uur of een totale operationele tijd van 40 uur.
MTBF = 40 / 5 = 8 uur
De volgende maand wordt het systeem opnieuw gedurende 48 uur geobserveerd. Deze keer zijn er acht storingen voor een totale uitvaltijd van 12 uur of een totale operationele tijd van 36 uur. De MTBF van het systeem is nu 4,5 uur.
MTBF = 36 / 8 = 4,5 uur
Indien de MTBF tijdens latere waarnemingen blijft dalen, kan dit erop wijzen dat een onderdeel van het systeem of het gehele systeem zelf moet worden vervangen of versterkt.
MTBF berekenen in Incident Response
MTBF kan ook helpen bepalen hoe effectief uw incident response-team is in het minimaliseren en voorkomen van incidenten. Als de MTBF te laag is of een dalende trend vertoont, moet het team incidentgegevens analyseren om terugkerende storingen en trends te ontdekken.
MTBF berekenen in DevOps
MTBF in DevOps is een maat voor de storingsfrequentie van een functie of een enkel onderdeel, waarmee teams de betrouwbaarheid en beschikbaarheid van een dienst kunnen voorspellen. Op die manier kunnen zwakke punten in het ontwerp van een onderdeel of in het test- en onderhoudsproces aan het licht komen.
Door de MTBF te bewaken kunnen DevOps-teams inefficiënties en knelpunten die tot falen kunnen leiden ontdekken en elimineren door processen en systeeminfrastructuur te verbeteren. Naarmate de teams verbeteringen aanbrengen, neemt de MTBF toe, wat wijst op een betrouwbaarder systeem.
Neem bijvoorbeeld een voorbeeld waarbij het totale werk voor een code-integratiepijplijn over vijf dagen 100 uur bedroeg. Gedurende de week zijn er vier storingen.
- Totale bedrijfstijd = 100 uur
- Totaal aantal storingen = 4
- MTBF = totale bedrijfstijd / aantal storingen
- MTBF = 100 / 4 = 25 uur
Welke hulpmiddelen hebt u nodig om de MTBF te bewaken?
Met de juiste hulpmiddelen kunt u de MTBF en andere onderhoudsgegevens verbeteren. Deze hulpmiddelen omvatten hulpmiddelen voor infrastructuurbewaking, dienstenbewaking, visualisatiehulpmiddelen, hulpmiddelen voor de bewaking van de prestaties van toepassingen, platformoverschrijdende hulpmiddelen en hulpmiddelen voor data-aggregatie, en hulpmiddelen voor projectbeheer.
Al deze hulpmiddelen vereisen echter snelle, krachtige opslag die enorme hoeveelheden gegevens kan verwerken en toch maximale prestaties kan leveren. Met Pure Storage® FlashBlade® kunt u een robuuste, krachtige storageoplossing creëren ter ondersteuning van de geavanceerde monitoring- en observatietools die nodig zijn om uw MTBF-gegevens te verbeteren.
Wat is de volgende metriek na MTBF?
MTBF en mean time to failure (MTTF) worden beide gebruikt om de tijd te meten om de prestaties van een systeem of onderdeel te evalueren, maar de manier waarop ze worden toegepast is verschillend.
Kom meer te weten over MTTF.