Nutanix Disaster Recovery

Binnen een Nutanix Cluster kunnen verschillende oplossingen worden toegepast voor het verhogen van de beschikbaarheid van de virtuele machines en daarop aanwezige applicaties. Met name voor applicaties die hiervoor zelf geen voorzieningen hebben zijn deze oplossingen ontwikkeld om de beschikbaarheid er van te verhogen. Afhankelijk van de beschikbaarheidseisen (RPO/RTO) voor deze applicaties kunnen deze hiermee ingevuld worden. De verschillende oplossingen maken allen gebruik van het snapshot mechanisme wat binnen het Nutanix Enterprise Cloud platform aanwezig is.

Recovery Point Objective (RPO) is de hoeveelheid data die tijdens een gepland of ongepland event verloren mag gaan. Recovery Time Objective (RTO) is de benodigde tijd om het gepland of ongeplande event te herstellen en de applicatie weer beschikbaar te hebben. Afhankelijk van de hieraan gestelde eisen en/of wensen kan er een oplossing worden gekozen.

Time Stream

Een Nutanix Enterprise Cloud oplossing is op zichzelf al een redundante oplossing en ondervangt daarmee mogelijke problemen door automatisch data herstel. Data wordt minimaal twee keer binnen het cluster opgeslagen en indien gewenst kan dit zelfs drie maal worden opgeslagen zodat er nog meer beschikbaarheid ontstaat. Direct na een verstoring gaat het cluster direct aan de slag om aan deze ingestelde voorwaarden te voldoen, waardoor na het herstellen van de data beschikbaarheid een nieuwe verstoring kan worden opgevangen. Hiervoor dienen wel voldoende nodes binnen het cluster beschikbaar te zijn om dit op te vangen. Deze oplossing is standaard binnen het platform aanwezig. Voorbeelden waartegen Time Stream beschermt zijn het uitvallen van disken binnen nodes en/of het uitvallen van volledige nodes. Met het toevoegen van Block Awareness en Rack Awareness kan er zelfs voor gezorgd worden dat data altijd verspreid wordt opgeslagen over verschillende blocken of verschillende fysieke racks.

Cloud Connect

Door het Nutanix Enterprise Cloud platform te koppelen aan een Cloud gebaseerde oplossing, kan deze als replicatie partner worden gebruikt en worden de virtuele machines hier naar toe gerepliceerd. Het herstellen (RTO) is hierin echter wel hoger doordat er een afhankelijkheid is van de internet verbinding richting deze cloud provider.

Remote Replicatie

Voor andere verstoringen en voor virtuele machines waar de aanwezige data belangrijker is kan replicatie binnen het cluster of binnen meerdere clusters worden toegepast. Ook cloud connect is hierin een vorm.

Er kunnen meerdere replicatietechnologieën worden toegepast om dit te realiseren. Een op een of een op meerdere doellocaties kunnen de gestelde eisen hieraan invullen. Hierbij worden zogenaamde protectie domains ingesteld, waarbij een protectie domain bestaat uit een of meerdere virtuele machines, een volume group of een storage container. Meerdere niveaus zijn mogelijk om het beheer ervan te vereenvoudigen. Aan de andere kant wordt vervolgens een remote site geconfigureerd welke als doelomgeving wordt ingesteld. Deze doellocaties worden gebruikt als data replicatie doel (bij gebruik van asynchrone replicatie) of als standby storage container (bij gebruik van Metro Availability = synchrone replicatie).

De configuratie voor zowel de asynchrone replicatie als de Metro Availibitly (synchrone replicatie) wordt vanuit Prism uitgevoerd. Hier worden de protectie domains van zowel de lokale locatie als de remote locatie geconfigureerd.

Topologie

Meerdere topologie kunnen worden toegepast afhankelijk van de requirements die er worden gesteld aan de beschikbaarheid van de virtuele machines.

Twee weg Replicatie

Bij deze vorm van replicatie worden de aanwezige protectie domains gerepliceerd naar de andere locatie. Virtuele machines kunnen aanwezig zijn op een van deze locaties waarbij de andere locatie als doel replicatie domain wordt ingesteld.

Virtuele machines zijn in principe actief op een enkele locatie en alleen bij een gepland of ongepland event wordt er geschakeld van locatie. Handmatige acties zijn hierbij benodigd, wat in principe geldt voor alle gerepliceerde oplossingen, met uitzondering van de Metro Availibility.

Een naar meerdere

Van een naar meerdere locaties wordt toegepast indien er bijvoorbeeld een hoofdlocatie wordt gebruikt met een aantal andere locaties waarbij de hoofdlocatie als uitwijk omgeving wordt gebruikt. Denk hierbij aan een applicatie die actief is op locatie 1 en waarbij site 2 en 3 als backup locatie wordt gebruikt. Bij het uitvallen van locatie 1 kan de applicatie actief blijven op een van de overige locaties.

 Meerdere naar een

Bij meerdere naar een wordt een zogenaamde hub spoke architectuur toegepast, waarbij applicaties op zowel locatie 1 als 2 actief zijn en worden gerepliceerd naar de gecentraliseerde derde locatie. Het centraliseren van de replicatie target verbetert het operationeel beheer bij geografisch gescheiden locaties. Een mogelijke use-case voor deze configuratie is de Remote and branch offices (ROBO).

Many-to-many

Bij deze replicatie vorm wordt de grootst mogelijke controle en flexibiliteit verkregen en kunnen applicaties verschillende kanten op repliceren om de beschikbaarheid ervan te verhogen.

Asynchrone Replicatie

Bij het gebruik van asynchrone replicatie worden de virtuele machines op vooraf ingestelde tijden gerepliceerd naar een doellocatie. Deze doellocatie kan binnen het eigen cluster zijn of naar een cluster wat binnen hetzelfde data center of buiten hetzelfde data center is geplaatst. Het doel hiervan is om na een verstoring de data snel te kunnen herstellen, zodat de verstoring minimaal is (RTO). Doordat de replicatie op gezette tijden is (granulair vanaf enkele minuten tot een uur) kan er dataverlies ontstaan, en kan er alleen terug worden gekeerd naar het punt van de laatste replicatie (RPO).

Met het gebruik van Near-Sync replicatie is deze tijd te verkorten tot enkele minuten, maar blijft er altijd data verlies aanwezig door de gemaakte keuze. Near-Sync kan ingesteld worden tussen de 1 en 15 minuten replicatie tijd. Corruptie van data kan worden ondervangen door een kopie van de data terug te plaatsen op het moment dat het zich voortdoet, meerdere snapshots worden bewaard hiervoor.

Synchrone replicatie

Bij het gebruik van synchrone replicatie wordt de data direct nadat deze door de virtuele machine wordt weggeschreven, ook gerepliceert naar het doel protectie domain. Op het moment dat deze data is veilig gesteld wordt er pas een bevestiging gestuurd richting de virtuele machine dat de data is weggeschreven. Hiermee wordt er voor gezorgd dat de data altijd veilig is weggeschreven en dat de RPO is geminimaliseerd. Hier worden wel enkele voorwaarden aan het tussenliggende netwerk gesteld, welke geen hoge latency mag hebben omdat anders de werking van de applicatie binnen de virtuele machine wordt verstoord. Met het toepassen van asynchrone replicatie binnen hetzelfde gebouw is het hiermee mogelijk data op verschillende locaties te plaatsen en deze veilig te stellen. Bij synchrone replicatie worden de eventuele corrupte bestanden die worden weggeschreven ook direct gerepliceerd.

Metro Availability

Bij synchrone replicatie kan ook een Metro Availability worden gecreëerd, hierbij worden twee fysieke Nutanix Enterprise Cloud Clusters gekoppeld als replicatie partner en kunnen de virtuele machines op beide clusters actief zijn. Mocht er hierbij een verstoring op een van de clusters ontstaan, dan worden de hiermee beschermde virtuele machines automatisch op het andere cluster actief gemaakt. Dit wordt gedaan door het automatisch promoten van het protection domain op het overgebleven cluster. Het gebruik van vSphere is hiervoor randvoorwaardelijk en vSphere HA verzorgd dan ook de automatische fail over naar het andere protectie domain. De Nutanix nodes dienen hierbij in een enkel cluster te worden geplaatst om dit te realiseren. Voor AHV staat deze functionaliteit op de roadmap en wordt ergens dit jaar verwacht.

Het gebruik van een witness is hierin noodzakelijk voor o.a. het voorkomen van split brain situaties waarbij netwerk verbindingen zijn verdwenen maar de virtuele machine nog gewoon actief is. De witness is een virtual appliance die op een derde locatie moet worden geplaatst en zo kan optreden als begeleider van het Metro Availability cluster. Voor deze derde locatie kan een bestaand of nieuw AHV cluster of vSphere installatie gebruikt worden.

Licenties

Voor het gebruiken van de verschillende toepassingen is een bepaald licentieniveau benodigd. Deze licenties geven naast deze business continuity functionaliteit ook nog andere functionaliteit, welke  voor dit artikel buiten beschouwing worden gelaten, het volledige overzicht is terug te vinden via de volgende URL: Acropolis Software Editions

Functie Starter Pro Ultimate
Disaster Recovery with Async Replication (1hr or larger RPO) X X X
Application Consistent Snapshots X X X
Local Snapshots X X X
Cloud Connect   X X
Multiple Site DR (many to many)     X
Metro Availability      X
Disaster Recovery with NearSync or Sync Replication (1min-1hr RPO or 0 RPO)     X

Conclusie

Conclusie

Het verhogen van de beschikbaarheid van applicaties op een Nutanix Enterprise Cloud platform kan op verschillende manieren worden gedaan. Afhankelijk van de RPO en RTO zijn er invullingen die hieraan voldoen. Aan deze beschikbaarheidseisen zitten echter ook kosten verbonden die gelijk oplopen met de gewenste beschikbaarheid. Standaard is een Nutanix Enterprise Cloud oplossing voorzien van een aantal features die de beschikbaarheid voor veel klanten al voldoende borgen en ook zijn er veel database- of mailoplossingen die hier zelf zorg in dragen. Maar met name de applicatie die hierin niet voorzien profiteren van deze oplossingen en kunnen ondanks het ontbreken van de interne functionaliteit van de applicatie toch verhoogd beschikbaar gemaakt worden.

Meer informatie

Voor meer informatie en/of hulp bij het kiezen van een passende oplossing/strategie binnen je organisatie kun je contact met ons om nemen door hier te klikken. Voor het verkrijgen van meer informatie over de mogelijkheden voor jouw organisatie om de beschikbaarheid van de applicaties te verhogen, laat dan jouw gegevens achter via het contact formulier en wij nemen zo snel mogelijk contact met je op. Via mail kan natuurlijk ook, kies dan voor info@flexvirtual.nl.