Snapshots y Recovery Points en Nutanix

Los snapshots y los Recovery points son dos conceptos importantes relacionados con la protección de datos y la recuperación ante desastres, los dos están relacionados, pero tienen propósitos y características algo diferentes.

Este tema viene por una conversación con los compañeros de equipo, (a los que mando un gran saludo), así que voy a intentar explicarlo de la mejor manera posible:

Snapshots en Nutanix

Un snapshot es una captura puntual o «fotografía» del estado de una VM o de sus datos en un momento específico. En Nutanix como en otras soluciones, los snapshots son una herramienta fundamental, son eficientes, de bajo impacto y no te llegan a congelar la VM como en otras soluciones que si suele pasar ;P.

Snapshot desde Prism Elements

Snapshots y Recovery Points en Nutanix 1

Características clave:

– Un snapshot es una captura consistente de los datos de la VM en el momento en que se hace. Esto incluye el disco virtual, pero no necesariamente la memoria activa.

 

Snapshots y Recovery Points en Nutanix 2

– Nutanix usa una técnica llamada Copy-on-Write, lo que significa que, cuando se hace un snapshot, no se copian todos los datos de inmediato, solo los cambios que se realizan después de que se crea el snapshot, se marcan y se guardan de forma diferencial, esto hace que se reduzca el impacto en el almacenamiento y la sobrecarga en el sistema.

 Los snapshots se usan principalmente para:
– Tareas de recuperación rápida, por ejemplo la recuperación de archivos individuales o la reversión de la VM al estado de cuando se hizo el snapshot.

– Respaldos incrementales o integraciones con herramientas de backup externas como Veeam Backup, Cohesity etc etc.
– Pruebas y desarrollo, es una practica muy común hacer snapshots para entornos de prueba y desarrollo, auqne también para VMs de producción.

Como se administran:
– Los snapshots en Nutanix se administran a través de la consola Prism Element, y puedes programarlos con políticas para tareas de protección de datos.

Limitaciones:
– Como siempre se ha dicho, los snapshots no son backups por lo que si no están replicados o enviados a una segunda ubicación o site, en caso de caída de la infra local o cluster, pierdes todo.

 

Recovery Points

Un recovery point es un término más amplio que suele referirse al estado alcanzable al que puedes recuperar los datos después de algún fallo. En Nutanix, los recovery points pueden generarse mediante snapshots o replicación entre clústeres, estos son una parte importante para los planes de replicación y recuperación ante desastres.

Recovery Point desde Prism Central

Snapshots y Recovery Points en Nutanix 3

Características clave:

Relación con snapshots:

– Generalmente, un recovery point se basa en snapshots configurados como parte de las políticas de la protección de datos. Sin embargo, se puede abarcar más componentes, dependiendo del método de replicación utilizado (local o remoto).

Replicación y disaster recovery:
– Los recovery points se utilizan especialmente en escenarios de recuperación ante desastres, en los cuales los datos de un clúster de Nutanix se replican en otro clúster (en una ubicación secundaria o en la nube). Esto asegura que en caso de fallo del sitio principal, se puedam recuperar los datos hasta el último recovery point disponible. Los Recovery points se hacen desde Prism Central.

Snapshots y Recovery Points en Nutanix 4

Objetivo de tiempo de recuperación (RTO):
– Los recovery points permiten administrar el impacto del RTO (la velocidad con la que necesitas restaurar los servicios) y el RPO (Recovery Point Objective, el intervalo entre puntos de recuperación). Cuanto menor sea el RPO, mayor frecuencia de snapshots o replicaciones.

Uso típico:
Los recovery points se utilizan principalmente para:
– Proteger las aplicaciones y datos críticos contra fallos mas globales, como por ejemplo la caída de un site.
– Implementar la recuperación automática en otro site.
– Garantizar la disponibilidad de los datos en escenarios multiclúster.

Opciones avanzadas:
– Los recovery points pueden ser locales (basados en snapshots) o remotos (Replicados). También admite configuraciones con Nutanix Disaster Recovery, la solución de desastre y recuperación como servicio.

 

Resumiendo
– Snapshots: son perfectos para capturar y proteger un estado puntual y local en el mismo clúster. Yo personalmente los prefiero para cambios rápidos, ya que no me interesa que se repliquen y ocupen mas espacio en otro cluster.
– Recovery Points: es la forma mas efectiva de recuperar datos en caso de desastre, sobre todo en infraestructuras que abarcan replicación remota o recuperación total del sistema.

Saludos y espero que os sirva