Buenas prácticas de Proxmox VE: checklist de estabilidad y seguridad

En operaciones reales, los sistemas suelen fallar más por procesos y hábitos que por falta de funciones. Este checklist te ayuda a operar con menos incidentes.

Prácticas recomendadas

1) Backup con simulacros de restauración

Tener backup no garantiza que puedas restaurar. Prueba restauraciones periódicamente y valida arranque y salud del servicio.

2) Snapshot antes de cambios mayores

Antes de actualizar paquetes, red o hardware:

qm snapshot 100 before-maintenance

3) Estrategia de updates y suscripción

Define orden de actualización por entorno y evita añadir repos de terceros sin control.

pvesubscription get

4) Segmentación de red y mínima exposición

Separa tráfico de gestión, storage y negocio siempre que sea posible.

5) Acceso por roles y firewall base

No compartas una sola cuenta root; usa cuentas por rol, 2FA y puertos mínimos.

Errores comunes

Error 1: RAID hardware encima de ZFS/Ceph

ZFS/Ceph necesitan control directo de disco.

Error 2: esperar HA con un solo nodo

HA requiere varios nodos con capacidad de takeover.

Error 3: borrar imagen base de linked clone

Los linked clones dependen del disco padre.

Error 4: no monitorear capacidad

Si local-lvm o backup se llenan, fallan escrituras y jobs.

Error 5: contraseñas débiles y permisos excesivos

Si expones interfaz de gestión, esto es una puerta abierta.

Seguir este checklist no elimina todos los fallos, pero reduce muchos desvíos evitables.