Pérdida de la verdad del almacenamiento en sistemas de archivos virtuales distribuidos: una crítica formal de CAP y del almacenamiento centrado en la coordinación

Alexey A. Nekludoff

ORCID: 0009-0002-7724-5762

DOI: 10.5281/zenodo.18326236

21 enero 2026

Idioma original del artículo: Inglés

PDF
Canonical Version (Zenodo DOI):
Local Mirror (Astraverge.org):

Resumen

Los sistemas modernos de almacenamiento dependen cada vez más de la virtualización y de la coordinación distribuida para lograr escalabilidad y tolerancia a fallos. Aunque estos enfoques ofrecen flexibilidad operativa, también introducen modos de fallo no capturados por las métricas tradicionales de rendimiento o disponibilidad. Este artículo introduce el concepto de verdad del almacenamiento como una propiedad fundamental de los sistemas de almacenamiento, definida como la existencia autoritativa y la direccionabilidad de los datos independientemente de condiciones transitorias de acceso.

Mostramos que las arquitecturas de almacenamiento virtuales y centradas en la red transforman la verdad del almacenamiento de un hecho físico localizado en una propiedad derivada de un modelo, dependiente de una coordinación continua. Este cambio habilita un modo de fallo distinto, denominado pérdida de la verdad del almacenamiento, en el que los datos permanecen físicamente intactos pero se vuelven operativamente inaccesibles debido a la degradación de subsistemas auxiliares, en particular la coordinación de red.

Mediante un incidente de producción real que involucra Ceph Software-Defined Storage, el artículo demuestra cómo una degradación menor de la red puede escalar hasta una pérdida prolongada del servicio sin pérdida de datos. Se analiza Ceph como una realización estructuralmente fiel del razonamiento de estilo CAP aplicado al almacenamiento, ilustrando cómo incrustar el consenso en la corrección del almacenamiento amplifica fallos parciales hasta convertirlos en interrupciones a escala de todo el sistema.

El artículo examina críticamente los principios de diseño basados en CAP en sistemas de almacenamiento, mostrando que definir la corrección mediante coordinación en lugar de persistencia física subordina la verdad del almacenamiento al estado de la red. Se muestra que esta elección de diseño es catastrófica: fallos transitorios fuera del propio medio de almacenamiento pueden volver los datos operativamente inexistentes. Estos sistemas no fallan de manera gradual; fallan ontológicamente, como se demuestra en el incidente de producción analizado.

Por último, el artículo formula un principio alternativo de diseño de almacenamiento basado en la localidad de la verdad, la separación entre verdad y acceso, y el desalojo en lugar de la suspensión. Observaciones prácticas indican que arquitecturas que preservan la verdad, como ZFS combinado con iSCSI para el acceso distribuido, actualmente proporcionan una resiliencia operativa superior para el almacenamiento que sirve como sustrato para infraestructura virtualizada.

La implicación central de este análisis es que el razonamiento arquitectónico que trata los compromisos de estilo CAP como fundamentales refleja un nivel insuficiente de cualificación profesional para el diseño de sistemas de almacenamiento distribuido, donde la corrección se define por la preservación de la verdad en lugar de la simetría de coordinación.

Palabras clave: verdad del almacenamiento, almacenamiento virtual, sistemas de almacenamiento distribuido, almacenamiento centrado en la red, Ceph, teorema CAP, tolerancia a fallos, infraestructura virtualizada, arquitectura de almacenamiento, semántica de fallos.

La versión completa del artículo está disponible en: https://astraverge.org/en/p/10059 (en Inglés).