Base de datos #19

Cassandra

2008 · Distribuida y tolerante a fallos

Cassandra nació en Facebook para manejar enormes volúmenes de datos distribuidos. Su modelo de columnas anchas y su arquitectura sin punto único de fallo la hicieron ideal para sistemas globales con alta disponibilidad.

Tipo: columnas anchas Uso: distribuido Entorno: global
Ficha técnica

Datos esenciales

Cassandra apareció en 2008 como base NoSQL distribuida. Se destaca por su escalabilidad horizontal y tolerancia a fallos.

Columnas anchas Distribuida NoSQL
Historia

Origen y evolución

Creada en Facebook para la mensajería interna, Cassandra combinó ideas de Dynamo y Bigtable. Más tarde pasó a Apache y ganó comunidad global.

Modelo de datos

Columnas y particiones

Su modelo de columnas anchas permite organizar datos por particiones, optimizando consultas por clave y escalado masivo.

Casos de uso

Escala global

Se usa en telecomunicaciones, IoT, redes sociales y comercio electrónico para manejar millones de eventos distribuidos.

Sintaxis y consultas

CQL

Su Cassandra Query Language (CQL) ofrece sintaxis similar a SQL pero optimizada para consultas por partición.

Arquitectura

Sin punto único

La arquitectura peer-to-peer elimina puntos únicos de fallo, permitiendo replicación en múltiples nodos y centros de datos.

Fortalezas

Alta disponibilidad

Su mayor fortaleza es la disponibilidad continua incluso ante fallos de nodos, ideal para sistemas críticos 24/7.

Limitaciones

Consultas complejas

No es adecuada para consultas ad hoc complejas o joins, lo que obliga a diseñar datos en función de las consultas.

Legado

Impacto histórico

Cassandra consolidó el concepto de escalabilidad horizontal en bases NoSQL y se convirtió en referencia para arquitecturas globales.

Lenguajes y herramientas

Ecosistema distribuido

Cuenta con drivers para muchos lenguajes, herramientas de monitoreo y soporte en plataformas cloud con servicios administrados.

Administración

Operación en clusters

Requiere monitoreo constante de nodos, replicación y balanceo. La administración es más compleja que en motores tradicionales.

Comparativa

Frente a MongoDB

Cassandra prioriza disponibilidad y escalado lineal, mientras MongoDB ofrece consultas más flexibles y documentos.

Vigencia

Presencia actual

Sigue siendo popular en sistemas globales y de IoT, con soporte en servicios gestionados y comunidad activa.

Ecosistema

Apache y cloud

Su ecosistema incluye proyectos Apache y soluciones en la nube que facilitan despliegues a gran escala.

Impacto en la industria

Escala planetaria

Cassandra demostró que era posible operar bases de datos distribuidas globalmente sin sacrificar disponibilidad.

Lecciones

Diseño para fallos

Su historia enseña que los sistemas modernos deben asumir fallos constantes y estar diseñados para tolerarlos.

Cassandra redefinió la escalabilidad y la tolerancia a fallos en bases NoSQL, haciendo posible operar a escala global.