Cloud Bigtable

Cloud Bigtable

Introducción a Cloud Bigtable

Resumen de la sección: En esta sección, se introduce Cloud Bigtable como una base de datos NoSQL administrada a escala de petabytes con baja latencia. Se menciona que es utilizada por servicios centrales de Google como Búsqueda, Analytics, Maps y Gmail. También se destaca su capacidad para aplicaciones operativas y analíticas, así como su integración con herramientas populares de macrodatos.

Cloud Bigtable: Una base de datos escalable

  • Cloud Bigtable es una base de datos NoSQL completamente administrada a escala de petabytes.
  • Ofrece baja latencia y puede ajustarse a patrones de acceso específicos.
  • Es utilizado por servicios centrales de Google como Búsqueda, Analytics, Maps y Gmail.
  • Es una excelente opción para aplicaciones operativas y analíticas, incluyendo IoT, estadísticas de usuarios y análisis financiero.
  • Se integra fácilmente con herramientas populares de macrodatos como Hadoop, Cloud Dataflow y Cloud Dataproc.
  • Es compatible con la API de HBase.

Estructura y funcionamiento

  • Los datos en Cloud Bigtable se almacenan en tablas escalables compuestas por mapas clave-valor ordenados.
  • Cada tabla contiene filas que describen entidades individuales y columnas que contienen valores para cada fila.
  • Las filas se indexan según una clave única y las columnas relacionadas se agrupan en familias de columnas.
  • Cada columna tiene un calificador único dentro de su familia.
  • Las celdas pueden contener múltiples versiones en distintos momentos del tiempo.

Arquitectura general

  • La arquitectura de Cloud Bigtable se compone de servidores y nodos de frontend para el procesamiento, separados del almacenamiento.
  • Las tablas se fragmentan en bloques de filas contiguas llamados tablets, que permiten balancear la carga de trabajo.
  • Las tablets se almacenan en Colossus, el sistema de archivos de Google, en formato SSTable.

Escalabilidad y rendimiento

  • Cloud Bigtable aprende a ajustarse a patrones de acceso específicos para distribuir la carga uniformemente entre los nodos.
  • La capacidad escala linealmente con hasta cientos de nodos, lo que proporciona un rendimiento escalable.
  • Es adecuado para almacenar más de 1 terabyte de datos estructurados con baja latencia y coherencia sólida.

Consideraciones finales

Resumen de la sección: En esta sección final, se menciona que si no se requiere una gran cantidad de datos estructurados o una baja latencia con coherencia sólida, es recomendable considerar el uso de Cloud Firestore. También se destaca que el clúster más pequeño en Cloud Bigtable consta de tres nodos y admite 30,000 operaciones por segundo.

Consideraciones finales

  • Si no se requiere una gran cantidad de datos estructurados o baja latencia con coherencia sólida, es recomendable considerar el uso de Cloud Firestore.
  • El clúster más pequeño en Cloud Bigtable consta de tres nodos y admite 30,000 operaciones por segundo.