Snowflake Overview - Architecture, Features & Key Concepts

Snowflake Overview - Architecture, Features & Key Concepts

Introdução ao Snowflake

O que é o Snowflake?

  • O Snowflake é definido como uma plataforma de dados baseada em nuvem, oferecida como uma solução conveniente de software como serviço (SaaS).
  • A natureza nativa da nuvem do Snowflake permite a integração com uma ampla gama de outros serviços em nuvem.
  • Embora frequentemente categorizado como um armazém de dados, suas capacidades vão além das funcionalidades tradicionais, posicionando-o como uma plataforma de dados sofisticada.

Funcionalidades e Estrutura

Armazenamento e Processamento de Dados

  • O Snowflake permite a configuração de um ambiente abrangente para armazenamento de diversos tipos de dados, incluindo estruturados e não estruturados, sem necessidade de definir esquemas previamente.
  • Suporta formatos populares como JSON, Avro, ORC, Parquet e XML, facilitando a execução interna de cargas de trabalho relacionadas à engenharia e ciência dos dados.

Integração e Eficiência

  • Com recursos como snowpipe, streams e tasks, o Snowflake possibilita carregamentos eficientes e transformações robustas em pipelines ETL e ELT.
  • A operação do Snowflake como SaaS elimina preocupações com planejamento da infraestrutura, armazenamento de dados ou otimizações técnicas.

Arquitetura do Snowflake

Tipos de Arquitetura

  • Existem duas principais arquiteturas para processamento paralelo: compartilhamento por disco (shared disk) e compartilhamento por nada (shared nothing).
  • Na arquitetura shared disk, múltiplos processadores compartilham os mesmos recursos; já na arquitetura shared nothing cada processador possui seus próprios recursos dedicados.

Abordagem Híbrida

  • O Snowflake adota uma abordagem híbrida que combina as vantagens das duas arquiteturas mencionadas.
  • A camada única do sistema inclui armazenamento em colunas otimizadas no cloud storage e serviços que gerenciam consultas SQL eficientemente.

Arquitetura do Snowflake

Conexão e Arquiteturas

  • O Snowflake é conectado através de uma rede de alta largura de banda, funcionando como uma única plataforma. Existem duas arquiteturas principais: a arquitetura de disco compartilhado e a arquitetura "shared nothing".
  • A arquitetura de disco compartilhado oferece recursos acoplados, facilitando a configuração e gestão, além de ser econômica. No entanto, não é tão escalável ou tolerante a falhas quanto a arquitetura "shared nothing".
  • Na arquitetura "shared nothing", o armazenamento e os processadores estão agrupados em cada máquina, o que impede a escalabilidade independente; se um componente precisar ser escalado, ambos devem ser aumentados.

Abordagem Híbrida do Snowflake

  • A arquitetura única do Snowflake adota uma abordagem híbrida chamada "multi-cluster shared data architecture", onde a camada de armazenamento de dados é desacoplada da camada de processamento.
  • O armazenamento pode escalar independentemente com base no tamanho dos dados hospedados na plataforma. É possível acessar e processar esses dados usando motores de processamento disponíveis em tamanhos variados conforme a carga de trabalho.

Estrutura da Arquitetura do Snowflake

  • Quando os dados são carregados no Snowflake, eles são reorganizados em um formato columnar otimizado proprietário e armazenados em serviços de nuvem como AWS S3 ou Azure Blob Storage.
  • O gerenciamento do armazenamento dos dados é totalmente responsabilidade do Snowflake, incluindo particionamento e compressão. Os objetos de dados não são acessíveis diretamente pelos clientes; o acesso ocorre apenas por meio das operações SQL.

Camadas Operacionais

  • Cada armazém virtual opera como um cluster computacional independente; assim, o desempenho de um armazém não é afetado pelas atividades dos outros.
  • A camada de serviços em nuvem atua como o cérebro do Snowflake, coordenando atividades desde o login até o despacho das consultas. Serviços críticos incluem gerenciamento da infraestrutura e controle de acesso.

Vantagens da Arquitetura Única

  • Essa arquitetura distinta confere ao Snowflake forças únicas que fazem dele uma escolha poderosa para diversas aplicações relacionadas a dados.
Video description

Introduction to Snowflake snowflake tutorial snowflake training snowflake overview snowflake architecture snowflake certification snowflake interview snowflake data warehouse snowflake why popular snowflake advantage snowflake login snowflake short tutorial snowflake cloud snowflake data snowflake database what is snowflake SnowPro Core COF-C02 Exam snowflake architecture diagram snowflake architecture design snowflake architecture on aws snowflake architecture layers snowflake architecture icons azure snowflake architecture matillion snowflake architecture databricks snowflake architecture aws snowflake architecture diagram snowflake introduction snowflake introduction video snowflake introduction ppt snowflake introduction course snowflake introduction pdf snowflake introduction and history snowflake introduction tutorial snowflake introduction youtube snowflake database introduction introduction to the snowflake data cloud Snowflake Cloud Data Platform What is Snowflake known for? What are the main features of Snowflake? What is so great about Snowflake? Is Snowflake an ETL tool? Snowflake overview ppt Snowflake overview pdf what is snowflake database snowflake documentation pdf snowflake aws snowflake vs aws What is Snowflake introduction? What Snowflake is used for? What is the description of a Snowflake? Why is Snowflake so popular? Snowflake introduction example snowflake documentation What is the Snowflake architecture? What best describes the Snowflake architecture? What is the main purpose of Snowflake? Is Snowflake better than AWS? Snowflake architecture example Snowflake architecture pdf 3 layers of snowflake architecture 4 layers of snowflake architecture Snowflake architecture tutorial A Detailed View Inside Snowflake why snowflake is better why snowflake is used why snowflake is so popular why snowflake is better than redshift why snowflake is popular why snowflake is better than oracle why snowflake is better than databricks why snowflake over redshift Snowflake Playlist: https://www.youtube.com/playlist?list=PLc2EZr8W2QIBqETApuLNGGB8X_WL47AKb Databricks Playlist: https://www.youtube.com/playlist?list=PLc2EZr8W2QIBONOwwf8jt2M0k-z22Mgbw Airflow Playlist: https://www.youtube.com/playlist?list=PLc2EZr8W2QIAI0cS1nZGNxoLzppb7XbqM Dbt Playlist: https://www.youtube.com/playlist?list=PLc2EZr8W2QIBegSYp4dEIMrfLj_cCJgYA