Esta página foi traduzida automaticamente e pode conter imprecisões. Para relatar um erro de tradução, use o componente de feedback na parte inferior do sumário, à direita da página.

Snowflake

O Snowflake é um data warehouse de nuvem SQL criado para fins específicos e disponibilizado como software como serviço (SaaS). O Snowflake fornece um data warehouse mais rápido, mais fácil de usar e muito mais flexível do que as ofertas tradicionais. Com a arquitetura exclusiva e patenteada do Snowflake, é fácil reunir todos os seus dados, executar análises rápidas e obter insights orientados por dados para todos os seus usuários.

A Braze oferece duas integrações com o Snowflake. Juntas, elas fornecem um pipeline de dados bidirecional completo entre seus ambientes da Braze e do Snowflake.

Escolhendo uma integração

O Compartilhamento Seguro de Dados do Snowflake oferece acesso seguro e em tempo real aos dados de engajamento e de Campaigns da Braze diretamente na sua instância do Snowflake. Nenhum dado é copiado ou transferido entre contas — todo o compartilhamento é realizado por meio da camada de serviços e do armazenamento de metadados exclusivos do Snowflake.

Use o compartilhamento de dados quando quiser:

Consultar dados de eventos e de Campaigns da Braze usando SQL do Snowflake
Criar relatórios complexos e realizar modelagem de atribuição
Unir dados da Braze com outros dados no seu data warehouse do Snowflake
Comparar seus dados de engajamento entre canais, setores e plataformas de dispositivos

Para instruções de configuração, consulte Compartilhamento de dados do Snowflake.

Ingestão de dados na nuvem (do Snowflake para a Braze)

A Ingestão de dados na nuvem (CDI) permite sincronizar dados da sua instância do Snowflake diretamente para a Braze. Isso permite manter atributos de usuários, eventos e compras na Braze atualizados com os dados do seu data warehouse como fonte da verdade.

Use a ingestão de dados na nuvem quando quiser:

Sincronizar atributos de usuários do Snowflake para perfis de usuários na Braze
Enviar dados de eventos ou compras do Snowflake para a Braze
Manter a Braze sincronizada com transformações de dados que acontecem no seu data warehouse
Evitar a construção e manutenção de pipelines ETL personalizados do Snowflake para a Braze

Para saber mais sobre o compartilhamento de dados do Snowflake, veja Introdução ao Compartilhamento Seguro de Dados.

Pré-requisitos

Antes de usar este recurso, você precisará concluir o seguinte:

Requisito	Descrição
Acesso à Braze	Para acessar este recurso na Braze, você precisará entrar em contato com seu gerente de conta ou gerente de sucesso do cliente da Braze.
Conta Snowflake	Uma conta Snowflake com permissões de `admin`. Para clientes não HIPAA, o Snowflake Standard ou Enterprise Edition é compatível. Para compartilhamento de dados em conformidade com HIPAA, o Business Critical Edition é obrigatório.

Para o Snowflake, o compartilhamento de dados acontece entre um fornecedor de dados e um consumidor de dados. Neste contexto, sua conta da Braze é o fornecedor de dados porque cria e envia o datashare—enquanto sua conta Snowflake é o consumidor de dados porque usa o datashare para criar um banco de dados. Para mais detalhes, veja Snowflake: Consumindo Dados Compartilhados.

Etapa 1: Envie o datashare da Braze

Na Braze, acesse Partner Integrations > Data Sharing.
Insira os detalhes e o localizador da sua conta Snowflake. Para obter o localizador da conta, execute SELECT CURRENT_ACCOUNT() na conta de destino.
Se estiver usando um compartilhamento CRR, especifique o provedor de nuvem e a região.
Quando terminar, selecione Create Datashare. Isso enviará o compartilhamento de dados para a sua conta Snowflake.

Etapa 2: Crie o banco de dados no Snowflake

Após alguns minutos, você deve receber o datashare de entrada na sua conta Snowflake.

Usando o datashare de entrada, crie um banco de dados para visualizar e consultar as tabelas. Por exemplo:

 CREATE DATABASE <name> FROM SHARE <provider_account>.<share_name>

Conceda privilégios para consultar o novo banco de dados.

Aviso

Se você excluir e recriar um compartilhamento no dashboard da Braze, deve descartar o banco de dados criado anteriormente e recriá-lo usando CREATE DATABASE <name> FROM SHARE <provider_account>.<share_name> para consultar o compartilhamento de entrada. Se você tiver vários espaços de trabalho compartilhando dados para a mesma conta Snowflake, consulte as Perguntas frequentes sobre compartilhamento de dados do Snowflake para orientações sobre como gerenciar configurações de múltiplos espaços de trabalho.

Uso e visualização

Após o compartilhamento de dados ser provisionado, você precisará criar um banco de dados a partir do compartilhamento de dados de entrada, fazendo com que todas as tabelas compartilhadas apareçam na sua instância Snowflake e sejam consultáveis como qualquer outro dado armazenado na sua instância. No entanto, lembre-se de que os dados compartilhados são somente leitura e só podem ser consultados, mas não modificados ou excluídos de forma alguma.

Semelhante ao Currents, você pode usar o Compartilhamento Seguro de Dados do Snowflake para:

Criar relatórios complexos
Realizar modelagem de atribuição
Compartilhar dados de forma segura dentro da sua empresa
Mapear dados brutos de eventos ou dados de usuários para um CRM (como o Salesforce)
E muito mais

Para uma lista completa de tabelas e colunas disponíveis, consulte a referência de tabelas SQL. O Compartilhamento de Dados do Snowflake inclui todas as tabelas dessa referência, além de tabelas exclusivas do Snowflake para snapshots, changelogs de Campaigns e Canvas, eventos do console de agentes e eventos de reenvio de mensagens.

Você também pode baixar os esquemas de tabela brutos como um arquivo de texto.

Esquema de ID do usuário

Note as seguintes diferenças entre as convenções de nomenclatura da Braze e do Snowflake para IDs de usuário.

Esquema da Braze	Esquema do Snowflake	Descrição
`braze_id`	`"USER_ID"`	O identificador exclusivo atribuído automaticamente pela Braze.
`external_id`	`"EXTERNAL_USER_ID"`	O identificador exclusivo do perfil de um usuário, definido pelo cliente.

Informações importantes e limitações

Alterações interruptivas e não interruptivas

Alterações não interruptivas

Alterações não disruptivas podem acontecer a qualquer momento e geralmente fornecem funcionalidades adicionais. Exemplos de alterações não disruptivas:

Adição de uma nova tabela ou visualização
Adição de uma coluna a uma tabela ou visualização existente

Importante

Como novas colunas são consideradas não interruptivas, a Braze recomenda enfaticamente listar de modo explícito as colunas de interesse em cada consulta, em vez de usar consultas SELECT *. Como alternativa, você pode criar visualizações que nomeiem explicitamente as colunas e, em seguida, consultar essas visualizações em vez das tabelas diretamente.

Alterações interruptivas

Sempre que possível, mudanças incompatíveis são precedidas por um anúncio e um período de migração. Exemplos de mudanças incompatíveis incluem:

Remoção de uma tabela ou visualização
Remoção de uma coluna de uma tabela ou visualização existente
Alteração do tipo ou da nulabilidade de uma coluna existente

Regiões do Snowflake

A Braze atualmente hospeda todos os dados em nível de usuário nas regiões Snowflake AWS US East-1, EU-Central (Frankfurt), AP-Northeast-1 (Tóquio), AP-Southeast-2 (Sydney) e AP-Southeast-3 (Jacarta). Para usuários fora dessas regiões, a Braze pode fornecer compartilhamento de dados para clientes conjuntos que hospedem sua infraestrutura do Snowflake em qualquer região da AWS, Azure ou GCP.

Retenção de dados

Política de retenção

Todos os dados com mais de dois anos serão arquivados e transferidos para o armazenamento de longo prazo. Como parte do processo de arquivamento, todos os eventos são anonimizados e todos os campos sensíveis de informações de identificação pessoal (IPI) são removidos (isso inclui campos de IPI opcionais, como properties). Os dados arquivados ainda contêm o campo user_id, que permite a análise de dados por usuário em todos os dados de eventos.

Você poderá consultar os dois anos mais recentes de dados de cada evento na visualização correspondente USERS_*_SHARED. Além disso, cada evento terá uma visualização USERS_*_SHARED_ALL que pode ser consultada para retornar dados anonimizados e não anonimizados.

Dados históricos

O arquivo de dados históricos de eventos no Snowflake remonta a abril de 2019. Nos primeiros meses em que a Braze armazenou dados no Snowflake, foram feitas alterações no produto que podem ter resultado em alguns desses dados com aparência ligeiramente diferente ou com alguns valores nulos (já que não estávamos passando dados para todos os campos disponíveis naquele momento). É melhor presumir que os resultados que incluam dados anteriores a agosto de 2019 poderão ser ligeiramente diferentes das expectativas.

Quase todos os registros de eventos armazenados pelo Braze incluem alguns campos que representam informações de identificação pessoal (IPI) dos usuários. Alguns eventos podem incluir endereço de e-mail, número de telefone, ID do dispositivo, idioma, gênero e local. Se a solicitação de esquecimento de um usuário for enviada ao Braze, anularemos esses campos de IPI para qualquer evento pertencente a esses usuários. Dessa forma, não removemos o registro histórico do evento, mas agora o evento jamais poderá ser vinculado a um indivíduo específico.

Consultando dados compartilhados: `TIME` e desempenho de consultas

Os dados de eventos nas visualizações de compartilhamento de dados (por exemplo, USERS_BEHAVIORS_CUSTOMEVENT_SHARED) são clusterizados no campo TIME. Ao filtrar por quando o evento ocorreu, use TIME como filtro preferencial. Consultas que restringem linhas usando TIME geralmente têm melhor desempenho do que consultas que filtram por SF_CREATED_AT, porque a clusterização está alinhada com o horário do evento.

Campo	Significado
`TIME`	Timestamp Unix do momento em que o evento ocorreu. Prefira este campo ao filtrar por horário de ocorrência.
`SF_CREATED_AT`	Timestamp de quando a linha foi carregada no Snowflake (horário de ingestão).

Velocidade, desempenho e custo das consultas

A velocidade, o desempenho e o custo de qualquer consulta executada nos dados são determinados pelo tamanho do warehouse que você usa para consultar os dados. Em alguns casos, dependendo da quantidade de dados que estiver acessando para análise, talvez seja necessário usar um tamanho de warehouse maior para que a consulta seja bem-sucedida. O Snowflake tem excelentes recursos disponíveis sobre a melhor forma de determinar o tamanho a ser usado, incluindo Visão geral dos warehouses e Considerações sobre warehouses.

Para obter um conjunto de exemplos de consultas como referência ao configurar o Snowflake, confira nossos exemplos de consultas e de configuração do pipeline de eventos ETL.

Para instruções de configuração, consulte Ingestão de dados na nuvem: integrações com data warehouse.

New Stuff!