Skip to content

Snowflake

Snowflake は、Software-as-a-Service (SaaS) として提供される専用SQLクラウドデータウェアハウスです。Snowflakeのデータウェアハウスは、従来のデータウェアハウス製品よりも高速で使いやすく、極めて高い柔軟性を備えています。Snowflake独自の特許取得済みアーキテクチャにより、すべてのデータを集約し、迅速な分析を可能にし、すべてのユーザーにデータドリブン型のインサイトを提供することが容易になります。

BrazeはSnowflakeとの2つの統合を提供しています。これらを組み合わせることで、BrazeとSnowflake環境間の完全な双方向データパイプラインを実現します。

統合の選択

データ共有(BrazeからSnowflake)

Snowflakeのセキュアデータ共有により、BrazeのエンゲージメントおよびCampaignデータにSnowflakeインスタンスから直接、安全かつリアルタイムにアクセスできます。アカウント間でデータのコピーや転送は行われません。すべての共有はSnowflake独自のサービスレイヤーとメタデータストアを介して行われます。

データ共有は次のような場合に使用します。

  • Snowflake SQLを使用してBrazeのイベントおよびCampaignデータをクエリする
  • 複雑なレポートを作成し、アトリビューションモデリングを実行する
  • BrazeデータをSnowflakeウェアハウス内の他のデータと結合する
  • チャネル、業界、デバイスプラットフォーム全体でエンゲージメントデータをベンチマークする

設定手順については、Snowflake データ共有を参照してください。

クラウドデータ取り込み(SnowflakeからBraze)

クラウドデータ取り込み(CDI)を使用すると、SnowflakeインスタンスからBrazeにデータを直接同期できます。これにより、Brazeのユーザー属性、イベント、購入を、信頼できる唯一の情報源であるデータウェアハウスと常に最新の状態に保つことができます。

クラウドデータ取り込みは次のような場合に使用します。

  • SnowflakeからBrazeのユーザープロファイルにユーザー属性を同期する
  • SnowflakeからBrazeにイベントまたは購入データを送信する
  • ウェアハウスで行われるデータ変換とBrazeを同期させる
  • SnowflakeからBrazeへのカスタムETLパイプラインの構築と保守を回避する

Snowflakeのデータ共有の詳細については、Introduction to Secure Data Sharing を参照してください。

前提条件

この機能を使用する前に、以下を完了しておく必要があります。

必要条件 説明
Brazeへのアクセス Brazeでこの機能を使用するには、Brazeアカウントまたはカスタマーサクセスマネージャーに連絡する必要があります。
Snowflakeアカウント admin の権限を持つSnowflakeアカウントが必要です。

セキュアデータ共有の設定

Snowflakeでは、データ共有はデータプロバイダーデータコンシューマーの間で行われます。このコンテキストでは、データシェアを作成して送信するため、Brazeアカウントがデータプロバイダーとなります。一方、データシェアを使用してデータベースを作成するため、Snowflakeアカウントがデータコンシューマーとなります。詳細については、Snowflake: Consuming Shared Data を参照してください。

ステップ1: Brazeからデータシェアを送信する

  1. Brazeで、パートナー連携 > データ共有に移動します。
  2. Snowflakeアカウントの詳細とロケーターを入力します。アカウントロケーターを取得するには、送信先アカウントで SELECT CURRENT_ACCOUNT() を実行します。
  3. CRR共有をご利用の場合は、クラウドプロバイダーとリージョンを指定してください。
  4. 完了したら、データ共有を作成を選択します。これでデータシェアがSnowflakeアカウントに送信されます。

ステップ2: Snowflakeでデータベースを作成する

  1. 数分後に、Snowflakeアカウントでインバウンドデータシェアを受信します。
  2. インバウンドデータシェアを使用して、テーブルを表示しクエリするためのデータベースを作成します。以下に例を示します。
    1
    
     CREATE DATABASE <name> FROM SHARE <provider_account>.<share_name>
    
  3. 新しいデータベースをクエリする権限を付与します。

使用と視覚化

データ共有のプロビジョニングが完了したら、受信するデータ共有からデータベースを作成する必要があります。これにより、共有されているすべてのテーブルがSnowflakeインスタンスに表示され、インスタンスに保存されている他のデータと同様にクエリ可能になります。ただし、共有データは読み取り専用であり、クエリのみ可能で、変更や削除は一切できないことにご注意ください。

Currentsと同様に、Snowflakeセキュアデータ共有を使用して次のことができます。

  • 複雑なレポートを作成する
  • アトリビューションモデリングを実行する
  • 自社内での安全な共有
  • 生のイベントまたはユーザーデータをCRM(Salesforceなど)にマッピングする
  • その他多数

利用可能なテーブルと列の完全なリストについては、SQLテーブルリファレンスを参照してください。Snowflakeデータ共有には、そのリファレンスのすべてのテーブルに加え、スナップショット、CampaignおよびCanvasの変更ログ、エージェントコンソールイベント、メッセージリトライイベント用のSnowflake専用テーブルが含まれます。

未加工のテーブルスキーマをダウンロードしてテキストファイルとして確認することもできます。

ユーザーIDスキーマ

BrazeとSnowflakeでのユーザーIDの命名規則の違いに注意してください。

Brazeスキーマ Snowflakeスキーマ 説明
braze_id "USER_ID" Brazeによって自動的に割り当てられるユニークな識別子です。
external_id "EXTERNAL_USER_ID" 顧客によって設定されたユーザープロファイルのユニークな識別子です。

重要な情報と制限

破壊的な変更と非破壊的な変更

非破壊的な変更

非破壊的な変更はいつでも発生する可能性があり、一般的に追加の機能を提供します。非破壊的な変更の例には次のものがあります。

  • 新しいテーブルまたはビューを追加する
  • 既存のテーブルやビューにカラムを追加する

破壊的な変更

可能な場合には、破壊的な変更の前に通知を行い、移行期間を設けます。破壊的な変更の例には次のものがあります。

  • テーブルまたはビューを削除する
  • 既存のテーブルやビューからカラムを削除する
  • 既存の列の型またはnull許容性を変更する

Snowflakeのリージョン

Brazeは現在、Snowflake AWS US East-1、EU-Central(フランクフルト)、AP-Northeast-1(東京)、AP-Southeast-2(シドニー)、AP-Southeast-3(ジャカルタ)リージョンですべてのユーザーレベルデータをホストしています。これらのリージョン外のユーザーの場合、BrazeはSnowflakeインフラをAWS、Azure、またはGCPの任意のリージョンでホストしている共同の顧客にデータ共有を提供できます。

データリテンション

リテンションポリシー

2年以上前のデータはすべてアーカイブされ、長期保存に移されます。アーカイブプロセスの一環として、すべてのイベントは匿名化され、個人を特定できる情報(PII)が含まれる機密フィールドはすべて削除されます(これには、properties のようなオプションのPIIフィールドも含まれます)。アーカイブされたデータには依然として user_id フィールドが含まれており、すべてのイベントデータにわたるユーザーごとの分析が可能です。

対応する USERS_*_SHARED ビューで各イベントの直近2年間のデータをクエリできます。さらに、各イベントには USERS_*_SHARED_ALL ビューが用意されており、匿名化されたデータと非匿名化されたデータの両方を返すクエリを実行できます。

履歴データ

Snowflakeの履歴イベントデータのアーカイブは2019年4月まで遡ります。BrazeがSnowflakeにデータを保存し始めた最初の数ヶ月間に、製品の変更が行われ、そのデータの一部がわずかに異なって見えたり、いくつかのフィールドにnull値が含まれている可能性があります(この時点ではすべての利用可能なフィールドにデータを渡していなかったため)。2019年8月以前のデータを含む結果は、予期される結果と多少異なる可能性があると想定しておくことをお勧めします。

一般データ保護規則(GDPR)準拠

Braze に保管されているほぼすべてのイベントレコードには、ユーザーの個人を特定できる情報 (PII) を表すいくつかのフィールドが含まれています。一部のイベントには、メールアドレス、電話番号、デバイスID、言語、性別、および位置情報が含まれる場合があります。ユーザーの削除依頼がBrazeに送信された場合、これらのユーザーに属するイベントのPIIフィールドを無効化します。この方法では、イベントの履歴レコードは削除されませんが、イベントが特定の個人に結び付けられることは一切ありません。

共有データのクエリ: TIME とクエリパフォーマンス

データ共有ビュー(例: USERS_BEHAVIORS_CUSTOMEVENT_SHARED)のイベントデータは、TIME フィールドでクラスタリングされていますイベントが発生した時刻でフィルタリングする場合は、TIME を優先フィルターとして使用してください。TIME で行を制限するクエリは、SF_CREATED_AT でフィルタリングするクエリよりも一般的にパフォーマンスが高くなります。これは、クラスタリングがイベント時刻に基づいているためです。

フィールド 意味
TIME イベントが発生したUnixタイムスタンプです。発生時刻でフィルタリングする場合はこちらを使用してください。
SF_CREATED_AT 行がSnowflakeに読み込まれたタイムスタンプ(取り込み時刻)です。

スピード、パフォーマンス、クエリのコスト

データに対して実行されるクエリの速度、パフォーマンス、およびコストは、データのクエリに使用するウェアハウスのサイズによって決まります。場合によっては、分析のためにアクセスしているデータ量に応じて、クエリを成功させるためにより大きなウェアハウスサイズを使用する必要があるかもしれません。Snowflakeには、ウェアハウスの概要ウェアハウスの考慮事項など、どのサイズを使用するかを最適に判断する方法に関する優れたリソースが用意されています。

Snowflakeの設定時に参照できるサンプルクエリセットについては、サンプルクエリおよびETLイベントパイプライン設定の例をご確認ください。

設定手順については、クラウドデータ取り込み: データウェアハウス統合を参照してください。

New Stuff!