Intégrations de stockage de fichiers
Cette page explique comment configurer la prise en charge de l’ingestion de données dans le cloud et synchroniser les données pertinentes de S3 vers Braze.
Fonctionnement
Vous pouvez utiliser Cloud Data Ingestion (CDI) for S3 pour intégrer directement un ou plusieurs compartiments S3 de votre compte AWS à Braze. Lorsque de nouveaux fichiers sont publiés dans S3, un message est envoyé à SQS et Cloud Data Ingestion de Braze prend en charge ces nouveaux fichiers.
L’ingestion de données dans le nuage prend en charge les éléments suivants :
- Fichiers JSON
- fichiers CSV
- Fichiers Parquet
- Données d’attributs, d’événements, d’achats et de suppression d’utilisateurs
Conditions préalables
L’intégration nécessite les ressources suivantes :
- Compartiment S3 pour le stockage des données
- File d’attente SQS pour les notifications de nouveaux fichiers
- Rôle IAM pour l’accès à Braze
Définitions AWS
Tout d’abord, définissons certains des termes utilisés dans le cadre de cette tâche.
Terme | Définition |
---|---|
Nom de ressource Amazon (ARN) | L’ARN est un identifiant unique pour les ressources AWS. |
Gestion des identités et des accès (IAM) | IAM est un service Web qui vous permet de contrôler, en toute sécurité, l’accès aux ressources AWS. Dans ce tutoriel, vous allez créer une politique IAM et l’attribuer à un rôle IAM pour intégrer votre compartiment S3 à Cloud Data Ingestion de Braze. |
Amazon Simple Queue Service (SQS) | SQS est une file d’attente hébergée qui vous permet d’intégrer des systèmes et des composants logiciels distribués. |
Configuration de l’ingestion de données Cloud dans AWS
Étape 1 : Créer un compartiment source
Créez un compartiment S3 à usage général avec les paramètres par défaut dans votre compte AWS. Les compartiments S3 peuvent être réutilisés d’une synchronisation à l’autre, à condition que le dossier soit unique.
Les paramètres par défaut sont les suivants :
- ACL désactivés
- Bloquer tout accès public
- Désactiver la gestion des versions des compartiments
- Chiffrement SSE-S3
Prenez note de la région dans laquelle vous avez créé le compartiment, car vous allez créer une file d’attente SQS dans la même région à l’étape suivante.
Étape 2 : Créer une file d’attente SQS
Créez une file d’attente SQS pour suivre l’ajout d’objets dans le compartiment que vous avez créé. Utilisez pour l’instant les paramètres de configuration par défaut.
Une file d’attente SQS doit être unique au niveau mondial (par exemple, une seule peut être utilisée pour une synchronisation CDI et ne peut pas être réutilisée dans un autre espace de travail).
Veillez à créer ce SQS dans la même région que celle où vous avez créé le compartiment.
Veillez à noter l’ARN et l’URL du SQS, car vous les utiliserez fréquemment au cours de cette configuration.
Étape 3 : Configurer une politique d’accès
Pour configurer la politique d’accès, sélectionnez Options avancées.
Ajoutez la déclaration suivante à la politique d’accès de la file d’attente, en prenant soin de remplacer YOUR-BUCKET-NAME-HERE
par le nom de votre compartiment, et YOUR-SQS-ARN
par l’ARN de votre file d’attente SQS, et YOUR-AWS-ACCOUNT-ID
par l’ID de votre compte AWS :
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
{
"Sid": "braze-cdi-s3-sqs-publish",
"Effect": "Allow",
"Principal": {
"Service": "s3.amazonaws.com"
},
"Action": "SQS:SendMessage",
"Resource": "YOUR-SQS-ARN",
"Condition": {
"StringEquals": {
"aws:SourceAccount": "YOUR-AWS-ACCOUNT-ID"
},
"ArnLike": {
"aws:SourceArn": "arn:aws:s3:::YOUR-BUCKET-NAME-HERE"
}
}
}
Étape 4 : Ajouter une notification d’événement au compartiment S3
- Dans le compartiment créé à l’étape 1, allez dans Propriétés > Notifications d’événements.
- Donnez un nom à la configuration. Vous pouvez également spécifier un préfixe ou un suffixe à cibler si vous souhaitez que seul un sous-ensemble de fichiers soit ingéré par Braze.
- Sous Destination, sélectionnez File d’attente SQS et indiquez l’ARN de la file d’attente SQS que vous avez créée à l’étape 2.
Si vous téléchargez vos fichiers dans le dossier racine d’un compartiment S3 puis déplacez certains des fichiers vers un dossier spécifique du compartiment, vous pouvez rencontrer une erreur inattendue. Au lieu de cela, vous pouvez modifier les notifications d’événements pour qu’elles soient envoyées uniquement pour les fichiers du préfixe, éviter de placer des fichiers dans le compartiment S3 en dehors de ce préfixe, ou mettre à jour l’intégration sans préfixe, qui ingérera alors tous les fichiers.
Étape 5 : Créer une politique IAM
Créez une politique IAM pour permettre à Braze d’interagir avec votre compartiment source. Pour commencer, connectez-vous à la console de gestion AWS en tant qu’administrateur de compte.
-
Allez dans la section IAM de la console AWS, sélectionnez Politiques dans la barre de navigation, puis cliquez sur Créer une politique.
-
Ouvrez l’onglet JSON et saisissez l’extrait de code suivant dans la section Policy Document, en prenant soin de remplacer
YOUR-BUCKET-NAME-HERE
par le nom de votre compartiment etYOUR-SQS-ARN-HERE
par le nom de votre file d’attente SQS :
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
{
"Version": "2012-10-17",
"Statement": [
{
"Effect": "Allow",
"Action": ["s3:ListBucket", "s3:GetObjectAttributes", "s3:GetObject"],
"Resource": ["arn:aws:s3:::YOUR-BUCKET-NAME-HERE"]
},
{
"Effect": "Allow",
"Action": ["s3:ListBucket", "s3:GetObjectAttributes", "s3:GetObject"],
"Resource": ["arn:aws:s3:::YOUR-BUCKET-NAME-HERE/*"]
},
{
"Effect": "Allow",
"Action": [
"sqs:DeleteMessage",
"sqs:GetQueueUrl",
"sqs:ReceiveMessage",
"sqs:GetQueueAttributes"
],
"Resource": "YOUR-SQS-ARN-HERE"
}
]
}
3. Sélectionnez Réviser la politique lorsque vous avez terminé.
- Donnez un nom et une description à la politique et sélectionnez Créer une politique.
Étape 6 : Créer un rôle IAM
Pour terminer la configuration sur AWS, vous allez créer un rôle IAM et y associer la politique IAM de l’étape 4.
- Dans la même section IAM de la console où vous avez créé la politique IAM, allez dans Rôles > Créer un rôle.
-
Copiez l’ID du compte AWS de Braze à partir de votre tableau de bord de Braze. Allez dans Cloud Data Ingestion, sélectionnez Créer une nouvelle synchronisation de données et sélectionnez Importation S3.
-
Dans AWS, sélectionnez Another AWS Account (Autre compte AWS) comme type de sélecteur d’entité de confiance. Indiquez votre ID de compte Braze, cochez la case Require external ID (Exiger un ID externe) et saisissez un ID externe que Braze pourra utiliser. Sélectionnez Suivant lorsque vous avez terminé.
4. Attachez la politique créée à l’étape 4 au rôle. Recherchez la police dans la barre de recherche et cochez la case à côté de la police pour la joindre. Sélectionnez Suivant lorsque vous avez terminé.
Donnez un nom et une description au rôle, puis sélectionnez Créer un rôle.
5. Prenez note de l’ARN du rôle que vous venez de créer et de l’ID externe que vous avez généré, car vous les utiliserez pour créer l’intégration de l’ingestion de données Cloud.
Configuration de Cloud Data Ingestion dans Braze
- Pour créer une nouvelle intégration, accédez à Paramètres des données > Ingestion de données dans le cloud, sélectionnez Créer une nouvelle synchronisation de données, puis sélectionnez Importation S3 dans la section des sources de fichiers.
- Saisissez les informations issues du processus de configuration d’AWS pour créer une nouvelle synchronisation. Précisez les éléments suivants :
- ARN du rôle
- ID externe
- URL SQS (doit être unique pour chaque nouvelle intégration)
- Nom du compartiment
- Chemin d’accès au dossier (facultatif, doit être unique pour toutes les synchronisations d’un espace de travail)
- Région
3. Donnez un nom à votre intégration et sélectionnez le type de données pour cette intégration.
4. Ajoutez un e-mail de contact pour recevoir des notifications si la synchronisation est interrompue en raison de problèmes d’accès ou de permissions. Si vous le souhaitez, vous pouvez activer les notifications pour les erreurs au niveau de l’utilisateur et les réussites de synchronisation.
5. Enfin, testez la connexion et enregistrez la synchronisation.
Formats de fichiers requis
Cloud Data Ingestion prend en charge les fichiers JSON, CSV et Parquet. Chaque fichier doit contenir une ou plusieurs colonnes d’identifiants prises en charge, ainsi qu’une colonne de données utiles sous la forme d’une chaîne de caractères JSON.
Braze n’impose pas d’exigences supplémentaires en matière de noms de fichiers en plus de celles imposées par AWS. Les noms de fichiers doivent être uniques. Nous vous recommandons d’ajouter un horodatage pour garantir l’unicité.
Identifiants des utilisateurs
Votre fichier source peut contenir une ou plusieurs colonnes ou clés d’identification de l’utilisateur. Chaque ligne ne doit contenir qu’un seul identifiant, mais un fichier source peut avoir plusieurs types d’identifiants.
Identifiant | Description |
---|---|
EXTERNAL_ID |
Il identifie l’utilisateur que vous souhaitez mettre à jour. Cela doit correspondre à la valeur external_id utilisée dans Braze. |
ALIAS_NAME et ALIAS_LABEL |
Ces deux colonnes créent un objet alias d’utilisateur. alias_name doit être un identifiant unique et alias_label spécifie le type d’alias. Les utilisateurs peuvent avoir plusieurs alias avec différentes étiquettes, mais seulement un alias_name par alias_label . |
BRAZE_ID |
L’identifiant de l’utilisateur de Braze. Celui-ci est généré par le SDK de Braze, et il n’est pas possible de créer de nouveaux utilisateurs à l’aide d’un ID de Braze par le biais de l’ingestion de données dans le cloud. Pour créer de nouveaux utilisateurs, spécifiez un ID utilisateur externe ou un alias utilisateur. |
EMAIL |
L’adresse e-mail de l’utilisateur. S’il existe plusieurs profils avec la même adresse e-mail, le profil le plus récemment mis à jour sera prioritaire pour les mises à jour. Si vous indiquez à la fois l’e-mail et le téléphone, nous utiliserons l’e-mail comme identifiant principal. |
PHONE |
Le numéro de téléphone de l’utilisateur. S’il existe plusieurs profils avec le même numéro de téléphone, le profil le plus récemment mis à jour sera mis à jour en priorité. |
PAYLOAD |
Il s’agit d’une chaîne JSON des champs que vous souhaitez synchroniser avec l’utilisateur dans Braze. |
Contrairement aux sources de l’entrepôt de données, la colonne UPDATED_AT
n’est ni nécessaire ni prise en charge.
1
2
3
4
5
6
7
{"external_id":"s3-qa-0","payload":"{\"name\": \"GT896\", \"age\": 74, \"subscriber\": true, \"retention\": {\"previous_purchases\": 21, \"vip\": false}, \"last_visit\": \"2023-08-08T16:03:26.600803\"}"}
{"external_id":"s3-qa-1","payload":"{\"name\": \"HSCJC\", \"age\": 86, \"subscriber\": false, \"retention\": {\"previous_purchases\": 0, \"vip\": false}, \"last_visit\": \"2023-08-08T16:03:26.600824\"}"}
{"external_id":"s3-qa-2","payload":"{\"name\": \"YTMQZ\", \"age\": 43, \"subscriber\": false, \"retention\": {\"previous_purchases\": 23, \"vip\": true}, \"last_visit\": \"2023-08-08T16:03:26.600831\"}"}
{"external_id":"s3-qa-3","payload":"{\"name\": \"5P44M\", \"age\": 15, \"subscriber\": true, \"retention\": {\"previous_purchases\": 7, \"vip\": true}, \"last_visit\": \"2023-08-08T16:03:26.600838\"}"}
{"external_id":"s3-qa-4","payload":"{\"name\": \"WMYS7\", \"age\": 11, \"subscriber\": true, \"retention\": {\"previous_purchases\": 0, \"vip\": false}, \"last_visit\": \"2023-08-08T16:03:26.600844\"}"}
{"external_id":"s3-qa-5","payload":"{\"name\": \"KCBLK\", \"age\": 47, \"subscriber\": true, \"retention\": {\"previous_purchases\": 11, \"vip\": true}, \"last_visit\": \"2023-08-08T16:03:26.600850\"}"}
{"external_id":"s3-qa-6","payload":"{\"name\": \"T93MJ\", \"age\": 47, \"subscriber\": true, \"retention\": {\"previous_purchases\": 10, \"vip\": false}, \"last_visit\": \"2023-08-08T16:03:26.600856\"}"}
Chaque ligne de votre fichier source doit contenir du JSON valide, sinon le fichier sera ignoré.
1
2
{"external_id":"s3-qa-0","payload":"{\"app_id\": \"YOUR_APP_ID\", \"name\": \"view-206\", \"time\": \"2024-04-02T14:34:08\", \"properties\": {\"bool_value\": false, \"preceding_event\": \"unsubscribe\", \"important_number\": 206}}"}
{"external_id":"s3-qa-1","payload":"{\"app_id\": \"YOUR_APP_ID\", \"name\": \"view-206\", \"time\": \"2024-04-02T14:34:08\", \"properties\": {\"bool_value\": false, \"preceding_event\": \"unsubscribe\", \"important_number\": 206}}"}
Chaque ligne de votre fichier source doit contenir du JSON valide, sinon le fichier sera ignoré.
1
2
{"external_id":"s3-qa-0","payload":"{\"app_id\": \"YOUR_APP_ID\", \"product_id\": \"product-11\", \"currency\": \"BSD\", \"price\": 8.511527858335066, \"time\": \"2024-04-02T14:34:08\", \"quantity\": 19, \"properties\": {\"is_a_boolean\": true, \"important_number\": 40, \"preceding_event\": \"click\"}}"}
{"external_id":"s3-qa-1","payload":"{\"app_id\": \"YOUR_APP_ID\", \"product_id\": \"product-11\", \"currency\": \"BSD\", \"price\": 8.511527858335066, \"time\": \"2024-04-02T14:34:08\", \"quantity\": 19, \"properties\": {\"is_a_boolean\": true, \"important_number\": 40, \"preceding_event\": \"click\"}}"}
Chaque ligne de votre fichier source doit contenir du JSON valide, sinon le fichier sera ignoré.
external_id,payload
s3-qa-load-0-d0daa196-cdf5-4a69-84ae-4797303aee75,"{""name"": ""SNXIM"", ""age"": 54, ""subscriber"": true, ""retention"": {""previous_purchases"": 19, ""vip"": true}, ""last_visit"": ""2023-08-08T16:03:26.598806""}"
s3-qa-load-1-d0daa196-cdf5-4a69-84ae-4797303aee75,"{""name"": ""0J747"", ""age"": 73, ""subscriber"": false, ""retention"": {""previous_purchases"": 22, ""vip"": false}, ""last_visit"": ""2023-08-08T16:03:26.598816""}"
s3-qa-load-2-d0daa196-cdf5-4a69-84ae-4797303aee75,"{""name"": ""EP1U0"", ""age"": 99, ""subscriber"": false, ""retention"": {""previous_purchases"": 23, ""vip"": false}, ""last_visit"": ""2023-08-08T16:03:26.598822""}"
Pour obtenir des exemples de tous les types de fichiers pris en charge, reportez-vous aux fichiers d’exemple figurant dans Braze-examples.
Choses à savoir
- Les fichiers ajoutés au compartiment source S3 ne doivent pas dépasser 512 Mo. Les fichiers de plus de 512 Mo entraîneront une erreur et ne seront pas synchronisés sur Braze.
- Il n’y a pas de limite supplémentaire au nombre de lignes par fichier.
- Il n’y a pas de limite supplémentaire au nombre de fichiers téléchargés au cours d’une période donnée.
- La commande n’est pas possible dans ou entre les dossiers. Nous vous recommandons de regrouper les mises à jour périodiquement si vous surveillez les conditions de concurrence attendues.
Résolution des problèmes
Téléchargement de fichiers et traitement
CDI ne traitera que les fichiers ajoutés après la création de la synchronisation. Au cours de ce processus, Braze recherche de nouveaux fichiers à ajouter, ce qui déclenche un nouvel envoi déclenché à SQS. Cela déclenchera une nouvelle synchronisation pour traiter le nouveau fichier.
Les fichiers existants peuvent être utilisés pour valider la structure des données dans la connexion de test, mais ils ne seront pas synchronisés avec Braze. Tous les fichiers existants qui doivent être synchronisés doivent être retéléchargés sur S3 afin d’être traités par le CDI.
Gestion des erreurs de fichiers inattendues
Si vous observez un nombre élevé d’erreurs ou de fichiers échoués, il est possible qu’un autre processus ajoute des fichiers au compartiment S3 dans un dossier autre que le dossier cible pour CDI.
Lorsque des fichiers sont téléchargés dans le compartiment source mais pas dans le dossier source, CDI traite la notification SQS mais n’entreprend aucune action sur le fichier, ce qui peut apparaître comme une erreur.