Skip to content

Semántica de la entrega de eventos

Esta página describe y define cómo Currents gestiona los datos de eventos de archivos planos que enviamos a los socios de almacenamiento de almacén de datos.

Currents para almacenamiento de datos es una transmisión continua de datos desde nuestra plataforma a un contenedor de almacenamiento en una de las conexiones de nuestro socio de almacén de datos. Currents escribe archivos Avro en tu contenedor de almacenamiento en umbrales regulares, lo que te permite procesar y analizar los datos de eventos con tu propio conjunto de herramientas de inteligencia empresarial (BI).

Eventos de prueba

Cuando configures una integración de Currents, haz clic en Enviar eventos de prueba para verificar la conexión con tu contenedor de almacenamiento. Estos eventos de prueba validan que tu integración puede recibir y procesar datos correctamente.

Entrega “al menos una vez”

Como sistema de alto rendimiento, Currents proporciona una entrega de eventos “al menos una vez”, lo que significa que ocasionalmente se pueden escribir eventos duplicados en tu contenedor de almacenamiento. Esto puede ocurrir cuando los eventos se reprocesan desde nuestra cola por cualquier motivo.

Si tus casos de uso requieren una entrega “exactamente una vez”, puedes usar el campo de identificador único que se envía con cada evento (id) para deduplicar eventos. Dado que el archivo sale de nuestro control cuando se escribe en tu contenedor de almacenamiento, no tenemos forma de garantizar la deduplicación desde nuestro lado.

Marcas de tiempo

Todas las marcas de tiempo exportadas por Currents se envían en la zona horaria UTC. Para algunos eventos en los que está disponible, también se incluye un campo de zona horaria, que entrega el formato de la Autoridad de Números Asignados de Internet (IANA) de la zona horaria local del usuario en el momento del evento.

Latencia

Los eventos enviados a Braze a través del SDK o la API pueden incluir una marca de tiempo del pasado. El ejemplo más notable es cuando los datos del SDK se ponen en cola, como cuando no hay conectividad móvil. En ese caso, la marca de tiempo del evento reflejará cuándo se generó el evento. Esto significa que un porcentaje de eventos parecerá tener una latencia alta.

Formato Apache Avro

Las integraciones de almacenamiento de datos de Braze Currents generan datos en formato .avro. Elegimos Apache Avro porque es un formato de datos flexible que admite de forma nativa la evolución de esquemas y es compatible con una amplia variedad de productos de datos:

  • Avro es compatible con casi todos los principales almacenes de datos.
  • En caso de que desees dejar tus datos en S3, Avro comprime mejor que CSV y JSON, por lo que pagas menos por almacenamiento y potencialmente puedes usar menos CPU para analizar los datos.
  • Avro requiere esquemas cuando se escriben o leen datos. Los esquemas pueden evolucionar con el tiempo para manejar la adición de campos sin interrupciones.

Currents creará un archivo para cada tipo de evento usando el siguiente formato:

1
<your-bucket-prefix>/dataexport.<cluster-identifier>.<connection-type-identifier>.integration.<integration-id>/event_type=<event-type>/date=<date>/version=<currents_version>/<environment>/dataexport.<cluster-identifier>.<connection-type-identifier>.integration.<integration-id>+<partition>+<offset>.avro

Por ejemplo, la ruta de un evento de envío push puede verse así:

1
currents-export/dataexport.prod-01.S3.integration.69cadaaed2d51b7c75b1a3e5/event_type=users.messages.pushnotification.Send/date=2025-04-01-17/version=6/us-01/dataexport.prod-01.S3.integration.69cadaaed2d51b7c75b1a3e5+0+123456.avro

El segmento de ruta version es un valor entero simple de la versión de Currents, como version=6.

Umbral de escritura de Avro

En circunstancias normales, Braze escribirá archivos de datos en tu contenedor de almacenamiento cada 5 minutos o cada 15,000 eventos, lo que ocurra primero. Bajo carga pesada, podemos escribir archivos de datos más grandes con hasta 100,000 eventos por archivo.

Cambios en el esquema de Avro

De vez en cuando, Braze puede realizar cambios en el esquema de Avro cuando se agregan, cambian o eliminan campos. Para nuestros propósitos aquí, hay dos tipos de cambios: con ruptura y sin ruptura. Todos los cambios de esquema se agrupan en versiones de Currents, y cada versión avanza el segmento version=<currents_version> en la ruta de almacenamiento (por ejemplo, de version=6 a version=7). Los eventos de Currents escritos en Azure Blob Storage, Google Cloud Storage y Amazon S3 usan el siguiente formato de ruta:

1
<your-bucket-prefix>/<currents-integration-id>/event_type=<event-type>/date=<date>/version=<currents_version>/<environment>/<avro-file>

Cambios sin ruptura

Cuando se agrega un campo al esquema de Avro, lo consideramos un cambio sin ruptura. Los campos agregados siempre serán campos Avro “opcionales” (como con un valor predeterminado de null), por lo que “coincidirán” con esquemas más antiguos según la especificación de resolución de esquemas de Avro. Estas adiciones no deberían afectar los procesos existentes de extracción, transformación y carga (ETL), ya que el campo simplemente se ignorará hasta que se agregue a tu proceso ETL.

Cambios con ruptura

Cuando se elimina o cambia un campo en el esquema de Avro, lo consideramos un cambio con ruptura. Los cambios con ruptura pueden requerir modificaciones en los procesos ETL existentes, ya que los campos que estaban en uso pueden dejar de registrarse como se esperaba.

Todos los cambios con ruptura se comunicarán con anticipación antes del lanzamiento.

Para un historial completo de cambios por versión, consulta el registro de cambios de Currents.

New Stuff!