Firebase + BigQuery - 重复事件

ale*_*6dj 5 duplicates firebase google-bigquery firebase-analytics

我注意到 BigQuery 的事件表(与 Firebase 集成)中有数千个重复的事件。

我对重复的定义是:2 个或更多事件在所有这些字段中共享相同的数据:

event_timestamp, event_name, user_pseudo_id, app_info.id, device.advertising_id
Run Code Online (Sandbox Code Playgroud)

自动收集的事件以及自定义事件都会发生这种情况。我发现一个结果与另一个结果可能不同的一些参数是(是什么使这些事件不同):

event_server_timestamp_offset, geo.continent, geo.country
Run Code Online (Sandbox Code Playgroud)

我想没有理由在同一时刻、同一用户、同一应用程序、同一设备上发生重复的事件,但一个事件是geo.continent=America另一个事件geo.continent=Asia

有什么想法为什么会发生这种情况吗?提前致谢。

小智 2

Google 的解释是 BigQuery 中的 Firebase 数据重复主要与客户端的网络问题有关,导致事件被缓冲并发送两次。

但是,有一种方法可以使用event_server_timestamp_offset来删除这些事件的重复数据。该字段是事件发送到 Google 服务器的时间和接收时间之间的差值。这意味着,给定相同的 event_timestamp、event_name 和 user_pseudo_id,您只能采用具有较低 event_server_timestamp_offset 的事件来获得正确的结果。

您还可以安全地从事件表中删除重复记录。

抱歉,我无法分享此内容的来源,因为答案来自 Google Analytics 支持,因为我遇到了同样的问题。