是否可以从 Big Query 中的字符串中删除重复项?

Gly*_*ury 1 google-bigquery

所以一直在处理一些数据,目前有以下输出

客户 | 原因
Customer1 | 答案 1、答案 3、答案 2、答案 4、答案 5、答案 1、答案 3、答案 1

无论如何,Big Query 标准 sql 是否可以消除此字符串中的重复项并以下面的输出结束?

客户 | 原因
Customer1 | 答案 1、答案 3、答案 2、答案 4、答案 5

提前致谢

Ell*_*ard 5

假设我正确理解了这个问题,你想要的是:

SELECT
  (SELECT STRING_AGG(DISTINCT s, ', ')
   FROM UNNEST(SPLIT(Customer1, ', ')) AS s) AS Customer1
FROM dataset.table
Run Code Online (Sandbox Code Playgroud)

这会在', '分隔符上拆分字符串,然后将子字符串聚合为一个新字符串,并使用DISTINCT关键字删除重复项。