是否可以从 Big Query 中的字符串中删除重复项？

Question

所以一直在处理一些数据，目前有以下输出

客户 | 原因
Customer1 | 答案 1、答案 3、答案 2、答案 4、答案 5、答案 1、答案 3、答案 1

无论如何，Big Query 标准 sql 是否可以消除此字符串中的重复项并以下面的输出结束？

客户 | 原因
Customer1 | 答案 1、答案 3、答案 2、答案 4、答案 5

提前致谢

Answer 1

假设我正确理解了这个问题，你想要的是：

SELECT
  (SELECT STRING_AGG(DISTINCT s, ', ')
   FROM UNNEST(SPLIT(Customer1, ', ')) AS s) AS Customer1
FROM dataset.table

这会在', '分隔符上拆分字符串，然后将子字符串聚合为一个新字符串，并使用DISTINCT关键字删除重复项。