用openrefine中的句子聚类单词

Vik*_*tor 2 cluster-analysis openrefine data-cleaning

我想在一个文本文件中聚集单词,其行如下:

number queries waiting support representatives become available
query numbers 
Run Code Online (Sandbox Code Playgroud)

更具体地说,我想用他们的集群代表替换单词而不改变句子.

我要做的是:1.将我的列空格分成更多列,每列有1个字/行2.集群所有列3.将列合并回来

但这非常乏味.我想听听一个更简单,也许更优雅的解决方案.

Ett*_*zza 5

一个可能更好的解决方案是为每一行创建一个记录,按空间,群集"分割多值单元格",然后按空格连接.

示例:

在此输入图像描述