你可以尝试两件事.您可以尝试使用UUID,但会为每行生成唯一ID.这样的事情会做:
select table("java.util.UUID","randomUUID"),customer_name,address,unique_value from table_name
但是,如果您计划根据名称和地址使用唯一键,则可以连接两个字段并获取结果字符串的哈希值(请参阅哈希函数的详细信息:https://cwiki.apache.org/confluence/ display/Hive/LanguageManual + UDF).这将确保相同的名称和地址获得相同的密钥.这个查询应该足够了:
从table_name中选择customer_name,address,hash(concat(customer_name,address))
归档时间: |
|
查看次数: |
4801 次 |
最近记录: |