Ayu*_*ush 4 hadoop hive scala apache-spark apache-spark-sql
我有一些电话记录的以下数据,我想从每条记录中删除前两个值,因为它们是国家/地区代码。我可以使用 Scala、 Spark或Hive执行此操作的方式是什么?
phone
|917799423934|
|019331224595|
| 8981251522|
|917271767899|
Run Code Online (Sandbox Code Playgroud)
我希望结果是:
phone
|7799423934|
|9331224595|
|8981251522|
|7271767899|
Run Code Online (Sandbox Code Playgroud)
我们如何从每条记录或该列的每一行中删除前缀 91,01?
手机尺寸可以不同,可以使用这样的构造(Scala):
df.withColumn("phone", expr("substring(phone,3,length(phone)-2)"))
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
6367 次 |
| 最近记录: |