小编aru*_*b2w的帖子

在oracle sql中使用regexp转换数据

我有一个像下面这样的数据,其中有限制.我在这里向他们展示了一个观点

with t_view as (select '6-21  6-21  6-21  6-21  6-21  6-21  6-21  ' as col from dual
union
select '6-20  6-20  6-20  6-20  6-20  ' from dual
union
select '6-9  6-9  6-9  6-9  6-9  6-9  6-9  ' from dual)
Run Code Online (Sandbox Code Playgroud)

我的预期产量是

Mon: 6-21, Tue: 6-21, Wed: 6-21, Thu: 6-21, Fri: 6-21, Sat: 6-21, Sun: 6-21
Mon: 6-20, Tue: 6-20, Wed: 6-20, Thu: 6-20, Fri: 6-20
Mon: 6-9, Tue: 6-9, Wed: 6-9, Thu: 6-9, Fri: 6-9, Sat: 6-9, Sun: 6-9
Run Code Online (Sandbox Code Playgroud)

我想用这样一些独特的模式替换所有那些水平表,然后根据索引用Mon,Tue替换那个模式

$ …

regex sql oracle regexp-replace

6
推荐指数
1
解决办法
577
查看次数

在 pyspark 中关闭强制 UTF8 编码

我有一个像下面这样的 python 代码来使用 pyspark 从 Oracle 读取数据。

tableDF = spark.read \
            .format("jdbc") \
            .option("driver", "oracle.jdbc.driver.OracleDriver") \
            .option("url", "jdbc:oracle:thin:@" + hostid + ".dev.com:1521/" + databaseinstance) \
            .option("dbtable", sqlstring) \
            .option("numPartitions", 1) \
            .option("fetchsize", fetchsize) \
            .option("user", contextname) \
            .option("password", contextname) \
            .load() \
Run Code Online (Sandbox Code Playgroud)

数据库字符集源是US7ASCII,但因为有上加载的数据没有验证到Oracle它包含了各种编码字符集数据。简而言之,即使 DB 字符集是 US7ASCII,它的列中也包含 UTF8、ISO-8859-1 混合编码的数据。

我能够成功地从 Oracle 读取数据到数据帧中,没有任何问题,但由于 pyspark 强制编码为 UTF-8,导致我的一些数据具有 UTF-8 替换字符,例如EFBFA2EFBE80EFBE93,数据崩溃了由于在包含源字符集为 US7ASCII 的列中存在 Unicode 字符 E2 80 93,因此可以正确识别

该字段的类型是varchar. 存储的值是短划线字符0xE2 0x80 …

python encoding utf-8 pyspark pyspark-sql

5
推荐指数
1
解决办法
1979
查看次数

在给定的Inorder/Preorder/Postorder遍历中,不能构造树木

我知道如果没有Inorder和Preorder/postorder遍历,就无法构造一棵树.因为对于给定的(仅有内订/预订/后序),可能会产生更多数量的树.是否有任何算法或机制可以计算给定的唯一树的数量(仅限Inorder/Preorder/postorder遍历).

Eg : a b c d e f g this is my Inorder traversal. 
Run Code Online (Sandbox Code Playgroud)

使用给定的Inorder遍历可以构造多少个唯一树.

我试过它们是谷歌但没有一个解释清楚

任何帮助,将不胜感激...

algorithm tree data-structures

1
推荐指数
1
解决办法
872
查看次数