小编chr*_*ock的帖子

如何克隆迭代器?

假设我有一个迭代器:

val it = List("a","b","c").iterator
Run Code Online (Sandbox Code Playgroud)

我想要一份副本; 我的代码是:

val it2 = it.toList.iterator
Run Code Online (Sandbox Code Playgroud)

这是正确的,但似乎并不好.有没有其他API可以做到这一点?

iterator scala

17
推荐指数
2
解决办法
3269
查看次数

Python正则表达式,在地址中查找电子邮件域

我知道我是个白痴,但我不能从这个电子邮件地址中删除该域名:

'blahblah@gmail.com'
Run Code Online (Sandbox Code Playgroud)

我想要的输出:

'@gmail.com'
Run Code Online (Sandbox Code Playgroud)

我目前的输出:

.
Run Code Online (Sandbox Code Playgroud)

(这只是一个时期角色)

这是我的代码:

import re
test_string = 'blahblah@gmail.com'
domain = re.search('@*?\.', test_string)
print domain.group()
Run Code Online (Sandbox Code Playgroud)

这是我认为我的正则表达式('@*?.',test_string):

 ' # begin to define the pattern I'm looking for (also tell python this is a string)

  @ # find all patterns beginning with the at symbol ("@")

  * # find all characters after ampersand

  ? # find the last character before the period

  \ # breakout (don't use the next character as a wild card, us it is a …
Run Code Online (Sandbox Code Playgroud)

python regex email dns search

16
推荐指数
3
解决办法
3万
查看次数

如何将时间转换为纪元时间?

假设我有一个特定的时刻,我知道小时,分钟,日,秒,月,年等; 我如何转换这个纪元时间(自1970年以来的秒数)?

我不能使用Boost,所以请不要建议Boost解决方案.

c++ time

15
推荐指数
2
解决办法
2万
查看次数

将新数据附加到分区的镶木地板文件

我正在编写一个ETL过程,我需要读取每小时的日志文件,对数据进行分区并保存.我正在使用Spark(在Databricks中).日志文件是CSV,因此我阅读它们并应用模式,然后执行我的转换.

我的问题是,如何将每小时的数据保存为镶木地板格式,但是附加到现有数据集?保存时,我需要按数据框中的4列进行分区.

这是我的保存行:

data
    .filter(validPartnerIds($"partnerID"))
    .write
    .partitionBy("partnerID","year","month","day")
    .parquet(saveDestination)
Run Code Online (Sandbox Code Playgroud)

问题是如果目标文件夹存在,则save会抛出错误.如果目的地不存在,那么我不会附加我的文件.

我尝试过使用.mode("append")但我发现Spark有时会在中途失败,所以我最终失去了我的数据写入量以及我还需要写多少.

我正在使用镶木地板,因为分区大大增加了我将来的查询.同样,我必须将数据写为磁盘上的某种文件格式,并且不能使用像Druid或Cassandra这样的数据库.

非常感谢有关如何划分我的数据帧和保存文件(坚持镶木地板或其他格式)的任何建议.

scala append apache-spark parquet

15
推荐指数
1
解决办法
1万
查看次数

RTTI与例外之间是否存在关联?

我记得在禁用了RTTI和异常的平台上编码,而在其他启用了它们的平台上编码.但是,我不记得在一个能够启用一个并禁用另一个的平台上进行编码.

这两个概念之间是否存在任何依赖关系?换句话说,异常需要RTTI才能运行吗?或者相反?

c++ exception rtti

13
推荐指数
2
解决办法
3621
查看次数

使用Clang的扫描构建与scons和C++ 11

我已经添加了一切,我$PATH和我调整SConstruct设置适当的环境变量,按照这些答案[ 1,2,3 ].现在我跑的时候

scan-build --use-c++=`which clang++` scons
Run Code Online (Sandbox Code Playgroud)

构建开始,我可以看到分叉的过程scons

/path/to/c++-analyzer ... -std=c++11 ...
Run Code Online (Sandbox Code Playgroud)

目标文件成功构建,但后来出现错误:

could not find clang line
Run Code Online (Sandbox Code Playgroud)

c++-analyzer分叉进程不包含字符串时会发生此错误-cc1.但如果我检查ps aux,我清楚地看到

/path/to/clang -cc1 ...
Run Code Online (Sandbox Code Playgroud)

程序如何正确构建,但静态分析器会失败?


作为参考,如果我手动运行

scan-build clang++ <parameters from scons>
Run Code Online (Sandbox Code Playgroud)

然后构建成功并生成报告!

我也可以通过添加来"欺骗"

env["ENV"]["PATH"] = os.environ["PATH"]
Run Code Online (Sandbox Code Playgroud)

然后跑

CXX="scan-build clang++" scons
Run Code Online (Sandbox Code Playgroud)

我不能scan-build在没有scons修改的情况下自行运行SConstruct.

c++ clang scons c++11 scan-build

13
推荐指数
1
解决办法
3746
查看次数

无法在pandas 0.14.0中查询局部变量

我可以查询一个显式值:

fills.query('Symbol=="BUD US"')
Run Code Online (Sandbox Code Playgroud)

现在我想查询一个变量:

In [40]: my_symbol
Out[40]: 'BUD US'
Run Code Online (Sandbox Code Playgroud)

在pandas 0.13.1中,我可以简单地使用:

fills.query('Symbol==my_symbol')
Run Code Online (Sandbox Code Playgroud)

pandas 0.14.0中不再允许这样做,因为必须明确引用局部变量.所以我试过了

fills.query('Symbol==@my_symbol')
Run Code Online (Sandbox Code Playgroud)

但是这返回了一个错误

KeyError: '__pd_eval_local_my_symbol'
Run Code Online (Sandbox Code Playgroud)

我能够更改我的其他一些代码以使用显式局部变量,但这个不会采用.有什么想法吗?dtype是object,如果有帮助的话.

python pandas

13
推荐指数
2
解决办法
8076
查看次数

Linux中的多个巨页大小(x86-64)?

Linux on x86-64是否支持多个巨大的页面大小(例如,超过4KB基页大小的2MB和1GB页面大小)?如果是,是否有办法为给定的分配指定使用哪个巨大的页面大小?换句话说,我的问题是,如果使用"MAP_HUGETLB"标志mmap(),它将它们分配映射到默认大小的大页面.无论如何要求将分配映射到非默认的巨页大小?

linux-kernel tlb mmu

12
推荐指数
1
解决办法
2691
查看次数

如何让gcc警告返回局部变量的地址?

gcc4.4.5中,我发出以下代码的警告.

char *f(void)
{
    char c;
    return &c;
}
Run Code Online (Sandbox Code Playgroud)

但是,当我使用临时指针时,不再有警告(即使行为是错误的).

char *f(void)
{
    char c;
    char *p = &c;
    return p;
}
Run Code Online (Sandbox Code Playgroud)

我听说在C中指针分析很困难,但可以gcc警告这样的代码吗?

c gcc gcc-warning

12
推荐指数
1
解决办法
3478
查看次数

无法为Mac OS X加载本机hadoop库

我在Mac OS X中使用Hadoop.我认为我正确安装了Hadoop.当我尝试运行示例WordCount问题时,我收到此错误:

INFO util.NativeCodeLoader - 无法为您的平台加载native-hadoop库...使用适用的builtin-java类

从谷歌搜索此错误,我了解到Mac OS不支持Hadoop本机库.

有没有办法使用某些第三方软件加载Native Hadoop Library for Mac?

macos hadoop static-libraries

12
推荐指数
1
解决办法
1万
查看次数