小编Nic*_*ick的帖子

是否有用于查找模式的内置功能?

在R中,mean()median()是标准函数,可以满足您的期望. mode()告诉您对象的内部存储模式,而不是其参数中出现最多的值.但是有一个标准的库函数来实现向量(或列表)的统计模式吗?

statistics r r-faq

370
推荐指数
14
解决办法
25万
查看次数

连接字符串/字符的向量

如果我有一个字符类型的向量,我如何将值连接成字符串?这是我用paste()做的方法:

sdata = c('a', 'b', 'c')
paste(sdata[1], sdata[2], sdata[3], sep ='')
Run Code Online (Sandbox Code Playgroud)

屈服"abc".

但是,当然,这只有在我提前了解sdata的长度时才有效.

string r r-faq

241
推荐指数
6
解决办法
26万
查看次数

将对象附加到R中的列表中,以分摊的常量时间O(1)?

如果我有一些R列表mylist,你可以obj像这样附加一个项目:

mylist[[length(mylist)+1]] <- obj
Run Code Online (Sandbox Code Playgroud)

但肯定有一些更紧凑的方式.当我在R的新人时,我尝试这样写lappend():

lappend <- function(lst, obj) {
    lst[[length(lst)+1]] <- obj
    return(lst)
}
Run Code Online (Sandbox Code Playgroud)

但是当然由于R的逐个调用语义而无法正常工作(lst在调用时有效复制,所以更改lst在范围之外是不可见的lappend().我知道你可以在R函数中做环境黑客攻击到达外部你的函数范围和mutate调用环境,但这似乎是一个大锤子写一个简单的追加函数.

任何人都可以建议一个更美丽的方式吗?奖励点,如果它适用于矢量和列表.

performance big-o r list append

235
推荐指数
8
解决办法
30万
查看次数

你如何以编程方式设置属性?

假设我有一个Python对象x和一个字符串s,我怎么设置属性sx?所以:

>>> x = SomeObject()
>>> attr = 'myAttr'
>>> # magic goes here
>>> x.myAttr
'magic'
Run Code Online (Sandbox Code Playgroud)

什么是魔术?顺便说一下,这个目的是缓存呼叫x.__getattr__().

python attributes object

188
推荐指数
3
解决办法
19万
查看次数

控制R散点图中点的大小?

在R中,plot()函数采用pch控制图中点的外观的参数.我正在制作具有数万个点的散点图,并且更喜欢一个小的但不是太小的点.基本上,我觉得pch='.'太小了,但pch=19太胖了.有什么东西在中间或某种方式来缩小点以某种方式?

plot r scatter-plot

110
推荐指数
3
解决办法
27万
查看次数

如何在python中取消反斜杠转义字符串?

假设我有一个字符串,它是另一个字符串的反斜杠转义版本.在Python中,有一种简单的方法可以解除字符串的问题吗?例如,我可以这样做:

>>> escaped_str = '"Hello,\\nworld!"'
>>> raw_str = eval(escaped_str)
>>> print raw_str
Hello,
world!
>>> 
Run Code Online (Sandbox Code Playgroud)

但是,这涉及将(可能不受信任的)字符串传递给eval(),这是一个安全风险.标准库中是否有一个函数,它接受一个字符串并产生一个没有安全隐患的字符串?

python string escaping

89
推荐指数
5
解决办法
5万
查看次数

如何告诉Subversion将文件视为二进制文件?

如何告诉Subversion(svn)将文件视为二进制文件?

svn

64
推荐指数
5
解决办法
8万
查看次数

如何在Python列表推导中有效地过滤计算值?

Python列表理解语法可以轻松地在理解中过滤值.例如:

result = [x**2 for x in mylist if type(x) is int]
Run Code Online (Sandbox Code Playgroud)

将返回mylist中整数的平方列表.但是,如果测试涉及一些(昂贵的)计算并且您想要对结果进行过滤,该怎么办?一种选择是:

result = [expensive(x) for x in mylist if expensive(x)]
Run Code Online (Sandbox Code Playgroud)

这将导致非"虚假"昂贵(x)值的列表,但是每个x调用两次昂贵的().是否有一种理解语法允许您进行此测试,而每次只调用一次昂贵的一次?

python list-comprehension

21
推荐指数
5
解决办法
7294
查看次数

你需要创建一个分支来检查特定的git修订吗?

我想做的一件好事是将我的工作副本还原到特定版本,进行一些测试,然后将其恢复到我当前主人的头部.在过去,我天真地做了一个"git checkout hash"只是为了失去理智.我已经知道我可以创建一个分支并检查出来,切换回来并删除分支,但感觉就像进行简单检查的步骤太多了.在SVN的说法中,有没有办法快速恢复然后快速回到git中的trunk端?

编辑:我认为我的困惑源于这样一个事实,当我签出一个哈希然后git日志时,我没有看到签出哈希后发生的变化(这是合理的,当你想到它).但接受的答案是正确的; "git checkout branch"将恢复到前一个分支的头部.

git

21
推荐指数
2
解决办法
2万
查看次数

是否有Python库函数试图猜测某些字节的字符编码?

我正在用Python编写一些邮件处理软件,它在头字段中遇到奇怪的字节.我怀疑这只是畸形邮件; 消息本身声称是us-ascii,所以我不认为有一个真正的编码,但我想得到一个unicode字符串近似原始的字符串而不抛出一个UnicodeDecodeError.

所以,我正在寻找一个功能,它需要一个str可选的一些提示,并且最好给我一个回复unicode.我当然可以写一个,但是如果存在这样一个函数,那么作者可能已经想到了更好的方法来解决这个问题.

我也知道Python的设计更喜欢显式到隐式,并且标准库旨在避免解码文本中的隐含魔法.我只想明确说"继续猜测".

python email invalid-characters character-encoding

15
推荐指数
3
解决办法
8222
查看次数