小编Ada*_*ski的帖子

如何在Ansible中获取任意远程用户的主目录?

我可以使用shell getentawk这样的组合来做到这一点:

getent passwd $user | awk -F: '{ print $6 }'
Run Code Online (Sandbox Code Playgroud)

作为参考,在Puppet中我可以使用自定义事实,如下所示:

require 'etc'

Etc.passwd { |user|

   Facter.add("home_#{user.name}") do
      setcode do
         user.dir
      end
   end

}
Run Code Online (Sandbox Code Playgroud)

这使得用户的主目录可用作home_<user name>事实.

如何获取任意远程用户的主目录?

ansible ansible-facts

65
推荐指数
5
解决办法
6万
查看次数

连接路径的功能?

是否存在连接路径的现有功能?

我知道这并不难实现,但仍...除了照顾尾随/(或\)我需要(我们是否写即照顾适当的操作系统路径格式检测C:\dir\file/dir/file).

正如我所说,我相信我知道如何实施它; 问题是:我应该这样做吗?现有R包中是否已存在功能?

r concatenation path

55
推荐指数
2
解决办法
3万
查看次数

如何从公式对象中可靠地获取因变量名?

假设我有以下公式:

myformula<-formula("depVar ~ Var1 + Var2")
Run Code Online (Sandbox Code Playgroud)

如何从公式对象中可靠地获取因变量名?

我找不到任何用于此目的的内置函数.我知道这样as.character(myformula)[[2]]可行

sub("^(\\w*)\\s~\\s.*$","\\1",deparse(myform))
Run Code Online (Sandbox Code Playgroud)

在我看来,这些方法更像是一种hackery,而不是一种可靠而标准的方法.


有没有人知道如何使用的确切方法lm?我已经看过它的代码,但对我来说有点神秘...这里有一个方便的引用:

    > lm
function (formula, data, subset, weights, na.action, method = "qr", 
    model = TRUE, x = FALSE, y = FALSE, qr = TRUE, singular.ok = TRUE, 
    contrasts = NULL, offset, ...) 
{
    ret.x <- x
    ret.y <- y
    cl <- match.call()
    mf <- match.call(expand.dots = FALSE)
    m <- match(c("formula", "data", "subset", "weights", "na.action", 
        "offset"), names(mf), 0L)
    mf <- mf[c(1L, m)]
    mf$drop.unused.levels <- TRUE
    mf[[1L]] <- …
Run Code Online (Sandbox Code Playgroud)

r

36
推荐指数
4
解决办法
1万
查看次数

如何将元组转换为namedtuple?

我想在内部使用namedtuples,但我希望保持与给我一个普通元组的用户的兼容性.

from collections import namedtuple

tuplePi=(1,3.14,"pi") #Normal tuple 

Record=namedtuple("MyNamedTuple", ["ID", "Value", "Name"])

namedE=Record(2, 2.79, "e") #Named tuple

namedPi=Record(tuplePi) #Error
TypeError: __new__() missing 2 required positional arguments: 'Value' and 'Name'

tuplePi.__class__=Record
TypeError: __class__ assignment: only for heap types
Run Code Online (Sandbox Code Playgroud)

python namedtuple python-3.x

27
推荐指数
1
解决办法
7136
查看次数

numpy.ndarray vs pandas.DataFrame

我需要做出一个战略决策,选择在我的程序中保存统计数据框架的数据结构的基础.

我在一张大桌子上存储了数十万条记录.每个字段都是不同的类型,包括短字符串.我会对需要快速实时完成的数据进行多元回归分析和操作.我还需要使用一些相对受欢迎且得到很好支持的东西.

我知道以下参赛者:

清单 array.array

这是最基本的事情.不幸的是它不支持字符串.而且我还需要使用numpy作为统计部分,所以这个是不可能的.

numpy.ndarray

ndarray具有能力以保持不同类型的数组中的每一列(例如np.dtype([('name', np.str_, 16), ('grades', np.float64, (2,))])).这似乎是一个天生的赢家,但......

pandas.DataFrame

这个是在考虑统计用途的情况下构建的,但它是否足够有效?

我看,那pandas.DataFrame就是不再基础上numpy.ndarray(虽然它共享相同的接口).任何人都可以对此有所了解吗?或者可能有更好的数据结构?

python numpy python-3.x pandas

15
推荐指数
1
解决办法
2万
查看次数

如何在sed中组合三个连续的文本文件行?

我有一个文件,包含三行的重复序列,我想合并在一起.换句话说,我想把除了第三个以外的每一个都替换\n成空间.我想要变换输入

 href="file:///home/adam/MyDocs/some_file.pdf"
 visited="2013-06-02T20:40:06Z"
 exec="'firefox %u'"
 href="file:///home/adam/Desktop/FreeRDP-WebConnect-1.0.0.167-Setup.exe"
 visited="2013-06-03T08:50:37Z"
 exec="'firefox %u'"
 href="file:///home/adam/Friends/contact.txt"
 visited="2013-06-03T16:01:16Z"
 exec="'gedit %u'"
 href="file:///home/adam/Pictures/Screenshot%20from%202013-06-03%2019:10:36.png"
 visited="2013-06-03T17:10:36Z"
 exec="'eog %u'"
Run Code Online (Sandbox Code Playgroud)

 href="file:///home/adam/MyDocs/some_file.pdf" visited="2013-06-02T20:40:06Z" exec="'firefox %u'"
 href="file:///home/adam/Desktop/FreeRDP-WebConnect-1.0.0.167-Setup.exe" visited="2013-06-03T08:50:37Z" exec="'firefox %u'"
 href="file:///home/adam/Friends/contact.txt" visited="2013-06-03T16:01:16Z" exec="'gedit %u'"
 href="file:///home/adam/Pictures/Screenshot%20from%202013-06-03%2019:10:36.png" visited="2013-06-03T17:10:36Z" exec="'eog %u'"
Run Code Online (Sandbox Code Playgroud)

不幸的是文件很长,所以我不想将整个文件加载到内存中而不是将结果写回文件 - 只需将连接的行打印到标准输出中,这样我就可以进一步管理它.

我知道,潜在 sed可能只是为它工作,但我给了它一个诚实的尝试后,我仍在原地踏步; 学习曲线对我来说太陡了.:-(


我做了一个粗略的基准测试,我发现,sed变体几乎快了两倍.

time awk '{ printf "%s", $0; if (NR % 3 == 0) print ""; else printf " " }' out.txt >/dev/null

real    0m1.893s
user    0m1.860s
sys     0m0.028s
Run Code Online (Sandbox Code Playgroud)

time cat out.txt | sed …
Run Code Online (Sandbox Code Playgroud)

sed

14
推荐指数
2
解决办法
1万
查看次数

如何在远程服务器上轻松执行R命令?

我在Windows上使用Excel + R在一个相当慢的桌面上.我有一个完全的管理员访问非常快速的基于Ubuntu的服务器.我想知道:如何在服务器上远程执行命令?

我能做的是保存所需的变量saveRDS,并在服务器上加载它们,在服务器上loadRDS执行命令,然后保存结果并在Windows上加载它们.

但这一切都非常具有互动性和手动性,很难定期完成.

有没有办法直接从R做这些东西,比如

  1. 通过例如ssh与服务器连接,
  2. 传输所需的对象(可以手动指定)
  3. 在服务器上执行给定代码并等待结果
  4. 得到结果.

我可以远程运行整个R,但随后它会产生与网络相关的问题.我在Excel中执行的大多数R命令都非常快且数据量很大.我只需要远程执行一些特定的命令,而不是所有命令.

r remote-access

11
推荐指数
2
解决办法
2万
查看次数

如何在R源文件上用RStudio拼写检查R评论?

如何在R源文件上用RStudio方便地拼写R评论?

我正在写一个包,我希望它看起来很专业.感谢Oxygen,所有软件包的文档都存在于R注释中,默认情况下不包括在拼写检查中.因此,即使RStudio中存在拼写检查功能,我也不知道如何使用它.

rstudio

9
推荐指数
1
解决办法
862
查看次数

如何在SAS Enterprise Guide中调用另一个宏程序?

是否有任何宏命令允许从另一个程序调用一个程序(%run_program()伪代码)?

程序"设置":

%let myvar="HELLO WORLD!";
Run Code Online (Sandbox Code Playgroud)

计划"计划":

%run_program(Settings); *Pseudo-code;
%put &myvar; *Should print *Should print "HELLO WORLD!";
Run Code Online (Sandbox Code Playgroud)

概观

sas enterprise-guide

7
推荐指数
1
解决办法
2801
查看次数

如何声明一个具有 N 个 double 类型参数的函数?

我想要一个能够存储接受“N”个双参数的功能对象的类模板。此伪代码使用一个不存在的std::repeated_type函数模板来解决问题并说明预期用法:

template<int N>
class FunctionHolder {
public:
   using function_type = std::function<int(std::repeated_type<double, N> args)>;
   FunctionHolder(const function_type& arg): m_func(arg) {}
private:
   const function_type& m_func;
};

int my_func(double arg1, double arg2);

void main() {
   FunctionHolder<2> my_holder(my_func);  
}
Run Code Online (Sandbox Code Playgroud)

我希望代码尽可能简单且可读,因此即使我模糊地理解我可以使用 std::integer_sequence 和辅助类模板来缝合解决方案,但我不相信我的解决方案足够简单。

c++ template-meta-programming

7
推荐指数
4
解决办法
470
查看次数