小编cei*_*cat的帖子

如何将命令的输出分配到数组中?

我需要将结果从a分配grep给一个数组......例如

grep -n "search term" file.txt | sed 's/:.*//'
Run Code Online (Sandbox Code Playgroud)

这导致了一系列行号,其中找到了搜索词.

1
3
12
19
Run Code Online (Sandbox Code Playgroud)

将它们分配给bash数组的最简单方法是什么?如果我只是将它们分配给变量,它们就会变成一个以空格分隔的字符串.

arrays bash command-substitution

63
推荐指数
3
解决办法
8万
查看次数

如何在保留列的顺序的同时创建DataFrame?

如何在保留列顺序的同时从多个numpy数组,Pandas系列或PandasDataFrame 创建DataFrame ?

例如,我有这两个numpy数组,我想将它们组合为一个PandasDataFrame.

foo = np.array( [ 1, 2, 3 ] )
bar = np.array( [ 4, 5, 6 ] )
Run Code Online (Sandbox Code Playgroud)

如果我这样做,bar列将首先出现,因为dict不保留顺序.

pd.DataFrame( { 'foo': pd.Series(foo), 'bar': pd.Series(bar) } )

    bar foo
0   4   1
1   5   2
2   6   3
Run Code Online (Sandbox Code Playgroud)

我可以这样做,但是当我需要组合许多变量时,它会变得乏味.

pd.DataFrame( { 'foo': pd.Series(foo), 'bar': pd.Series(bar) }, columns = [ 'foo', 'bar' ] )
Run Code Online (Sandbox Code Playgroud)

编辑:有没有办法指定要连接的变量并在一个操作中组织列顺序?也就是说,我不介意使用多行来完成整个操作,但我宁愿不必多次指定要连接的变量(因为我会更改代码很多,这很容易出错) .

EDIT2:还有一点.如果我想添加或删除其中一个要加入的变量,我只想在一个地方添加/删除.

python pandas

40
推荐指数
4
解决办法
2万
查看次数

删除超出xlim和ylim的额外空间

我想制作一个密度图,使轴与刻度线相邻(或至少非常接近).如本MWE所示,ggplot2即使我指定了xlim和,也保留了刻度线和x轴和y轴上的轴之间的一些空间ylim.我该如何删除它们?

对于其他类型的图,看起来你可以调用类似的东西scale_y_continuous(limits=c(0, 100), expand = c(0, 0))(例如),但scale_linetype_manual()使用这些参数调用似乎没有做任何事情.

另请注意,在这里的注释中我使用了绘制轴geom_segment.有一个更好的方法吗?

set.seed(0)
the.df <- data.frame( x = rnorm(800, 50, 10), group = rep(letters[1:8], each = 100))

p <- ggplot(the.df) + 
    stat_density(aes(x = x, linetype = group), geom = "line", position = "identity") +
    xlim(10, 90) + ylim(0, 0.06) +
    scale_linetype_manual(values = c("11", "12", "13", "14", "21", "22", "23", "24")) +
    geom_segment(aes(x = 10, y = 0, xend = 90, …
Run Code Online (Sandbox Code Playgroud)

r ggplot2

19
推荐指数
2
解决办法
9772
查看次数

如何在PySpark中存储?

例如,我想DataFrame根据年龄将一个人分为以下4个箱子.

age_bins = [0, 6, 18, 60, np.Inf]
age_labels = ['infant', 'minor', 'adult', 'senior']
Run Code Online (Sandbox Code Playgroud)

我会pandas.cut()用来做这个pandas.我该怎么办PySpark

pyspark

17
推荐指数
2
解决办法
7556
查看次数

命令行递归的基于字的差异?

是否有一个命令行程序,提供递归的基于字的差异(在2个目录上)?

diff -u是递归的,但它没有逐字逐句比较.wdiff并且dwdiff基于单词的diff,但没有内置的递归diff选项.

我想将结果传递给colordiff一个生成输出的程序,该输出可以colordiff理解特别有用.有什么建议?谢谢!

CC

word-diff

13
推荐指数
1
解决办法
1514
查看次数

有没有办法在jupyter的"查找和替换"中默认为"替换所有单元格"?

我通常想要找到并替换所有,但看起来它只被设置为当前/突出显示的单元格(https://github.com/jupyter/notebook/pull/2131).对话框消失后,jupyter也不记得该选项.有没有办法改变这种行为?谢谢.

jupyter jupyter-notebook

12
推荐指数
4
解决办法
7784
查看次数

有没有办法跳到Jupyter最后编辑过的单元格?

经常在Jupyter中,我会移动到笔记本的不同部分看一些东西,当我完成后,我想跳回到我以前工作的地方.现在我必须导航到最接近的Markdown部分(通过Jupyter Notebook Extensions)并向上或向下移动以到达我所在的位置.有没有办法直接跳转到我编辑的最后一个单元格(最好是通过键盘快捷键)?谢谢!

jupyter-notebook

10
推荐指数
1
解决办法
261
查看次数

在版本控制中逐字责备/注释?

是否有可能在版本控制中重建逐字历史记录?理想情况下,我想做的事情就像1)我指出感兴趣的行的范围,2)让程序找出以前版本中的相应行号,因为代码经常在版本之间上下移动(可能限制了版本范围,比如自19版以来,或者从一周前开始),3)打印出逐字逐句的历史记录,可以是最后一次更改单词组的版本,也可以是更改单词组的作者.所以它有点像svn blame或者git blame在逐字的层面.

如果做不到的话,是否有可以做#1和#2的工具?也就是说,1)我指出感兴趣的行的范围,2)让程序找出先前版本中的相应行号,3)程序将打印出这些行的历史(当有变化时).

svn或git对我来说真的很有帮助.

svn git blame

9
推荐指数
1
解决办法
418
查看次数

如何从R中的strsplit()获取空的最后一个元素?

我需要处理一些主要是csv的数据.问题是如果它出现在行的末尾(例如,下面示例中的3之后的那个),则R忽略逗号.

> strsplit("1,2,3,", ",")
[[1]]
[1] "1" "2" "3"
Run Code Online (Sandbox Code Playgroud)

[1] "1" "2" "3" NA相反,我希望将其读入.我怎样才能做到这一点?谢谢.

csv string r strsplit

9
推荐指数
2
解决办法
1699
查看次数

如何等待dojo的元素存在?

在dojo中,有没有办法在创建某个类(或包含某些文本)的元素时收到通知?

这里提出的jQuery 几乎完全相同.但是我想知道dojo是否有类似的解决方案.谢谢!

javascript dojo

7
推荐指数
1
解决办法
1128
查看次数