小编cei*_*cat的帖子

如何将命令的输出分配到数组中？

我需要将结果从a分配grep给一个数组......例如

grep -n "search term" file.txt | sed 's/:.*//'

Run Code Online (Sandbox Code Playgroud)

这导致了一系列行号,其中找到了搜索词.

Run Code Online (Sandbox Code Playgroud)

将它们分配给bash数组的最简单方法是什么？如果我只是将它们分配给变量,它们就会变成一个以空格分隔的字符串.

arrays bash command-substitution

cei*_*cat

2015 10-13

63
推荐指数

3
解决办法

8万
查看次数

如何在保留列的顺序的同时创建DataFrame？

如何在保留列顺序的同时从多个numpy数组,Pandas系列或PandasDataFrame 创建DataFrame ？

例如,我有这两个numpy数组,我想将它们组合为一个PandasDataFrame.

foo = np.array( [ 1, 2, 3 ] )
bar = np.array( [ 4, 5, 6 ] )

Run Code Online (Sandbox Code Playgroud)

如果我这样做,bar列将首先出现,因为dict不保留顺序.

pd.DataFrame( { 'foo': pd.Series(foo), 'bar': pd.Series(bar) } )

    bar foo
0   4   1
1   5   2
2   6   3

Run Code Online (Sandbox Code Playgroud)

我可以这样做,但是当我需要组合许多变量时,它会变得乏味.

pd.DataFrame( { 'foo': pd.Series(foo), 'bar': pd.Series(bar) }, columns = [ 'foo', 'bar' ] )

Run Code Online (Sandbox Code Playgroud)

编辑:有没有办法指定要连接的变量并在一个操作中组织列顺序？也就是说,我不介意使用多行来完成整个操作,但我宁愿不必多次指定要连接的变量(因为我会更改代码很多,这很容易出错) .

EDIT2:还有一点.如果我想添加或删除其中一个要加入的变量,我只想在一个地方添加/删除.

python pandas

cei*_*cat

2016 04-11

40
推荐指数

4
解决办法

2万
查看次数

删除超出xlim和ylim的额外空间

我想制作一个密度图,使轴与刻度线相邻(或至少非常接近).如本MWE所示,ggplot2即使我指定了xlim和,也保留了刻度线和x轴和y轴上的轴之间的一些空间ylim.我该如何删除它们？

对于其他类型的图,看起来你可以调用类似的东西scale_y_continuous(limits=c(0, 100), expand = c(0, 0))(例如),但scale_linetype_manual()使用这些参数调用似乎没有做任何事情.

另请注意,在这里的注释中我使用了绘制轴geom_segment.有一个更好的方法吗？

set.seed(0)
the.df <- data.frame( x = rnorm(800, 50, 10), group = rep(letters[1:8], each = 100))

p <- ggplot(the.df) + 
    stat_density(aes(x = x, linetype = group), geom = "line", position = "identity") +
    xlim(10, 90) + ylim(0, 0.06) +
    scale_linetype_manual(values = c("11", "12", "13", "14", "21", "22", "23", "24")) +
    geom_segment(aes(x = 10, y = 0, xend = 90, …

Run Code Online (Sandbox Code Playgroud)

r ggplot2

cei*_*cat

2017 05-23

19
推荐指数

2
解决办法

9772
查看次数

如何在PySpark中存储？

例如,我想DataFrame根据年龄将一个人分为以下4个箱子.

age_bins = [0, 6, 18, 60, np.Inf]
age_labels = ['infant', 'minor', 'adult', 'senior']

Run Code Online (Sandbox Code Playgroud)

我会pandas.cut()用来做这个pandas.我该怎么办PySpark？

pyspark

cei*_*cat

2018 08-14

17
推荐指数

2
解决办法

7556
查看次数

命令行递归的基于字的差异？

是否有一个命令行程序,提供递归的基于字的差异(在2个目录上)？

diff -u是递归的,但它没有逐字逐句比较.wdiff并且dwdiff基于单词的diff,但没有内置的递归diff选项.

我想将结果传递给colordiff一个生成输出的程序,该输出可以colordiff理解特别有用.有什么建议？谢谢!

word-diff

cei*_*cat

2011 05-05

13
推荐指数

1
解决办法

1514
查看次数

有没有办法在jupyter的"查找和替换"中默认为"替换所有单元格"？

我通常想要找到并替换所有,但看起来它只被设置为当前/突出显示的单元格(https://github.com/jupyter/notebook/pull/2131).对话框消失后,jupyter也不记得该选项.有没有办法改变这种行为？谢谢.

jupyter jupyter-notebook

cei*_*cat

lucky-day

12
推荐指数

4
解决办法

7784
查看次数

有没有办法跳到Jupyter最后编辑过的单元格？

经常在Jupyter中,我会移动到笔记本的不同部分看一些东西,当我完成后,我想跳回到我以前工作的地方.现在我必须导航到最接近的Markdown部分(通过Jupyter Notebook Extensions)并向上或向下移动以到达我所在的位置.有没有办法直接跳转到我编辑的最后一个单元格(最好是通过键盘快捷键)？谢谢!

jupyter-notebook

cei*_*cat

lucky-day

10
推荐指数

1
解决办法

261
查看次数

在版本控制中逐字责备/注释？

是否有可能在版本控制中重建逐字历史记录？理想情况下,我想做的事情就像1)我指出感兴趣的行的范围,2)让程序找出以前版本中的相应行号,因为代码经常在版本之间上下移动(可能限制了版本范围,比如自19版以来,或者从一周前开始),3)打印出逐字逐句的历史记录,可以是最后一次更改单词组的版本,也可以是更改单词组的作者.所以它有点像svn blame或者git blame在逐字的层面.

如果做不到的话,是否有可以做#1和#2的工具？也就是说,1)我指出感兴趣的行的范围,2)让程序找出先前版本中的相应行号,3)程序将打印出这些行的历史(当有变化时).

svn或git对我来说真的很有帮助.

svn git blame

cei*_*cat

lucky-day

9
推荐指数

1
解决办法

418
查看次数

如何从R中的strsplit()获取空的最后一个元素？

我需要处理一些主要是csv的数据.问题是如果它出现在行的末尾(例如,下面示例中的3之后的那个),则R忽略逗号.

> strsplit("1,2,3,", ",")
[[1]]
[1] "1" "2" "3"

Run Code Online (Sandbox Code Playgroud)

[1] "1" "2" "3" NA相反,我希望将其读入.我怎样才能做到这一点？谢谢.

csv string r strsplit

cei*_*cat

2014 11-03

9
推荐指数

2
解决办法

1699
查看次数

如何等待dojo的元素存在？

在dojo中,有没有办法在创建某个类(或包含某些文本)的元素时收到通知？

这里提出的jQuery 几乎完全相同.但是我想知道dojo是否有类似的解决方案.谢谢!

javascript dojo

cei*_*cat

2017 05-23

7
推荐指数

1
解决办法

1128
查看次数

标签统计

jupyter-notebook ×2

r ×2

arrays ×1

bash ×1

blame ×1

command-substitution ×1

csv ×1

dojo ×1

ggplot2 ×1

git ×1

javascript ×1

jupyter ×1

pandas ×1

pyspark ×1

python ×1

string ×1

strsplit ×1

svn ×1

word-diff ×1

标签 统计

小编cei_cat的帖子

标签统计