我有一个Perl脚本,它给我一个定义的列表随机数,对应于文件的行.我接下来要做的是使用从文件中提取这些行sed.
#!/bin/bash
count=$(cat last_queries.txt | wc -l)
var=$(perl test.pl test2 $count)
Run Code Online (Sandbox Code Playgroud)
该变量var返回如下输出:cat last_queries.txt | sed -n '12p;500p;700p'.问题是我无法运行最后一个命令.我试过$var但输出不正确(如果我手动运行命令它工作正常,所以没有问题).这样做的正确方法是什么?
PS:当然我可以在Perl中完成所有工作,但我正在尝试学习这种方式,因为它可以在其他情况下帮助我.
在R中是否有某种方法可以在没有任何中断的情况下按照定义的间隔进
例如,如果我想要精确区间[1,10]中的值; 默认情况下cut,将此间隔分成较小的间隔.
我有一些脚本,我使用R的批处理模式运行.
/usr/bin/R CMD BATCH --vanilla --no-timing ~/scripts/R/sess_dur.R
Run Code Online (Sandbox Code Playgroud)
我使用以下方法将输出重定向到文件:
> sink("~/scripts_output/R_output.txt",append=TRUE)
Run Code Online (Sandbox Code Playgroud)
问题是,当我运行此脚本时,将使用相同的脚本名称和"out"后缀(sess_dur.Rout)创建文件.
有一种方法告诉R不要生成这些文件?
可以ggplot2绘制第二个"轴"标签,将X和Y值的百分比相关联.

编辑:
我有一个data.frame有两个vars,相关和百分比.我想展示与V2相关的V1的演变; 例如,我需要多少百分比的V2才能获得20%的V1(反之亦然).
V1 V2
0 0
0.03 0.0005
0.10 0.0015
0.13 0.0020
....
1 1
Run Code Online (Sandbox Code Playgroud)
现在我的问题是如何在X和Y上做那个内轴,显示X和Y百分比之间的关系.另外我如何设置ggplot使用(0,0)作为x轴和y轴的截距?
我有一个文件,每行有一个短语/术语,我从STDIN读到perl.我有一个停用词列表(如"á","são","é"),我希望将每个词与每个词进行比较,如果它们相等则删除.问题是我不确定文件的编码格式.
我从file命令中得到了这个:
words.txt: Non-ISO extended-ASCII English text
Run Code Online (Sandbox Code Playgroud)
我的linux终端是UTF-8,它显示了某些单词的正确内容,而其他单词则没有.以下是其中一些的输出:
condi<E3>
conte<FA>dos
ajuda, mas não resolve
mo<E7>ambique
pedagógico são fenómenos
Run Code Online (Sandbox Code Playgroud)
您可以看到第3行和第5行正确识别带有重音符和特殊字符的单词,而其他行则没有.其他行的正确输出应为:condiã,conteúdos和moçambique.
如果我使用binmode(STDOUT, utf8)"错误"行现在正确输出而其他人没有.例如第3行:
ajuda,masnão决心
我该怎么办?
我有三个具有此结构的数据帧(但值不同):
V1 V2
2010-04-30 30
2010-07-31 17
2010-10-02 20
Run Code Online (Sandbox Code Playgroud)
我想在ggplot2中用3行做一个折线图,每个数据集对应一行.问题是我想在Y轴上显示相对于每个数据集而不是全局数据集的百分比.
我怎样才能做到这一点?我应该合并两个数据帧,还是为不同的数据帧调用三次geom_line()并更改Y值?
我有一个前端应用程序,我称之为PHP脚本(让我们称之为script.php)需要一些时间才能完成.我想(在客户端)显示已完成的百分比.
在文件script.php上我可以随时计算完成的作业百分比.我搜索了一下,可能的解决方案应该是:
我的问题是如何在脚本和其他php文件之间获得并"共享"这个百分比值,以便在客户端显示.
我有什么选择使用JQuery/AJAX(我试图避免使用缓存的解决方案).
谢谢
我有一个4.5MB(9,223,136行)的文件,其中包含以下信息:
0 0
0.0147938 3.67598e-07
0.0226194 7.35196e-07
0.0283794 1.10279e-06
0.033576 1.47039e-06
0.0383903 1.83799e-06
0.0424806 2.20559e-06
0.0465545 2.57319e-06
0.0499759 2.94079e-06
Run Code Online (Sandbox Code Playgroud)
在每列中,值表示从0到100的值,表示百分比.我的目标是在ggplot2中绘制一个图形以查看它们之间的百分比(例如,使用第1列的20%,第2列实现的百分比是多少).Heres是我的R脚本:
library(ggplot2)
dataset=read.table("~/R/datasets/cumul.txt.gz")
p <- ggplot(dataset,aes(V2,V1))
p <- p + geom_line()
p <- p + scale_x_continuous(formatter="percent") + scale_y_continuous(formatter="percent")
p <- p + theme_bw()
ggsave("~/R/grafs/cumul.png")
Run Code Online (Sandbox Code Playgroud)
我遇到了问题,因为每次运行此R都会耗尽内存,从而出现错误:"无法分配大小为128.0 Mb的向量".我在Linux机器上运行32位R,我有大约4GB的可用内存.
我想到了一个解决方法,包括降低这些值的精度(通过舍入它们)并消除重复的行,以便我在数据集上有更少的行.你能给我一些关于如何做到这一点的建议吗?