小编jks*_*ksl的帖子

在R和一般工作区管理中组合或合并工作空间

当一个计算系统处于停电/忙碌时,我经常发现自己将工作空间转移到不同的临时驱动器等,或者,我想同时运行两个长卷包以节省时间并在不同的地方加载两次相同的工作空间.

因此,我真的很喜欢一种方法来查看工作空间之间的不同对象和组合它们的方法,只将新的,更改的或更新的工作空间对象添加到类似的工作空间.这对我来说非常有用.

到目前为止,我依靠手工记笔记,并在两周后弄乱了我的涂鸦.我真的只是想学习如此优秀的工作实践和习惯,这使得这种方式变得更容易.

一般来说,我真的想了解更多关于工作空间管理的信息,以及经验丰富的用户如何为长期持续的项目保持工作空间的全面和整洁.我经常使用Rstudio但是远程工作或使用我们的HPC系统它有点滞后和笨重所以我倾向于使用命令行和交互式会话.

我想也许制作对象列表可能是关键,但我希望能够更容易地注释事物,可能使用用于制作对象的数据和参数等.

谢谢.

workspace r project

6
推荐指数
1
解决办法
3199
查看次数

在大型数据集上使用grep或fgrep进行非常慢的循环

我正在尝试做一些非常简单的事情; 来自列表的grep,对于字符串的完全匹配,对目录中的文件:

#try grep each line from the files
for i in $(cat /data/datafile); do 
LOOK=$(echo $i);
fgrep -r $LOOK /data/filestosearch >>/data/output.txt
done
Run Code Online (Sandbox Code Playgroud)

与grep相匹配的文件有2000万行,目录有大约600个文件,总共有大约40万行我可以看到这将是缓慢但我们估计需要7年.即使我在HPC上使用300个内核按文件分割作业进行搜索,看起来可能需要一周时间.

有类似的问题:

循环运行很慢 :

非常缓慢的foreach循环

虽然它们位于不同的平台上,但我想可能还有其他可能对我有所帮助.或fgrep可能更快(但我现在正在测试它似乎有点慢)任何人都可以看到更快的方法吗?先感谢您

bash grep loops

6
推荐指数
2
解决办法
3676
查看次数

标签 统计

bash ×1

grep ×1

loops ×1

project ×1

r ×1

workspace ×1