小编Bry*_*mas的帖子

将命令行参数传递给R CMD BATCH

我一直在使用R CMD BATCH my_script.R终端来执行R脚本.我现在正处于我想向命令传递一个参数的地步,但是我遇到了一些让它工作的问题.如果我这样做,R CMD BATCH my_script.R blablablabla成为输出文件,而不是被解释为正在执行的R脚本可用的参数.

我试过Rscript my_script.R blabla这似乎blabla正确地作为一个参数传递,但后来我没有得到我得到的my_script.Rout输出文件R CMD BATCH(我想要的.Rout文件).虽然我可以调用的输出重定向到Rscript我的选择的文件名,我就不会得到列入方式文件中的R输入命令R CMD BATCH是否在.Rout文件中.

所以,理想情况下,我正在采用一种方法将参数传递给通过该R CMD BATCH方法执行的R脚本,但是Rscript如果有一种方法可以使它生成一个类似的.Rout文件,那么会很满意.

r rscript

94
推荐指数
4
解决办法
11万
查看次数

计算与Java中的纬度/经度坐标相距一定距离的边界框

给定一个坐标(lat,long),我试图计算一个与坐标相距给定距离(例如50km)的方形边界框.所以作为输入我有lat,long和distance,作为输出,我想要两个坐标; 一个是西南(左下角),另一个是东北(右上角).我在这里看到了几个试图用Python解决这个问题的答案,但我特别想找一个Java实现.

为了清楚起见,我打算仅在地球上使用该算法,因此我不需要容纳可变半径.

它不一定非常准确(+/- 20%很好),它只能用于计算小距离(不超过150公里)的边界框.所以我很高兴为一个有效的算法牺牲一些准确性.任何帮助深表感谢.

编辑:我应该更清楚,我真的是在一个正方形,而不是一个圆圈.我知道正方形的中心和沿着正方形周长的各个点之间的距离不是像圆圈一样的恒定值.我猜我的意思是一个正方形,如果你从中心画一条直线到周长上的四个点中的任何一个点,导致一条线垂直于周边的边,那么这4条线的长度相同.

math trigonometry geospatial bounding-box latitude-longitude

36
推荐指数
3
解决办法
4万
查看次数

Python从cProfile获得有意义的结果

我在一个文件中有一个Python脚本,运行时间超过30秒.我试图描述它,因为我想大幅削减这一次.

我试图使用脚本来编写脚本cProfile,但基本上所有它似乎都在告诉我是的,主脚本需要很长时间才能运行,但是没有给出我期望的那种故障.在终端,我键入如下内容:

cat my_script_input.txt | python -m cProfile -s time my_script.py
Run Code Online (Sandbox Code Playgroud)

我得到的结果是:

<my_script_output>
             683121 function calls (682169 primitive calls) in 32.133 seconds

   Ordered by: internal time

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1   31.980   31.980   32.133   32.133 my_script.py:18(<module>)
   121089    0.050    0.000    0.050    0.000 {method 'split' of 'str' objects}
   121090    0.038    0.000    0.049    0.000 fileinput.py:243(next)
        2    0.027    0.014    0.036    0.018 {method 'sort' of 'list' objects}
   121089    0.009    0.000    0.009    0.000 {method 'strip' of 'str' objects}
   201534    0.009    0.000    0.009 …
Run Code Online (Sandbox Code Playgroud)

python cprofile

33
推荐指数
1
解决办法
3万
查看次数

如何使用Matplotlib在对数 - 对数图上的所有刻度线上显示对数间隔的网格线?

我正在尝试绘制一个对数 - 对数图,该图显示沿着图的底部和左侧看到的所有刻度线上的对数间隔网格线.我已经能够通过使用显示一些网格线matplotlib.pyplot.grid(True),但这只是以10个间隔的功率显示网格线.举个例子,这是我目前得到的:

替代文字

我真的很喜欢网格线看起来更像这样的东西,网格线并非都是均匀间隔的:

替代文字

我将如何在Matplotlib中实现这一目标?

grid matplotlib

28
推荐指数
2
解决办法
3万
查看次数

Python正则表达式匹配所有5位数字但没有更大

我正在尝试将遍布HTML网页的5位数优惠券代码串起来.例如53232,21032,40021等...我能处理的5位与任何字符串比较简单的情况下[0-9]{5},虽然这也符合6,7,8,...,N数字.有人可以建议我如何修改这个正则表达式匹配5位数字?

python regex

24
推荐指数
4
解决办法
6万
查看次数

如何使用R在数据框的列中查找前n%的记录

我有一个数据集,显示澳大利亚元兑美元汇率在大约20年的时间内每天一次.我在数据框中有数据,第一列是日期,第二列是汇率.以下是数据中的示例:

>data
             V1     V2
1    12/12/1983 0.9175
2    13/12/1983 0.9010
3    14/12/1983 0.9000
4    15/12/1983 0.8978
5    16/12/1983 0.8928
6    19/12/1983 0.8770
7    20/12/1983 0.8795
8    21/12/1983 0.8905
9    22/12/1983 0.9005
10   23/12/1983 0.9005
Run Code Online (Sandbox Code Playgroud)

我如何显示这些记录的前n%?例如,我想看看汇率在数据集中所有汇率中排名前5%的日子和汇率?

r dataframe

21
推荐指数
2
解决办法
3万
查看次数

流程图"为每个"循环循环,没有可变增量

我设计了一个流程图来高级描述编程过程的工作原理.此过程的一部分涉及循环一组项目.我想知道在流程图中是否存在表示"for each"样式循环的任何标准或半标准方式,这不涉及使用迭代框m = m + 1(例如此处)使迭代显式化.大多数现代编程语言都有某种"for each"结构,用于枚举一组或一系列项,而不必考虑索引.我基本上是在为流程图寻找类似的可视化构造,以避免在显式计数器增量时浪费空间.

flowchart

21
推荐指数
3
解决办法
3万
查看次数

如何在Matplotlib条形图中删除条之间的间隙

我正在Matplotlib制作条形图,调用方式如下:

xs.bar(bar_lefts, bar_heights, facecolor='black', edgecolor='black')
Run Code Online (Sandbox Code Playgroud)

我得到一个如下所示的条形图:

条形图与差距

我想要的是连续条之间没有白色间隙,例如更像是:

在此输入图像描述

有没有办法在Matplotlib中使用该bar()函数实现这一目的?

python matplotlib

19
推荐指数
2
解决办法
2万
查看次数

库根据点值生成热图贴图叠加而不是点密度

我有一组数据点,每个点表示为lat/lng.这些点中的每一个都具有与之相关的值,该值随时间而变化.我想在地图上生成一个热图动画叠加层,以反映这段时间内价值的变化.注意:我可以生成一系列静态"快照"并将它们逐帧拼接到动画中,因此热图库本身不必支持动画.

我的第一次尝试是使用HeatMapLayer,它是Google Maps可视化库的一部分.然而,根据基于平均权重而不是数据点数量的热图问题,似乎这个特定的可视化库坚持在确定在给定点周围使用什么颜色时权重点的密度.

我的解决方案只考虑点的值而不是密度.举个例子,假设一个人希望可视化一个城市的环境温度,但是城市的某些部分安装的温度计比其他部分要多.您不希望安装了许多温度计的小区域因为有许多温度计而显示红色 - 您只希望它在那里很热时显示红色.

基本上,我希望每个点的单一颜色反映点的值的强度,然后是任意两点颜色之间的梯度空间过渡.它不一定是谷歌地图 - 关键标准是i)必须基本颜色关闭点值而不是点密度ii)必须覆盖在地图上,iii)理想情况下有一个编程抽象,以lat/lng的方式进行讨论,而不是需要手动转换为例如欧几里德空间.

google-maps map heatmap

19
推荐指数
1
解决办法
1375
查看次数

timesp的matplotlib智能轴标签

我有一个简单的X和Y值数据集,我在matplotlib中绘制.我的数据中的自变量是持续时间/时间δ(例如60秒,2小时,24小时,10天),在我的输入数据中始终表示为整数秒.我的问题是,matplotlib能否以人类可读的形式智能地设置持续时间轴标签?

例如,在比例的小端,希望将30秒简单地表示为"30秒".在规模较大的一端,显示"10天"而不是864000秒会更好.介于两者之间,最好在"分钟"和"小时"内读取标签.matplotlib是否有任何自动推断方法可以推断出人类可读的东西,持续时间跨越几个数量级?

理想情况下,我使用的任何方法都应该推广到跨越不同持续时间尺度的数据集,而不是针对一个输入数据集单独定制的图.

matplotlib

14
推荐指数
1
解决办法
5651
查看次数