这是一个相当简单的问题,但我找不到答案.
我在群集中运行了大量作业(> 20),我想将它们全部删除并重新开始.
根据这个网站,我应该能够做到:
qdel -u netid
Run Code Online (Sandbox Code Playgroud)
摆脱他们所有,但在我的情况下返回:
qdel: invalid option -- 'u'
usage: qdel [{ -a | -c | -p | -t | -W delay | -m message}] [<JOBID>[<JOBID>]|'all'|'ALL']...
-a -c, -m, -p, -t, and -W are mutually exclusive
Run Code Online (Sandbox Code Playgroud)
这显然表明该命令不起作用.
只是为了检查,我做了:
qstat -u <username>
Run Code Online (Sandbox Code Playgroud)
我确实得到了所有工作的清单,但是:
qdel -u <username>
Run Code Online (Sandbox Code Playgroud)
也失败了.
我有一些来自日志文件的数据,并希望按分钟分组:
def gen(date, count=10):
while count > 0:
yield date, "event{}".format(randint(1,9)), "source{}".format(randint(1,3))
count -= 1
date += DateOffset(seconds=randint(40))
df = DataFrame.from_records(list(gen(datetime(2012,1,1,12, 30))), index='Time', columns=['Time', 'Event', 'Source'])
Run Code Online (Sandbox Code Playgroud)
DF:
Event Source
2012-01-01 12:30:00 event3 source1
2012-01-01 12:30:12 event2 source2
2012-01-01 12:30:12 event2 source2
2012-01-01 12:30:29 event6 source1
2012-01-01 12:30:38 event1 source1
2012-01-01 12:31:05 event4 source2
2012-01-01 12:31:38 event4 source1
2012-01-01 12:31:44 event5 source1
2012-01-01 12:31:48 event5 source2
2012-01-01 12:32:23 event6 source1
Run Code Online (Sandbox Code Playgroud)
我试过这些选项:
df.resample('Min') 是太高的水平,想要聚合.df.groupby(date_range(datetime(2012,1,1,12, 30), freq='Min',
periods=4)) 失败,例外.df.groupby(TimeGrouper(freq='Min'))工作正常并返回一个DataFrameGroupBy …
我从我的分店拉出来:
git checkout mybranchSample
git fetch
git pull origin master
Run Code Online (Sandbox Code Playgroud)
然后,Git给了我以下消息:
请输入提交消息以解释为何需要此合并,
特别是如果它将更新的上游合并到主题分支中
输入提交消息后,它会合并master到我的文件中.即使我没有处理过某些文件master,它也会在我输入时以绿色显示文件列表git status.
这个问题不是我的同事发生的,而是我.这背后的原因是什么?
我安装了最新版的Anaconda.现在我想在其中安装OpenCV.当我输入:
conda install -c https://conda.binstar.org/anaconda opencv
Run Code Online (Sandbox Code Playgroud)
我收到此消息错误:" conda未被识别为内部命令... "(抱歉,我尝试翻译法语,因为我的操作系统是法语)
问题是conda带有Anaconda,所以我想知道为什么要推出Anaconda并输入上面的命令不起作用?
我想在散点图中设置变量标记大小.这是我的代码:
import numpy as np
import matplotlib.pyplot as plt
from os import getcwd
from os.path import join, realpath, dirname
mypath = realpath(join(getcwd(), dirname(__file__)))
myfile = 'b34.dat'
data = np.loadtxt(join(mypath,myfile),
usecols=(1,2,3),
unpack=True)
fig = plt.figure()
ax1 = fig.add_subplot(111)
ax1.plot(data[0], data[1], 'bo', markersize=data[2], label='the data')
plt.show()
Run Code Online (Sandbox Code Playgroud)
我导入的文件有三列.列1和2被存储在data[0]和data[1])是(x,y)值,我想的每个点具有相对于柱3(即一个尺寸:data[2])
顺便说一句,我正在使用Canopy IDE.
我有一个1维数据数组:
a = np.array([1,2,3,4,4,4,5,5,5,5,4,4,4,6,7,8])
Run Code Online (Sandbox Code Playgroud)
我希望获得68%置信区间(即:1西格玛).
在第一个评论这个回答指出,这可以实现使用scipy.stats.norm.interval从scipy.stats.norm功能,通过:
from scipy import stats
import numpy as np
mean, sigma = np.mean(a), np.std(a)
conf_int = stats.norm.interval(0.68, loc=mean,
scale=sigma)
Run Code Online (Sandbox Code Playgroud)
但是这篇文章中的评论指出,获得置信区间的实际正确方法是:
conf_int = stats.norm.interval(0.68, loc=mean,
scale=sigma / np.sqrt(len(a)))
Run Code Online (Sandbox Code Playgroud)
也就是说,sigma除以样本大小的平方根:np.sqrt(len(a)).
问题是:哪个版本是正确的?
我想绘制一个简单的一维直方图,其中条形应遵循给定色图的颜色编码.
这是一个MWE:
import numpy as n
import matplotlib.pyplot as plt
# Random gaussian data.
Ntotal = 1000
data = 0.05 * n.random.randn(Ntotal) + 0.5
# This is the colormap I'd like to use.
cm = plt.cm.get_cmap('RdYlBu_r')
# Plot histogram.
n, bins, patches = plt.hist(data, 25, normed=1, color='green')
plt.show()
Run Code Online (Sandbox Code Playgroud)
输出这个:

green我希望这些列不是用于整个直方图的颜色,而是遵循由定义的颜色映射cm和颜色值给出的颜色编码bins.根据所选择的色彩图,这意味着接近于零(不在高度但在位置上)的箱应该看起来更蓝并且更接近一个更红RdYlBu_r.
由于plt.histo没有cmap参数,我不知道如何告诉它使用中定义的色彩映射cm.
我正在制作一些散点图,我想将图例中点的大小设置为固定的相等值.
现在我有这个:
import matplotlib.pyplot as plt
import numpy as np
def rand_data():
return np.random.uniform(low=0., high=1., size=(100,))
# Generate data.
x1, y1 = [rand_data() for i in range(2)]
x2, y2 = [rand_data() for i in range(2)]
plt.figure()
plt.scatter(x1, y1, marker='o', label='first', s=20., c='b')
plt.scatter(x2, y2, marker='o', label='second', s=35., c='r')
# Plot legend.
plt.legend(loc="lower left", markerscale=2., scatterpoints=1, fontsize=10)
plt.show()
Run Code Online (Sandbox Code Playgroud)
产生这个:

图例中点的大小是缩放的但不相同.如何在不影响图中大小的情况下将图例中点的大小固定为相等的值scatter?
我正在尝试运行一个非常简单的代码,在集群中输出.png文件.这是代码:
import matplotlib.pyplot as plt
import numpy as np
x = np.random.randn(60)
y = np.random.randn(60)
plt.scatter(x, y, s=20)
out_png = 'path/to/store/out_file.png'
plt.savefig(out_png, dpi=150)
Run Code Online (Sandbox Code Playgroud)
如果我使用python simple_code.py安装了matplotlib 1.2.1的系统中的命令运行此代码,我会收到警告:
Unable to load library icui18n "Cannot load library icui18n:
Run Code Online (Sandbox Code Playgroud)
.png图像仍然生成,所以我没有问题.但是如果我在安装了matplotlib 1.3.0的集群中使用相同的命令和代码,则会失败并显示错误:
Traceback (most recent call last):
File "simple_code.py", line 33, in <module>
plt.scatter(x, y, s=20)
File "/usr/lib/pymodules/python2.7/matplotlib/pyplot.py", line 3078, in scatter
ax = gca()
File "/usr/lib/pymodules/python2.7/matplotlib/pyplot.py", line 803, in gca
ax = gcf().gca(**kwargs)
File "/usr/lib/pymodules/python2.7/matplotlib/pyplot.py", line 450, in gcf
return figure()
File …Run Code Online (Sandbox Code Playgroud) 我正在使用Sublime Text 3083.
当我加载一个有几千行的文件并尝试编辑它时,它甚至无法响应添加/删除一个字符需要几秒钟.
我安装了> 20个软件包,我需要一种方法来同时禁用所有这些软件包,以检查此问题是否与软件包相关或不是.
我一直在搜索,我知道你可以逐个禁用软件包,但是当安装了很多软件包时这并不好.根据崇高论坛中的这篇文章,没有办法做到这一点但是帖子相当陈旧(也不是官方声明)
那么,有没有办法做到这一点?也许有一个包或--no-packages旗帜或其他一些技巧?
顺便说一句:为了完整起见,在应用解决方案之后,我发现有两个包负责延迟:GitGutter和WordHighlight.
python ×7
matplotlib ×3
numpy ×2
ssh ×2
anaconda ×1
conda ×1
git ×1
git-merge ×1
git-pull ×1
histogram ×1
jobs ×1
legend ×1
pandas ×1
python-2.7 ×1
python-3.x ×1
scatter-plot ×1
scipy ×1
sublimetext3 ×1
tkinter ×1