当我将一个函数应用于 groupby 对象的多个列时,Pandas 会抛出一个未来警告。它建议使用列表作为索引而不是元组。怎么办呢?
>>> df = pd.DataFrame([[1,2,3],[4,5,6],[7,8,9]])
>>> df.groupby([0,1])[1,2].apply(sum)
<stdin>:1: FutureWarning: Indexing with multiple keys (implicitly converted to a tuple of keys) will be deprecated, use a list instead.
1 2
0 1
1 2 2 3
4 5 5 6
7 8 8 9
Run Code Online (Sandbox Code Playgroud) 我只使用基本的 joblib 功能:
Parallel(n_jobs=-1)(delayed(function)(arg) for arg in arglist)
Run Code Online (Sandbox Code Playgroud)
我经常收到警告:
UserWarning: A worker stopped while some jobs were given to the executor. This can be caused by a too short worker timeout or by a memory leak.
Run Code Online (Sandbox Code Playgroud)
这告诉我一个可能的原因是工作超时时间太短。由于我没有设置工作超时并且默认为None,因此这不是问题。我如何去寻找内存泄漏?或者我可以做些什么来避免这个警告?有些部分没有得到执行?或者我不应该担心这个?
该参数linewidth调整每个单元之间的空间大小。例如:
import matplotlib.pyplot as plt
import seaborn as sns; sns.set()
import numpy as np; np.random.seed(0)
uniform_data = np.random.rand(2000, 6)
ax = sns.heatmap(uniform_data)
Run Code Online (Sandbox Code Playgroud)
plt.clf()
ax = sns.heatmap(uniform_data, linewidth=0.0001)
Run Code Online (Sandbox Code Playgroud)
您只能看到白色,因为我的热图形状明显倾斜:2000 行和 6 列。我想在每个单元格列之间有一个垂直的空白。因此,我需要想办法单独调整垂直线宽。如何才能做到这一点?