小编d13*_*337的帖子

如何为size()列指定名称?

我在groupby结果上使用.size()来计算每个组中有多少项.

我希望将结果保存到新的列名而无需手动编辑列名数组,如何才能完成?

谢谢

这是我尝试过的:

grpd = df.groupby(['A','B'])
grpd['size'] = grpd.size()
grpd
Run Code Online (Sandbox Code Playgroud)

和我得到的错误:

TypeError:'DataFrameGroupBy'对象不支持项目分配(在第二行)

python pandas

49
推荐指数
4
解决办法
3万
查看次数

matplotlib/pandas中是否有一个参数使直方图的Y轴为百分比?

我想通过让Y轴显示整个数据集大小中每列的百分比而不是绝对值来比较两个直方图.那可能吗?我正在使用Pandas和matplotlib.谢谢

python matplotlib pandas

45
推荐指数
6
解决办法
5万
查看次数

有没有办法在IPython笔记本中创建交互式图(一个D3)?

我发现了这两个答案: ipython笔记本中的动画图, 如何在ipython笔记本中抓取matplotlib图作为html?

但他们没有解决互动问题.我想显示一条包含2-3条曲线的图表,让用户悬停这些曲线以接收更多细节或控制用于从组合框生成这些曲线的参数

ipython-notebook

15
推荐指数
3
解决办法
7008
查看次数

如何创建每个离散值条形图的条形图/直方图?

我正在尝试创建一个直方图,该直方图将显示离散星级(1-5)中每个值的评级数量.每个值应该有一个条形,在x轴上,每个条形下面(中心)显示的唯一数字是[1,2,3,4,5].

我尝试将容器数量设置为5或其范围设置为0-7,但这会创建跨越值的条形(如提供的图像中所示)

在此输入图像描述

这是我尝试过的代码(pandas和numpy):

df.stars.hist()
Run Code Online (Sandbox Code Playgroud)

hist, bins = np.histogram(x1, bins=5)
ax.bar(bins[:-1], hist.astype(np.float32) / hist.sum(), width=(bins[1]-bins[0]), color="blue")
Run Code Online (Sandbox Code Playgroud)

python matplotlib pandas

6
推荐指数
1
解决办法
5690
查看次数

为什么RandomForestClassifier中max_features的默认值与RandomForestRegressor中的默认值不同?

在is 和in RandomForestClassifier的默认值中,是否有任何具体原因?max_featuressqrt(n_features)RandomForestRegressorn_features

scikit-learn

6
推荐指数
1
解决办法
1357
查看次数

"ez_setup.py"语法错误

我试图通过从命令行(64位Windows机器)运行ez_setup.py并在以下行中获取"无效语法"来安装easy_install:

except pkg_resources.VersionConflict, e:
Run Code Online (Sandbox Code Playgroud)

Python版本3.2.3

有任何建议如何解决这个问题?谢谢

更新: 对不起的人,我是Python的新手,现在它失败了:

打印"安装工具版本",版本,"或更高版本已安装."

python easy-install

5
推荐指数
1
解决办法
9421
查看次数

如何根据列值对Numpy 2D矩阵中的行进行分组?

什么是一种有效的(时间,简单)方法,2D NumPy通过不同的列条件(例如,按列2的值分组)对矩阵行进行分组,f1()f2()在每个组上运行?

谢谢

python numpy

4
推荐指数
2
解决办法
2万
查看次数

如何从训练有素的随机森林中找到关键的树木/特征?

我正在使用Scikit-Learn随机森林分类器并尝试提取有意义的树/特征以便更好地理解预测结果.

我发现这个方法似乎与文档相关(http://scikit-learn.org/dev/modules/generated/sklearn.ensemble.RandomForestClassifier.html#sklearn.ensemble.RandomForestClassifier.get_params),但找不到示例如何使用它.

我也希望在可能的情况下可视化这些树,任何相关的代码都会很棒.

谢谢!

scikit-learn

4
推荐指数
2
解决办法
9044
查看次数

Pandas read_csv 可以加载的行数有限制吗?

我正在尝试使用 Pandas read_csv 方法加载 .csv 文件,该文件有 29872046 行,总大小为 2.2G。我注意到大多数加载的行都缺少它们的值,对于大量的列。从 shell 浏览时的 csv 文件包含这些值...加载的文件有任何限制吗?如果没有的话,如何调试呢?谢谢

pandas

3
推荐指数
1
解决办法
2万
查看次数

使用Python中的嵌套循环计算所有唯一排列

这个C++代码的python等价实现是什么:

char x[10];
for (int i=0; i < 10; i++) {
    for (int j=i; j < 10; j++) {
        calc_something(x[i], x[j])
    }
}
Run Code Online (Sandbox Code Playgroud)

谢谢

python

1
推荐指数
1
解决办法
2382
查看次数