相关疑难解决方法(0)

python列表中重复项的索引

有谁知道如何在python列表中获取重复项的索引位置?我试过这样做,它只给我一个列表中项目第一次出现的索引.

List = ['A', 'B', 'A', 'C', 'E']
Run Code Online (Sandbox Code Playgroud)

我希望它能给我:

index 0: A   
index 2: A
Run Code Online (Sandbox Code Playgroud)

python

41
推荐指数
7
解决办法
8万
查看次数

Pandas concat给出错误ValueError:计划形状未对齐

我对熊猫很新,我试图连接一组数据帧,我收到这个错误:

ValueError: Plan shapes are not aligned
Run Code Online (Sandbox Code Playgroud)

我的理解.concat()是它会在列相同的地方加入,但对于那些找不到它的人来说,它将填充NA.这似乎不是这种情况.

继承人的声明:

dfs = [npo_jun_df, npo_jul_df,npo_may_df,npo_apr_df,npo_feb_df]
alpha = pd.concat(dfs)
Run Code Online (Sandbox Code Playgroud)

python concat pandas

38
推荐指数
2
解决办法
4万
查看次数

Pandas合并两个具有不同列的数据帧

我肯定在这里遗漏了一些简单的东西.尝试在大多数具有相同列名的pandas中合并两个数据帧,但右侧数据框有一些左侧没有的列,反之亦然.

>df_may

  id  quantity  attr_1  attr_2
0  1        20       0       1
1  2        23       1       1
2  3        19       1       1
3  4        19       0       0

>df_jun

  id  quantity  attr_1  attr_3
0  5         8       1       0
1  6        13       0       1
2  7        20       1       1
3  8        25       1       1
Run Code Online (Sandbox Code Playgroud)

我尝试加入外连接:

mayjundf = pd.DataFrame.merge(df_may, df_jun, how="outer")
Run Code Online (Sandbox Code Playgroud)

但那会产生:

Left data columns not unique: Index([....
Run Code Online (Sandbox Code Playgroud)

我还指定了一个要加入的列(on ="id",例如),但是复制除"id"之外的所有列,如attr_1_x,attr_1_y,这是不理想的.我还将整个列列表(有很多)传递给"on":

mayjundf = pd.DataFrame.merge(df_may, df_jun, how="outer", on=list(df_may.columns.values))
Run Code Online (Sandbox Code Playgroud)

产量:

ValueError: Buffer has wrong number of dimensions …
Run Code Online (Sandbox Code Playgroud)

python dataframe pandas data-munging

37
推荐指数
2
解决办法
6万
查看次数

scipy.stats中的所有发行版都是什么样的?

可视化scipy.stats分布

直方图可制成scipy.stats正常随机变量看到分布的样子.

% matplotlib inline
import pandas as pd
import scipy.stats as stats
d = stats.norm()
rv = d.rvs(100000)
pd.Series(rv).hist(bins=32, normed=True)
Run Code Online (Sandbox Code Playgroud)

正态分布

其他发行版是什么样的?

python statistics distribution matplotlib scipy

33
推荐指数
2
解决办法
1万
查看次数

自动重命名列以确保它们是唯一的

我将电子表格提取到名为的Python DataFrame中df.

我们举个例子:

df=pd.DataFrame({'a': np.random.rand(10), 'b': np.random.rand(10)})
df.columns=['a','a']

          a         a
0  0.973858  0.036459
1  0.835112  0.947461
2  0.520322  0.593110
3  0.480624  0.047711
4  0.643448  0.104433
5  0.961639  0.840359
6  0.848124  0.437380
7  0.579651  0.257770
8  0.919173  0.785614
9  0.505613  0.362737
Run Code Online (Sandbox Code Playgroud)

当我跑步时,df.columns.is_unique我得到了False

我想自动将列'a'重命名为'a_2'(或类似的东西)

我不指望像这样的解决方案 df.columns=['a','a_2']

我正在寻找可用于多个列的解决方案!

python pandas

3
推荐指数
1
解决办法
3059
查看次数