有谁知道如何在python列表中获取重复项的索引位置?我试过这样做,它只给我一个列表中项目第一次出现的索引.
List = ['A', 'B', 'A', 'C', 'E']
Run Code Online (Sandbox Code Playgroud)
我希望它能给我:
index 0: A
index 2: A
Run Code Online (Sandbox Code Playgroud) 我对熊猫很新,我试图连接一组数据帧,我收到这个错误:
ValueError: Plan shapes are not aligned
Run Code Online (Sandbox Code Playgroud)
我的理解.concat()是它会在列相同的地方加入,但对于那些找不到它的人来说,它将填充NA.这似乎不是这种情况.
继承人的声明:
dfs = [npo_jun_df, npo_jul_df,npo_may_df,npo_apr_df,npo_feb_df]
alpha = pd.concat(dfs)
Run Code Online (Sandbox Code Playgroud) 我肯定在这里遗漏了一些简单的东西.尝试在大多数具有相同列名的pandas中合并两个数据帧,但右侧数据框有一些左侧没有的列,反之亦然.
>df_may
id quantity attr_1 attr_2
0 1 20 0 1
1 2 23 1 1
2 3 19 1 1
3 4 19 0 0
>df_jun
id quantity attr_1 attr_3
0 5 8 1 0
1 6 13 0 1
2 7 20 1 1
3 8 25 1 1
Run Code Online (Sandbox Code Playgroud)
我尝试加入外连接:
mayjundf = pd.DataFrame.merge(df_may, df_jun, how="outer")
Run Code Online (Sandbox Code Playgroud)
但那会产生:
Left data columns not unique: Index([....
Run Code Online (Sandbox Code Playgroud)
我还指定了一个要加入的列(on ="id",例如),但是复制除"id"之外的所有列,如attr_1_x,attr_1_y,这是不理想的.我还将整个列列表(有很多)传递给"on":
mayjundf = pd.DataFrame.merge(df_may, df_jun, how="outer", on=list(df_may.columns.values))
Run Code Online (Sandbox Code Playgroud)
产量:
ValueError: Buffer has wrong number of dimensions …Run Code Online (Sandbox Code Playgroud) scipy.stats分布直方图可制成的scipy.stats正常随机变量看到分布的样子.
% matplotlib inline
import pandas as pd
import scipy.stats as stats
d = stats.norm()
rv = d.rvs(100000)
pd.Series(rv).hist(bins=32, normed=True)
Run Code Online (Sandbox Code Playgroud)
其他发行版是什么样的?
我将电子表格提取到名为的Python DataFrame中df.
我们举个例子:
df=pd.DataFrame({'a': np.random.rand(10), 'b': np.random.rand(10)})
df.columns=['a','a']
a a
0 0.973858 0.036459
1 0.835112 0.947461
2 0.520322 0.593110
3 0.480624 0.047711
4 0.643448 0.104433
5 0.961639 0.840359
6 0.848124 0.437380
7 0.579651 0.257770
8 0.919173 0.785614
9 0.505613 0.362737
Run Code Online (Sandbox Code Playgroud)
当我跑步时,df.columns.is_unique我得到了False
我想自动将列'a'重命名为'a_2'(或类似的东西)
我不指望像这样的解决方案 df.columns=['a','a_2']
我正在寻找可用于多个列的解决方案!
python ×5
pandas ×3
concat ×1
data-munging ×1
dataframe ×1
distribution ×1
matplotlib ×1
scipy ×1
statistics ×1