小编pak*_*rob的帖子

Python:如何将Dataframes的字典转换成一个大的数据帧,列名是前一个字典的关键字？

所以我的数据框是由许多单独的excel文件组成的,每个文件都有日期作为文件名和当天电子表格中水果的价格,所以电子表格看起来像这样:

15012016:
Fruit     Price
Orange    1
Apple     2
Pear      3

16012016:
Fruit     Price
Orange    4
Apple     5
Pear      6

17012016:
Fruit     Price
Orange    7
Apple     8
Pear      9

Run Code Online (Sandbox Code Playgroud)

因此,为了将所有信息放在一起,我运行以下代码将所有信息放入数据帧的字典中(所有水果价格文件存储在'C:\ Fruit_Prices_by_Day'中)

#find all the file names
file_list = []
for x in os.listdir('C:\Fruit_Prices_by_Day'):
    file_list.append(x) 

file_list= list(set(file_list))

d = {}

for date in Raw_list:
    df1 = pd.read_excel(os.path.join('C:\Fruit_Prices_by_Day', date +'.xlsx'), index_col = 'Fruit')
    d[date] = df1

Run Code Online (Sandbox Code Playgroud)

然后这就是我被卡住的部分.然后我如何将这个dict变成一个数据框,其中列名是dict键,即日期,所以我可以在同一个数据帧中得到每个每个水果的价格,如:

          15012016   16012016   17012016   
Orange    1          4          7
Apple     2          5          8
Pear      3          6          9

Run Code Online (Sandbox Code Playgroud)

python dictionary dataframe python-2.7 pandas

pak*_*rob

lucky-day

10
推荐指数

3
解决办法

9495
查看次数

如何遍历相关矩阵以仅提供高于特定阈值的相关对？和/或使其更有效率

我有以下代码：

for i in list(corr.columns):
    for j in list(corr.columns):
        if corr.ix[i,j]>0.7 and corr.ix[i,j] != 1:
            print i, ' ',j ,' ', corr.ix[i,j]

Run Code Online (Sandbox Code Playgroud)

问题是，虽然这有效，但它同时返回 corr[i,j] 和 corr[j,i] ，就好像它们是不同的相关性一样。无论如何我可以只遍历相关矩阵的“底部三角形”吗？

python performance loops correlation

pak*_*rob

lucky-day

4
推荐指数

1
解决办法

2913
查看次数