小编SPy*_*SPy的帖子

如何从 DataFrame 中找到前 N 个最小值,Python-3

我在数据框下方有字段“年龄”,需要从数据框中找到前 3 个最小年龄

DF = pd.DataFrame.from_dict({'Name':['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J'], 'Age':[18, 45, 35, 70, 23, 24, 50, 65, 18, 23]})

DF['Age'].min()  
Run Code Online (Sandbox Code Playgroud)

想要列表中的前两个年龄即 18、23,如何实现?

注意:DataFrame - DF 包含 Age Duplicates,即 18 和 23 重复两次,需要唯一值。

python dataframe python-3.x pandas pandas-groupby

9
推荐指数
1
解决办法
968
查看次数

如何关闭使用 os.startfile() 打开的文件,Python 3.6

我想关闭一些使用 os.startfile() 打开的文件,例如 .txt、.csv、.xlsx。

我知道这个问题之前问过,但我没有找到任何有用的脚本。

我使用的是windows 10环境

python file python-3.x python-os

7
推荐指数
1
解决办法
1万
查看次数

在 Python 3.6 中导入库“modin”时出错

import modin.pandas as pd
Run Code Online (Sandbox Code Playgroud)

我正在 Windows 10 机器中导入 modin.pandas 库但出现错误

“AttributeError:模块‘ray’没有属性‘utils’”

安装 modin 库时遗漏了什么?

python python-3.x ray pandas modin

7
推荐指数
1
解决办法
743
查看次数

Python 数据框导出到带有引号 (") 的 csv

如何使用双引号将 python 数据框导出到 csv。我试过下面的代码,但它没有出现在输出文件中。我需要像“column1”、“column2”、column3“这样的结果......请帮忙。

exportPath=exportPath+'\\data2Upload.csv'
header=['Country','Indicator','Unit','Frequency','Date','Value']
data.to_csv(exportPath,columns=header,sep=',',quotechar='"',index=False)
Run Code Online (Sandbox Code Playgroud)

python export-to-csv

5
推荐指数
1
解决办法
7161
查看次数

匹配列并附加到数据框,Python 3.6

我有大约50个excel文件,我想导入到dataframe并将所有文件合并到单个数据帧中.但有些文件有3个,有些是4列.每个文件作为不同的列以不同的顺序.

所有文件中的不同列总数:5即col1,col2,col3,col4,col5

我知道如何导入,但在面临问题的同时.

脚本:

dfAll = pd.DataFrame(columns=['col1', 'col2', 'col3', 'col4', 'col5')]
df= pd.read_excel('FilePath', sheetname='data1') # contains 3 columns i.e col1, col2, col5
columnsOFdf = df.columns
dfAll[columnsOFdf] = dfAll.append(df)
Run Code Online (Sandbox Code Playgroud)

但是给出错误"ValueError:Columns必须和key一样长"

我想将df ['col1','col2','col5']数据追加dfAll ['col1','col2','col5']

请帮忙解决这个问题.

python append dataframe python-3.x pandas

5
推荐指数
1
解决办法
3696
查看次数

带有第一行数据的Concat列名,Python 3.6 Dataframe

我想将数据帧第一行的数据添加到其列名并删除第一行.

源数据框架:

2013K2  2013K3  2013K4  2013K5
ABC1    ABC2    ABC3    ABC4
324 5435    543 543
6543    543 657 765
765 876 876 9876
Run Code Online (Sandbox Code Playgroud)

需要将列名重命名为列名+'|'+第一行数据:

2013K2|ABC1 2013K3|ABC2 2013K4|ABC3 2013K5|ABC4
324 5435    543 543
6543    543 657 765
765 876 876 9876
Run Code Online (Sandbox Code Playgroud)

python dataframe python-3.x pandas

5
推荐指数
2
解决办法
849
查看次数

如果列名以某些字符串结尾(Python 3.6),则删除数据框列

我有以下几列的数据框:

SectorName', 'Sector', 'ItemName', 'Item', 'Counterpart SectorName', 'Counterpart Sector', 'Stocks and TransactionsName', 'Stocks and Transactions', 'Units', 'Scale', 'Frequency', 'Date', 'Value'
Run Code Online (Sandbox Code Playgroud)

如何从df列名以Name。结尾的列中删除列。

python python-3.x pandas

4
推荐指数
1
解决办法
3870
查看次数

如何比较 DataFrame 的 3 列,Python 3.6

我有下面的数据框,我想比较 3 列值并更新另一列“Id_Name_Table_Matching”中的 True/False

下面是我的代码:

L1_ID = ['Region', 'Col2', 'Col3', 'Col4', 'Col5']
L1_Name = ['Region', 'Col2', 'Col3', 'Col4', 'Col5']
L1_Table = ['Region', 'Col2', 'Col3', 'Col4', 'Col5']

DF1 = pd.DataFrame({'dimId': L1_ID, 'dimName': L1_Name, 'sqlTableColumn': L1_Table})
Run Code Online (Sandbox Code Playgroud)

如果所有列值匹配,我想在“Id_Name_Table_Matching”中更新 true,否则为 false。我需要如下脚本:

DF1['Id_Name_Table_Matching'] = DF1['dimId'] == DF1['dimName'] == DF1['sqlTableColumn']
Run Code Online (Sandbox Code Playgroud)

python list dataframe python-3.x pandas

4
推荐指数
1
解决办法
7099
查看次数

在熊猫中显示列为False的行

我有一个数据框,其中一列(dtype = bool)包含True/ False值,如果布尔列== False,我想过滤记录

下面的脚本给出了错误,请帮忙。

if mFile['CCK'].str.contains(['False']):
    print(mFile.loc[mFile['CCK'] == False])
Run Code Online (Sandbox Code Playgroud)

错误中

if mFile['CCK'].str.contains(['False']
Run Code Online (Sandbox Code Playgroud)

python dataframe pandas

3
推荐指数
2
解决办法
7162
查看次数

从数据框中删除空白列不起作用,Python 3.6

如果整列有纳米或空白值,我正在删除数据框列.删除nan工作正常并且分配数据[data ==''] = np.nan不能在for循环下工作.

for i in range(1, j):
    data = pd.DataFrame(dfs[i])
    data = data.dropna(axis=1, how='all') # Remove column if column has only nan values

    data[data == ''] = np.nan
    data = data.dropna(axis=1, how='all') # Remove column if column has only blank values 
Run Code Online (Sandbox Code Playgroud)

我根据以下评论更新了代码,但同样的问题.

data[data == ''] = np.nan
data = data.replace('', np.nan).dropna(axis=1, how='all')
data = data.dropna(axis=1, how='all')
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述

python python-3.x pandas

2
推荐指数
1
解决办法
301
查看次数