小编SPy*_*SPy的帖子

如何从 DataFrame 中找到前 N 个最小值，Python-3

我在数据框下方有字段“年龄”，需要从数据框中找到前 3 个最小年龄

DF = pd.DataFrame.from_dict({'Name':['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J'], 'Age':[18, 45, 35, 70, 23, 24, 50, 65, 18, 23]})

DF['Age'].min()

Run Code Online (Sandbox Code Playgroud)

想要列表中的前两个年龄即 18、23，如何实现？

注意：DataFrame - DF 包含 Age Duplicates，即 18 和 23 重复两次，需要唯一值。

python dataframe python-3.x pandas pandas-groupby

SPy*_*SPy

2019 12-25

9
推荐指数

1
解决办法

968
查看次数

如何关闭使用 os.startfile() 打开的文件，Python 3.6

我想关闭一些使用 os.startfile() 打开的文件，例如 .txt、.csv、.xlsx。

我知道这个问题之前问过，但我没有找到任何有用的脚本。

我使用的是windows 10环境

python file python-3.x python-os

SPy*_*SPy

lucky-day

7
推荐指数

1
解决办法

1万
查看次数

在 Python 3.6 中导入库“modin”时出错

import modin.pandas as pd

Run Code Online (Sandbox Code Playgroud)

我正在 Windows 10 机器中导入 modin.pandas 库但出现错误

“AttributeError：模块‘ray’没有属性‘utils’”

安装 modin 库时遗漏了什么？

python python-3.x ray pandas modin

SPy*_*SPy

2021 06-28

7
推荐指数

1
解决办法

743
查看次数

Python 数据框导出到带有引号 (") 的 csv

如何使用双引号将 python 数据框导出到 csv。我试过下面的代码，但它没有出现在输出文件中。我需要像“column1”、“column2”、column3“这样的结果......请帮忙。

exportPath=exportPath+'\\data2Upload.csv'
header=['Country','Indicator','Unit','Frequency','Date','Value']
data.to_csv(exportPath,columns=header,sep=',',quotechar='"',index=False)

Run Code Online (Sandbox Code Playgroud)

python export-to-csv

SPy*_*SPy

lucky-day

5
推荐指数

1
解决办法

7161
查看次数

匹配列并附加到数据框,Python 3.6

我有大约50个excel文件,我想导入到dataframe并将所有文件合并到单个数据帧中.但有些文件有3个,有些是4列.每个文件作为不同的列以不同的顺序.

所有文件中的不同列总数:5即col1,col2,col3,col4,col5

我知道如何导入,但在面临问题的同时.

脚本:

dfAll = pd.DataFrame(columns=['col1', 'col2', 'col3', 'col4', 'col5')]
df= pd.read_excel('FilePath', sheetname='data1') # contains 3 columns i.e col1, col2, col5
columnsOFdf = df.columns
dfAll[columnsOFdf] = dfAll.append(df)

Run Code Online (Sandbox Code Playgroud)

但是给出错误"ValueError:Columns必须和key一样长"

我想将df ['col1','col2','col5']数据追加到dfAll ['col1','col2','col5']

请帮忙解决这个问题.

python append dataframe python-3.x pandas

SPy*_*SPy

2017 09-06

5
推荐指数

1
解决办法

3696
查看次数

带有第一行数据的Concat列名,Python 3.6 Dataframe

我想将数据帧第一行的数据添加到其列名并删除第一行.

源数据框架:

2013K2  2013K3  2013K4  2013K5
ABC1    ABC2    ABC3    ABC4
324 5435    543 543
6543    543 657 765
765 876 876 9876

Run Code Online (Sandbox Code Playgroud)

需要将列名重命名为列名+'|'+第一行数据:

2013K2|ABC1 2013K3|ABC2 2013K4|ABC3 2013K5|ABC4
324 5435    543 543
6543    543 657 765
765 876 876 9876

Run Code Online (Sandbox Code Playgroud)

python dataframe python-3.x pandas

SPy*_*SPy

lucky-day

5
推荐指数

2
解决办法

849
查看次数

如果列名以某些字符串结尾（Python 3.6），则删除数据框列

我有以下几列的数据框：

SectorName', 'Sector', 'ItemName', 'Item', 'Counterpart SectorName', 'Counterpart Sector', 'Stocks and TransactionsName', 'Stocks and Transactions', 'Units', 'Scale', 'Frequency', 'Date', 'Value'

Run Code Online (Sandbox Code Playgroud)

如何从df列名以Name。结尾的列中删除列。

python python-3.x pandas

SPy*_*SPy

2017 09-21

4
推荐指数

1
解决办法

3870
查看次数

如何比较 DataFrame 的 3 列，Python 3.6

我有下面的数据框，我想比较 3 列值并更新另一列“Id_Name_Table_Matching”中的 True/False

下面是我的代码：

L1_ID = ['Region', 'Col2', 'Col3', 'Col4', 'Col5']
L1_Name = ['Region', 'Col2', 'Col3', 'Col4', 'Col5']
L1_Table = ['Region', 'Col2', 'Col3', 'Col4', 'Col5']

DF1 = pd.DataFrame({'dimId': L1_ID, 'dimName': L1_Name, 'sqlTableColumn': L1_Table})

Run Code Online (Sandbox Code Playgroud)

如果所有列值匹配，我想在“Id_Name_Table_Matching”中更新 true，否则为 false。我需要如下脚本：

DF1['Id_Name_Table_Matching'] = DF1['dimId'] == DF1['dimName'] == DF1['sqlTableColumn']

Run Code Online (Sandbox Code Playgroud)

python list dataframe python-3.x pandas

SPy*_*SPy

2018 11-13

4
推荐指数

1
解决办法

7099
查看次数

在熊猫中显示列为False的行

我有一个数据框，其中一列（dtype = bool）包含True/ False值，如果布尔列== False，我想过滤记录

下面的脚本给出了错误，请帮忙。

if mFile['CCK'].str.contains(['False']):
    print(mFile.loc[mFile['CCK'] == False])

Run Code Online (Sandbox Code Playgroud)

错误中

if mFile['CCK'].str.contains(['False']

Run Code Online (Sandbox Code Playgroud)

python dataframe pandas

SPy*_*SPy

2017 08-25

3
推荐指数

2
解决办法

7162
查看次数

从数据框中删除空白列不起作用,Python 3.6

如果整列有纳米或空白值,我正在删除数据框列.删除nan工作正常并且分配数据[data ==''] = np.nan不能在for循环下工作.

for i in range(1, j):
    data = pd.DataFrame(dfs[i])
    data = data.dropna(axis=1, how='all') # Remove column if column has only nan values

    data[data == ''] = np.nan
    data = data.dropna(axis=1, how='all') # Remove column if column has only blank values

Run Code Online (Sandbox Code Playgroud)

我根据以下评论更新了代码,但同样的问题.

data[data == ''] = np.nan
data = data.replace('', np.nan).dropna(axis=1, how='all')
data = data.dropna(axis=1, how='all')

Run Code Online (Sandbox Code Playgroud)

python python-3.x pandas

SPy*_*SPy

2017 09-20

2
推荐指数

1
解决办法

301
查看次数

标签统计

python ×10

pandas ×8

python-3.x ×8

dataframe ×5

append ×1

export-to-csv ×1

file ×1

list ×1

modin ×1

pandas-groupby ×1

python-os ×1

ray ×1

标签 统计

小编SPy_SPy的帖子

标签统计