相关疑难解决方法(0)

如何迭代Pandas中的DataFrame中的行？

我有一只DataFrame熊猫:

import pandas as pd
inp = [{'c1':10, 'c2':100}, {'c1':11,'c2':110}, {'c1':12,'c2':120}]
df = pd.DataFrame(inp)
print df

Run Code Online (Sandbox Code Playgroud)

输出:

Run Code Online (Sandbox Code Playgroud)

现在我想迭代这个帧的行.对于每一行,我希望能够通过列的名称访问其元素(单元格中的值).例如:

for row in df.rows:
   print row['c1'], row['c2']

Run Code Online (Sandbox Code Playgroud)

是否有可能在熊猫中做到这一点？

我发现了类似的问题.但它没有给我我需要的答案.例如,建议使用:

for date, row in df.T.iteritems():

Run Code Online (Sandbox Code Playgroud)

要么

for row in df.iterrows():

Run Code Online (Sandbox Code Playgroud)

但我不明白row对象是什么以及如何使用它.

python rows dataframe pandas

Rom*_*man

2018 08-25

1551
推荐指数

28
解决办法

199万
查看次数

对于有熊猫的循环 - 我什么时候应该关心？

我熟悉"矢量化"的概念,以及熊猫如何使用矢量化技术来加速计算.矢量化函数在整个系列或DataFrame上广播操作,以实现比传统迭代数据更大的加速.

但是,我很惊讶地看到很多代码(包括Stack Overflow的答案)提供了解决问题的方法,这些问题涉及使用for循环和列表推导来循环数据.阅读完文档后,对API有了不错的理解,我认为循环是"坏的",并且应该"永远"迭代数组,系列或DataFrame.那么,为什么我会不时地看到用户提出循环解决方案呢？

因此,要总结......我的问题是:
是否for循环真正的"坏"？如果不是,在什么情况下它们会比使用更传统的"矢量化"方法更好？¹

_{1 - 虽然这个问题确实听起来有点宽泛,但事实是,当for循环通常比传统的迭代数据更好时,存在非常具体的情况.这篇文章旨在为后人捕捉这一点.}

python iteration list-comprehension vectorization pandas

cs9*_*s95

2019 07-13

85
推荐指数

2
解决办法

7819
查看次数

如何将 pandas 数据框转换为带有列名的 numpy 数组

这必须使用向量化方法，无需迭代

我想从 pandas 数据帧创建一个 numpy 数组。

我的代码：

import pandas as pd
_df = pd.DataFrame({'itme': ['book', 'book' , 'car', ' car', 'bike', 'bike'], 'color': ['green', 'blue' , 'red', 'green' , 'blue', 'red'], 'val' : [-22.7, -109.6, -57.19, -11.2, -25.6, -33.61]})
 
item     color    val
book    green   -22.70
book    blue    -109.60
car     red     -57.19
car     green   -11.20
bike    blue    -25.60
bike    red     -33.61

Run Code Online (Sandbox Code Playgroud)

大约有 12,000 万行。

我需要创建一个 numpy 数组，例如：

item    green    blue     red
book    -22.70  -109.60   null
car     -11.20   null     -57.19
bike    null …

Run Code Online (Sandbox Code Playgroud)

python numpy dataframe pandas pytorch

use*_*011

2020 11-15

5
推荐指数

1
解决办法

2313
查看次数

标签统计

pandas ×3

python ×3

dataframe ×2

iteration ×1

list-comprehension ×1

numpy ×1

pytorch ×1

rows ×1

vectorization ×1

如何迭代Pandas中的DataFrame中的行？

对于有熊猫的循环 - 我什么时候应该关心？

如何将 pandas 数据框转换为带有列名的 numpy 数组

标签 统计

标签统计