我有一个字典,看起来像这样: di = {1: "A", 2: "B"}
我想将它应用于数据帧的"col1"列,类似于:
col1 col2
0 w a
1 1 2
2 2 NaN
Run Code Online (Sandbox Code Playgroud)
要得到:
col1 col2
0 w a
1 A 2
2 B NaN
Run Code Online (Sandbox Code Playgroud)
我该怎么做才能做到最好?出于某种原因谷歌搜索与此相关的术语只显示了如何从dicts制作列的链接,反之亦然: - /
我有一个227x4 DataFrame,国家名称和数值要清理(争吵?).
这是DataFrame的抽象:
import pandas as pd
import random
import string
import numpy as np
pdn = pd.DataFrame(["".join([random.choice(string.ascii_letters) for i in range(3)]) for j in range (6)], columns =['Country Name'])
measures = pd.DataFrame(np.random.random_integers(10,size=(6,2)), columns=['Measure1','Measure2'])
df = pdn.merge(measures, how= 'inner', left_index=True, right_index =True)
df.iloc[4,1] = 'str'
df.iloc[1,2] = 'stuff'
print(df)
Country Name Measure1 Measure2
0 tua 6 3
1 MDK 3 stuff
2 RJU 7 2
3 WyB 7 8
4 Nnr str 3
5 rVN 7 4
Run Code Online (Sandbox Code Playgroud)
如何np.nan在不触及国家/地区名称的情况下在所有列中替换字符串值? …
我有一个包含 11 列的数据框,我想根据其中两列中的值创建一个新的 0,1 列。
我已经尝试使用 np.where 创建其他列,但它不适用于这一列。
train["location"] = np.where(3750901.5068 <= train["x"] <= 3770901.5068
and -19268905.6133 <= train['y'] <= -19208905.6133, 1, 0)
Run Code Online (Sandbox Code Playgroud)
我收到此错误:ValueError:系列的真值不明确。使用 a.empty、a.bool()、a.item()、a.any() 或 a.all()。
我有一个像这样的DataFrame:
Kind Status
1 True
2 False
3 True
2 False
2 True
Run Code Online (Sandbox Code Playgroud)
我用它计算了种类,df.Kind.sort_values()
得到了这个:
1 1
2 3
3 1
Run Code Online (Sandbox Code Playgroud)
现在我想看看Kind 2中有多少是真或假的数字和百分比.像这样:
Art True False
2 1 2
2 0.33 0.66
Run Code Online (Sandbox Code Playgroud)
有人能帮我吗?最好的祝福