我有一些专栏['a', 'b', 'c', etc.](a并且c是float64while bis object)
我想将所有列转换为字符串并保留nans。
尝试使用df[['a', 'b', 'c']] == df[['a', 'b', 'c']].astype(str)但留下空白的float64列。
目前我正在一一经历以下内容:
df['a'] = df['a'].apply(str)
df['a'] = df['a'].replace('nan', np.nan)
Run Code Online (Sandbox Code Playgroud)
最好的方法是使用.astype(str)然后替换''为np.nan?附带问题:和 之间有区别吗?.astype(str).apply(str)
示例输入:(dtypes:a=float64、b=object、c=float64)
a, b, c, etc.
23, 'a42', 142, etc.
51, '3', 12, etc.
NaN, NaN, NaN, etc.
24, 'a1', NaN, etc.
Run Code Online (Sandbox Code Playgroud)
所需的输出:(dtypes:a=对象,b=对象,c=对象)
a, b, c, etc.
'23', 'a42', …Run Code Online (Sandbox Code Playgroud) 我认为这是一个非常简单的问题,但我无法找到答案.
我有一个数组:
array([ 62519, 261500, 1004836, ... , 0, 0])
Run Code Online (Sandbox Code Playgroud)
我想将它转换为正态分布,最小值为0,最大值为1.
有什么建议?我在看sklearn.preprocess.normalize,但无法让它为我工作.
目的是我创建一个带有numpy的散点图,并希望使用这个第三个变量为每个点着色.但是,颜色必须在0和1之间,因为我有一些奇怪的异常值,我认为正态分布将是一个良好的开端.
如果这没有任何意义,请告诉我.谢谢和欢呼.
我在 excel 中有一个组合图,带有簇状条形图(用于箱线图)和线条。我试图在线条前面显示条形图/箱形图,但我能够这样做。
我尝试将条形图移动到“选择数据”中的顶部和/或底部 - 但没有变化。
有什么建议?
我正在使用 Excel 2013。
谢谢!
我正在尝试检查重复项。我使用df['name_duplicated'] = df.duplicated('name', keep=False)
但是,这会将任何带有name= 的行NaN视为重复。
有谁知道如何解决这个问题?
我正在尝试,df[pd.isnull(df['name'])]['name_duplicated'] = False但出现错误。
我想平均N通过Type的值Inst
我的数据设置为:
Type, Inst, N
A, A1, 4
A, A1, 13
A, A1, 13
A, A2, 4
A, A3, 5
B, B1, 4
B, b2, 10
Run Code Online (Sandbox Code Playgroud)
所以我想看到一个带有A: 13, B:7. 有什么建议?如果我放入AVG(N)行和Type列,我会得到A: 7.8, B:7
问题是,的Tableau均全部N按Type,但我想分子是总N的Type,而分母是唯一数目Inst内Type
我想遍历数据框中的所有列,并重命名(或映射)列(如果它们包含某些字符串)。
例如:使用字符串 'agri' 重命名包含 'agriculture' 的所有列
我正在考虑使用rename,str.contains但无法弄清楚如何将它们结合起来实现我想要的。
pandas ×3
python-2.7 ×3
python ×2
arrays ×1
charts ×1
duplicates ×1
excel ×1
legend ×1
matplotlib ×1
numpy ×1
string ×1
tableau-api ×1
z-order ×1