任何人都可以看到为什么这不起作用?
它试图做; 如果列名包含文本'Andy',则创建一个名为Andy的列并将该行设置为1
df.loc[df['Name'].str.contains(['Andy']),'Andy']=1
Run Code Online (Sandbox Code Playgroud) 我有一个数据框,按以下顺序排列;
'2','4','9','A','1','B','C'
Run Code Online (Sandbox Code Playgroud)
我希望前 3 列是 ABC,但其余的无关紧要。
输出:
'A','B','C','3','2','9'... and so on
Run Code Online (Sandbox Code Playgroud)
这可能吗?
(有 100 列,所以我不能把它们都放在一个列表中
我看过很多类似的帖子,但似乎没有人回答这个问题:
我有一个包含多列的数据框。让我们说 A、B 和 C
我想根据 A、B 和 C 上的条件更改 A 列的值
到目前为止我已经有了这个,但没有工作。
df=df.loc[(df['A']=='Harry')
& (df['B']=='George')
& (df['C']>'2019'),'A']=='Matt'
Run Code Online (Sandbox Code Playgroud)
所以如果A等于Harry,B等于George,C大于2019,那么把A改成Matt
有人看到我做错了什么吗?
如果它以某个单词开头,是否可以更改pandas数据框中列的名称.
ee如果列以DEP开头,则将全名更改为KEEP.
[col for col in df if col.startswith('DEP') then KEEP].
Run Code Online (Sandbox Code Playgroud) 我有一个带有4个列A,B,C和D的数据框df
我想将这些列的每个组合都加倍。
到目前为止,我有;
columns=[A,B,C,D]
a= combinations(columns)
for i in a:
df[outname]=df[a].multiply()
Run Code Online (Sandbox Code Playgroud)
但显然这是不正确的。
谁能看到一个好方法?
输出:
A B C D AB AC AD BC ABC and so on
0
1
2
3
4
6
7
Run Code Online (Sandbox Code Playgroud) 我的数据框中有 3 列。我已经将它们全部绘制成图表,下面的代码将它们并排放置在一个子图中。我想将第三个图表“c”更改为对数刻度。这可能吗?
fig = make_subplots(rows=1, cols=3)
fig.add_trace(
go.Scatter(x = df.index,y = df['a'],mode = 'lines+markers',name = 'Daily')
fig.add_trace(
go.Scatter(x = df.index,y = df['b'],mode = 'lines+markers',name = 'Total' )
fig.add_trace(
go.Scatter(x = df.index,y = df['c'],mode = 'lines+markers',name = 'Total'
)
fig.layout()
fig.update_layout(height=600, width=800, title_text="Subplots")
fig.show()
Run Code Online (Sandbox Code Playgroud) 我一直在尝试找到一种在 Python 中的 OLS/GLS 回归中指定预定义系数的方法。我可以在 R 中使用 来做到这一点offset,但在 Python 中似乎没有类似的东西。
R 等效值:
model=lm(y~x+offset(0.2*z))
Run Code Online (Sandbox Code Playgroud)
所以在这个例子中,x和z是我们的自变量,x是由模型预测的,但我们指定z的影响是0.2
我有一列 MMM YY 格式的日期,想更改为日期时间
例如,是否可以将 2016 年 12 月转换为 python 中的日期?那么输出是 01/12/2016 吗?
我有一个来自数据框的条形图:
fig = df.iplot(asFigure=True, kind='bar', barmode = 'relative')
py.iplot(fig)
Run Code Online (Sandbox Code Playgroud)
是否可以将数据框中的一列转换为线系列?
我有一个数据框,我想删除 A 列等于蓝色且列 B 等于绿色的所有行。
我虽然下面应该工作,但事实并非如此。
任何人都可以看到问题
df=df.loc[~(df['A']=='blue' & df['B']=='green')]
Run Code Online (Sandbox Code Playgroud) python ×8
pandas ×7
plotly ×2
combinations ×1
loc ×1
multiplying ×1
regression ×1
series ×1
string ×1