我有一个看起来像这样的代码:
\n\n%%time\nimport time\ntime.sleep(3)\n
Run Code Online (Sandbox Code Playgroud)\n\n当我在 jupyter 中执行此单元时,我得到以下输出:
\n\nCPU times: user 791 \xc2\xb5s, sys: 1.47 ms, total: 2.27 ms\nWall time: 3 s\n
Run Code Online (Sandbox Code Playgroud)\n\n我的问题是,当我放置时,sleep(3)
总时间不应该是 3 秒而不是 2.27 毫秒。
我有一个包含许多列的大型pandas数据框.
我想更改列的顺序,以便只显示其中的一部分.我不关心其余的排序(并且有太多的变量可以列出所有)
例如,如果我的数据框是这样的
a b c d e f g h i
5 8 7 2 1 4 1 2 3
1 4 2 2 3 4 1 5 3
Run Code Online (Sandbox Code Playgroud)
我想指定列的子集
mysubset=['d','f']
并重新排序数据框,以便现在列的顺序
d,f,a,b,c,e,g,h,i
有没有办法以熊猫式的方式做到这一点?
我想把一个索引为'length'的列,并将其作为我的第二列.它目前作为第5列存在.我试过了:
colnames = big_df.columns.tolist()
# make index "length" the second column in the big_df
colnames = colnames[0] + colnames[4] + colnames[:-1]
big_df = big_df[colnames]
Run Code Online (Sandbox Code Playgroud)
我看到以下错误:
TypeError:必须是str,而不是list
我不确定如何解释这个错误,因为它实际上应该是一个list
,对吧?
另外,是否有通用方法将任何列按标签移动到指定位置?我的列只有一个级别,即没有MultiIndex
涉及.
我目前正在处理一组具有双标头的类似数据帧。它们具有以下结构:
age height weight shoe_size
RHS height weight shoe_size
0 8.0 6.0 2.0 1.0
1 8.0 NaN 2.0 1.0
2 6.0 1.0 4.0 NaN
3 5.0 1.0 NaN 0.0
4 5.0 NaN 1.0 NaN
5 3.0 0.0 1.0 0.0
height weight shoe_size age
RHS weight shoe_size age
0 1.0 1.0 NaN NaN
1 1.0 2.0 0.0 2.0
2 1.0 NaN 0.0 5.0
3 1.0 2.0 0.0 NaN
4 0.0 1.0 0.0 3.0
Run Code Online (Sandbox Code Playgroud)
实际上,主要区别在于第一个标题行的排序(可以对所有标题行进行相同的排序)以及第二个标题行中 RHS 标题列的位置。我目前想知道是否有一种简单的方法可以将所有这些 DataFrame 保存到单个 CSV 文件中/从单个 CSV …