小编Msq*_*are的帖子

Python Pandas DataFrame 从 0 开始重新索引某个数据

我的代码如下:我从原始数据框中提取了部分数据。我希望新数据帧的索引从 0 开始。奇怪的是,它带有旧索引。我尝试过reset_index(),但没有成功。有任何输入吗?

a = [10,20,30,40,50,60]
a = pd.DataFrame(a,columns=['Data'])
print(a)
b = pd.DataFrame(a['Data'][3:5])
print(b)
b.reset_index()
print(b)
Run Code Online (Sandbox Code Playgroud)

输出是:

      Data
0    10
1    20
2    30
3    40
4    50
5    60
   Data
3    40
4    50
   Data
3    40
4    50
Run Code Online (Sandbox Code Playgroud)

我期望b数据帧的索引如下:

Data
0    40
1    50
Run Code Online (Sandbox Code Playgroud)

我按照建议尝试了以下代码,jezrael这是我接受的答案,它完美地工作了:

b.reset_index(inplace=True,drop=True)
print (b)
Run Code Online (Sandbox Code Playgroud)

新的输出是:

    Data
0    40
1    50
Run Code Online (Sandbox Code Playgroud)

但是,我不需要索引列。

dataframe python-3.x pandas

4
推荐指数
1
解决办法
5051
查看次数

我的数据框有很多(192)列.如何选择两列?

我的数据框就像df.columns= ['Time1','Pmpp1','Time2',..........,'Pmpp96']我想一次选择两个连续的列.例如,Time1,Pmpp1在一个时间.我的代码是:

for i,j in zip(df.columns,df.columns[1:]):
    print(i,j)
Run Code Online (Sandbox Code Playgroud)

我现在的输出是:

 Time1 Pmmp1
 Pmmp1 Time2
 Time2 Pmpp2
Run Code Online (Sandbox Code Playgroud)

预期产出是:

 Time1 Pmmp1
 Time2 Pmpp2
 Time3 Pmpp3 
Run Code Online (Sandbox Code Playgroud)

python indexing dataframe pandas

3
推荐指数
1
解决办法
71
查看次数

在 Python Pandas 中查找每日最大值及其时间戳 (yyyy:mm:dd hh:mm:ss)

事实上,我有两年来每天每分钟测量的 150 MB 数据。我在这里给出了示例数据。我想创建一个新的数据框,其中包含每天的最大值及其时间戳。我的样本数据是:

    DateTime            Power
01-Aug-16 10:43:00.000  229.9607961
01-Aug-16 10:43:23.000  230.9030781
01-Aug-16 10:44:00.000  231.716212
01-Aug-16 10:45:00.000  232.4485882
01-Aug-16 10:46:00.000  233.2739154
02-Aug-16 09:42:00.000  229.6851724
02-Aug-16 09:43:00.000  230.9163998
02-Aug-16 09:43:06.000  230.9883337
02-Aug-16 09:44:00.000  231.2569098
02-Aug-16 09:49:00.000  229.5774805
02-Aug-16 09:50:00.000  229.8758693
02-Aug-16 09:51:00.000  229.9825204
03-Aug-16 10:09:00.000  231.3605982
03-Aug-16 10:10:00.000  231.6827163
03-Aug-16 10:11:00.000  231.1580262
03-Aug-16 10:12:00.000  230.4054286
03-Aug-16 10:13:00.000  229.6507959
03-Aug-16 10:13:02.000  229.6268353
03-Aug-16 10:14:00.000  230.4584964
03-Aug-16 10:15:00.000  230.9004206
03-Aug-16 10:16:00.000  231.189036
Run Code Online (Sandbox Code Playgroud)

我现在的代码是:

max_per_day = df.groupby(pd.Grouper(key='time',freq='D')).max()
print(max_per_day)
Run Code Online (Sandbox Code Playgroud)

我目前的输出是:

    time                  
2016-08-01  237.243835
2016-08-02  239.658539 …
Run Code Online (Sandbox Code Playgroud)

python pandas

2
推荐指数
1
解决办法
1539
查看次数

tkinter的变量和StringVar()有什么区别

码:

import tkinter as tk
a = "hi"
print(a)
a1 = tk.StringVar()
a1.set("Hi")
print(a1)
Run Code Online (Sandbox Code Playgroud)

输出:

hi ##(Output from first print function) 

AttributeError: 'NoneType' object has no attribute '_root' (Output from second print function) 
Run Code Online (Sandbox Code Playgroud)

我的问题:

是什么区别a,并a1在上面的代码及其使用情况。为什么a1给出错误?

tkinter python-3.x

0
推荐指数
3
解决办法
7385
查看次数

标签 统计

pandas ×3

dataframe ×2

python ×2

python-3.x ×2

indexing ×1

tkinter ×1