我有一个包含面板数据的数据框,假设它是 100 个不同对象的时间序列:
object period value
1 1 24
1 2 67
...
1 1000 56
2 1 59
2 2 46
...
2 1000 64
3 1 54
...
100 1 451
100 2 153
...
100 1000 21
Run Code Online (Sandbox Code Playgroud)
我想添加一个新列prev_value,它将value为每个对象存储以前的内容:
object period value prev_value
1 1 24 nan
1 2 67 24
...
1 99 445 1243
1 1000 56 445
2 1 59 nan
2 2 46 59
...
2 1000 64 784
3 …Run Code Online (Sandbox Code Playgroud) 我有两个数据框:
df1 =
value
0 a
1 b
2 c
df2 =
value
0 d
1 e
Run Code Online (Sandbox Code Playgroud)
我需要跨索引将它们连接起来,但是我必须保留第一个数据帧的索引,然后在第二个数据帧中继续它,如下所示:
result =
value
0 a
1 b
2 c
3 d
4 e
Run Code Online (Sandbox Code Playgroud)
我的猜测是,pd.concat([df1, df2], ignore_index=True)这项工作会做好。但是,我担心对于大型数据帧,行的顺序可能会更改,而我最终会得到这样的结果(前两行更改了索引):
result =
value
0 b
1 a
2 c
3 d
4 e
Run Code Online (Sandbox Code Playgroud)
所以我的问题是,pd.concatwith ignore_index=True将索引连续保存在正在连接的数据帧中,还是索引分配存在随机性?
我使用的是不断写入/读取的 MS SQL 数据库,以及通过链接服务器连接链接到的数据库。SET TRANSACTION ISOLATION LEVEL READ UNCOMMITTED这就是我在运行的每个查询中使用的原因。我的问题是,此事务级别是否会用于链接服务器上运行的查询?假设我的服务器被调用General并且它链接到服务器Linked。如果我运行以下查询:
select *
from General.TableName
join Linked.[Database].dbo.AnotherTableName on 1 = 1
Run Code Online (Sandbox Code Playgroud)
会Linked.Database.dbo.AnotherTableName被(IS)锁定吗?
我有一个数据帧,其中包含100个对象的时间序列:
object period value
1 1 24
1 2 67
...
1 1000 56
2 1 59
2 2 46
...
2 1000 64
3 1 54
...
100 1 451
100 2 153
...
100 1000 21
Run Code Online (Sandbox Code Playgroud)
我想使用该窗口的窗口10计算移动平均值value。我想我必须做类似的事情
df.groupby('object').apply(lambda ~calculate MA~)
Run Code Online (Sandbox Code Playgroud)
然后按对象将此系列合并到原始数据帧?无法找出确切的命令