小编Ama*_*nda的帖子

用另一个数据帧的值替换一个数据帧中的列值

我有两个数据帧,第一个有1000行,看起来像:

Date            Group         Family       Bonus
2011-06-09      tri23_1       Laavin       456
2011-07-09      hsgç_T2       Grendy       679
2011-09-10      bbbj-1Y_jn    Fantol       431
2011-11-02      hsgç_T2       Gondow       569
Run Code Online (Sandbox Code Playgroud)

该列Group具有不同的值,有时会重复,但通常约有50个唯一值.

第二个数据框包含所有这50个唯一值(50行)以及与这些值相关联的酒店:

Group             Hotel
tri23_1           Jamel
hsgç_T2           Frank
bbbj-1Y_jn        Luxy
mlkl_781          Grand Hotel
vchs_94           Vancouver
Run Code Online (Sandbox Code Playgroud)

我的目标是Group将第一个数据帧的列中的值替换为Hotel第二个数据帧的列Hotel的相应值,或者使用相应的值创建列.当我试图通过任务来完成它时

df1.loc[(df1.Group=df2.Group), 'Hotel']=df2.Hotel
Run Code Online (Sandbox Code Playgroud)

我有一个错误,即数据帧的大小不同,因此无法进行比较

python search dataframe pandas

19
推荐指数
3
解决办法
2万
查看次数

在pandas dataframe中以相同字符串开头的列的值的总和

我有一个大约100列的数据框,看起来像

   Id  Economics-1  English-107  English-2  History-3  Economics-zz  Economics-2  \
0  56          1            1          0        1       0           0   
1  11          0            0          0        0       1           0   
2   6          0            0          1        0       0           1   
3  43          0            0          0        1       0           1   
4  14          0            1          0        0       1           0   

   Histo      Economics-51      Literature-re         Literatureu4  
0           1            0           1                0  
1           0            0           0                1  
2           0            0           0                0  
3           0            1           1                0  
4           1            0           0                0  
Run Code Online (Sandbox Code Playgroud)

所以我的目标是只留下更多的全球类别:只有英语,历史,文学,并在这些数据帧中写出其组成部分的总和,例如英语:英语-107,英语-2

    Id …
Run Code Online (Sandbox Code Playgroud)

python startswith dataframe pandas

6
推荐指数
2
解决办法
4348
查看次数

pandas 方式将一天中的时间(有效 datetime.time)转换为浮点变量

我有一个 pandas 数据框,其中一列是时间,有效的 datime.time 格式,如下所示:

Time
16:32:00
17:13:00
18:10:00
Run Code Online (Sandbox Code Playgroud)

如果存在一种经典的Pythonic方法来将这个时间转换为浮点变量,那么它的16:32计算方式就会16+32/60变成16.53

python floating-point time datetime pandas

3
推荐指数
1
解决办法
3601
查看次数

解析json而没有explciitely调用键名

我有一个类似json的文件,每行看起来有效的json

{"Some_key": {"name": "Tom", "school_code":"5678", "sport": "football", "score":"3.46", "classId": "456"}}
{"Another_one": {"name": "Helen", "school_code":"7657", "sport": ["swimming", "score":"9.8", "classId": "865"}}
{"Yet_another_one_": {"name": "Mikle", "school_code":"7655", "sport": "tennis", "score":"5.7", "classId": "76532"}}
Run Code Online (Sandbox Code Playgroud)

所以我需要通过提取这些第一个键(即"Some_Key","Another_key"等)来创建字典(?不是真的需要字典格式,而是任何可以帮助我将键与值,两个元素的数组相关联)的东西,我事先不知道,然后将它们与词典中的得分键值相关联.像这样的东西:

("Some_key":"3.46", "Another_Key":"9.8", "Yet_another_one_"; "5.7")
Run Code Online (Sandbox Code Playgroud)

我不知道在没有明确调用键名的情况下提取内容的方法,所以您的想法非常受欢迎!

python parsing json dictionary key

1
推荐指数
1
解决办法
127
查看次数

将文件从根目录的子目录上移

我有以下文件夹层次结构:

----Folder
------Subfolders
-----------Sub-sub-folder
--------------Files
Run Code Online (Sandbox Code Playgroud)

所以我有多个子文件夹,并且在每个子文件夹中我都有一个包含多个文件的子子文件夹,我想从子子文件夹向上移动到子文件夹

最简单、最肮脏的方法是:只需将文件从子子文件夹复制到子文件夹,然后删除子子文件夹。但如果你知道更好的 pythonic 方法,请告诉我

python directory file

0
推荐指数
1
解决办法
1814
查看次数