我想访问 Google Drive 的“与我共享”目录中的文件。
在 Colab python notebook 中,以下命令:
import os
from google.colab import drive
drive.mount('/content/drive')
!ls "/content/drive/My Drive"
Run Code Online (Sandbox Code Playgroud)
然而,适用于“我的驱动器”目录
!ls "/content/drive/My Drive"
Run Code Online (Sandbox Code Playgroud)
失败
FileNotFoundError: [Errno 2] 没有这样的文件或目录:
我知道我可以手动将文件夹添加到我的驱动器并继续(如此处所述),但我想直接访问共享文件夹,例如我可能需要自动处理文件与我实时分享。
我也知道“OneDrive”等其他云平台存在相同/类似的问题。
问题是:
python shared-directory google-colaboratory flysystem-google-drive
假设我有两个数据框:
DF1:
A
0 a
1 b
Run Code Online (Sandbox Code Playgroud)
DF2:
A
0 a
1 c
Run Code Online (Sandbox Code Playgroud)
我想要的结果是联合两帧的与额外的列表示该行属于源数据帧.如果有重复项,应删除重复项,相应的额外列应显示两个来源:
A B
0 a df1, df2
1 b df1
2 c df2
Run Code Online (Sandbox Code Playgroud)
我可以得到连接数据框(df3)没有重复,如下所示:
import pandas as pd
df3=pd.concat([df1,df2],ignore_index=True).drop_duplicates().reset_index(drop=True)
Run Code Online (Sandbox Code Playgroud)
我想不出/找到一种方法可以控制哪个元素去哪里.如何添加额外的列?
非常感谢您的任何提示.