小编pin*_*nky的帖子

pandas基于列中的相同值合并数据帧

我有2个数据帧如下:

   student_name student_id   
1  may          0000  
2  june         1111  
3  july         2222 

  member_id member_name school_name
1 A0        april       MIT
2 B0        may         NIT
3 C0        june        LIT
Run Code Online (Sandbox Code Playgroud)

我想加入2数据帧,以产生如下结果.

student_name student_id member_id member_name school_name
may          0000       B0        may         NIT
june         1111       C0        june        LIT
Run Code Online (Sandbox Code Playgroud)

我认为在sql方式中student_name = member_name.但我几乎无法在熊猫中做到这一点.

我已经尝试了pandas merge,它可以基于同一个名称列.你能教我一个简单的方法来得到所需的结果吗?

谢谢.

python dataframe pandas

3
推荐指数
1
解决办法
3261
查看次数

pysmb 获取 smb 共享服务器的目录树

我设法使用 pysmb 连接和访问 smb 共享服务器。我的意思是从服务器读取/写入/删除/创建文件/文件夹。

大多数情况下,我需要根据 smb 设备和服务名称(pysmb 术语)从服务器读取文件(无论是 jpg 还是 csv 等)。

基本上我不知道 smb 设备中的文件名和目录名是什么。这意味着命名是动态的。

我想知道在处理读取文件之前先获取过滤的目录树是个好主意。文件和目录的数量未知,大约 3 个月的数据约为 60TB。

listShares(timeout=30)[source]
listPath(service_name, path, search=55, pattern='*', timeout=30)
Run Code Online (Sandbox Code Playgroud)

上述方法仅获得层次结构的 1 个特定级别。我想要的是类似的输出os.walk.path()

有人有想法的经验吗?我能得到建议吗?非常感谢您。

python linux samba os.walk

2
推荐指数
2
解决办法
7410
查看次数

标签 统计

python ×2

dataframe ×1

linux ×1

os.walk ×1

pandas ×1

samba ×1