小编pin*_*nky的帖子

pandas基于列中的相同值合并数据帧

我有2个数据帧如下:

   student_name student_id   
1  may          0000  
2  june         1111  
3  july         2222 

  member_id member_name school_name
1 A0        april       MIT
2 B0        may         NIT
3 C0        june        LIT

Run Code Online (Sandbox Code Playgroud)

我想加入2数据帧,以产生如下结果.

student_name student_id member_id member_name school_name
may          0000       B0        may         NIT
june         1111       C0        june        LIT

Run Code Online (Sandbox Code Playgroud)

我认为在sql方式中student_name = member_name.但我几乎无法在熊猫中做到这一点.

我已经尝试了pandas merge,它可以基于同一个名称列.你能教我一个简单的方法来得到所需的结果吗？

谢谢.

python dataframe pandas

pin*_*nky

lucky-day

3
推荐指数

1
解决办法

3261
查看次数

pysmb 获取 smb 共享服务器的目录树

我设法使用 pysmb 连接和访问 smb 共享服务器。我的意思是从服务器读取/写入/删除/创建文件/文件夹。

大多数情况下，我需要根据 smb 设备和服务名称（pysmb 术语）从服务器读取文件（无论是 jpg 还是 csv 等）。

基本上我不知道 smb 设备中的文件名和目录名是什么。这意味着命名是动态的。

我想知道在处理读取文件之前先获取过滤的目录树是个好主意。文件和目录的数量未知，大约 3 个月的数据约为 60TB。

listShares(timeout=30)[source]
listPath(service_name, path, search=55, pattern='*', timeout=30)

Run Code Online (Sandbox Code Playgroud)

上述方法仅获得层次结构的 1 个特定级别。我想要的是类似的输出os.walk.path()。

有人有想法的经验吗？我能得到建议吗？非常感谢您。

python linux samba os.walk

pin*_*nky

lucky-day

2
推荐指数

2
解决办法

7410
查看次数

标签统计

python ×2

dataframe ×1

linux ×1

os.walk ×1

pandas ×1

samba ×1

pandas基于列中的相同值合并数据帧

pysmb 获取 smb 共享服务器的目录树

标签 统计

小编pin_nky的帖子

标签统计