我有2个数据帧如下:
student_name student_id
1 may 0000
2 june 1111
3 july 2222
member_id member_name school_name
1 A0 april MIT
2 B0 may NIT
3 C0 june LIT
Run Code Online (Sandbox Code Playgroud)
我想加入2数据帧,以产生如下结果.
student_name student_id member_id member_name school_name
may 0000 B0 may NIT
june 1111 C0 june LIT
Run Code Online (Sandbox Code Playgroud)
我认为在sql方式中student_name = member_name.但我几乎无法在熊猫中做到这一点.
我已经尝试了pandas merge,它可以基于同一个名称列.你能教我一个简单的方法来得到所需的结果吗?
谢谢.
我设法使用 pysmb 连接和访问 smb 共享服务器。我的意思是从服务器读取/写入/删除/创建文件/文件夹。
大多数情况下,我需要根据 smb 设备和服务名称(pysmb 术语)从服务器读取文件(无论是 jpg 还是 csv 等)。
基本上我不知道 smb 设备中的文件名和目录名是什么。这意味着命名是动态的。
我想知道在处理读取文件之前先获取过滤的目录树是个好主意。文件和目录的数量未知,大约 3 个月的数据约为 60TB。
listShares(timeout=30)[source]
listPath(service_name, path, search=55, pattern='*', timeout=30)
Run Code Online (Sandbox Code Playgroud)
上述方法仅获得层次结构的 1 个特定级别。我想要的是类似的输出os.walk.path()。
有人有想法的经验吗?我能得到建议吗?非常感谢您。