pd.read_clipboard()当在 SO 上发布的数据在列之间有空格时,我很乐意使用( '\s\s+')
然而,如何将下表直接复制到 pandas 数据框呢?
| 记录ID | 共享于 (UNIX 时间戳) |
股份类型 | 分享给用户 |
|---|---|---|---|
| 1 | 1611872850 | 共享 | 用户A |
| 2 | 1611872851 | 共享 | 用户B |
| 3 | 1611872852 | 共享 | 用户B |
| 1 | 1611872853 | 共享已删除 | 用户A |
我尝试找到一些可以帮助我解决这个问题的东西,而我最接近复制此数据框的是使用以下内容,其中有很多不必要的列和不必要的空间,我稍后必须使用它们来df.col.str.strip()清理。
#Clicking edit on the question, and copying the underlying markdown
pd.read_clipboard('|')
Run Code Online (Sandbox Code Playgroud)
Unnamed: 0 Record ID Shared On<br/>(UNIX timestamp) \
0 NaN ------------ ------------
1 NaN 1 1611872850
2 NaN 2 1611872851
3 NaN 3 1611872852
4 NaN 1 1611872853
Share type Share To User Unnamed: 5
0 --------------- --------------- NaN
1 shared user A NaN
2 shared user B NaN
3 shared user B NaN
4 share_removed user A NaN
Run Code Online (Sandbox Code Playgroud)
有人知道更好的方法吗?谢谢!
好像
pd.read_clipboard(sep='\s*\|\s*').iloc[1:,1:-1]
Run Code Online (Sandbox Code Playgroud)
效果很好。输出:
Record ID Shared On<br/>(UNIX timestamp) Share type Share To User
1 1 1611872850 shared user A
2 2 1611872851 shared user B
3 3 1611872852 shared user B
4 1 1611872853 share_removed user A
Run Code Online (Sandbox Code Playgroud)