将 Markdown 格式的表格从 SO 复制到 pandas 剪贴板

Aks*_*gal 5 python pandas

pd.read_clipboard()当在 SO 上发布的数据在列之间有空格时,我很乐意使用( '\s\s+')

然而,如何将下表直接复制到 pandas 数据框呢?

记录ID 共享于
(UNIX 时间戳)
股份类型 分享给用户
1 1611872850 共享 用户A
2 1611872851 共享 用户B
3 1611872852 共享 用户B
1 1611872853 共享已删除 用户A

我尝试找到一些可以帮助我解决这个问题的东西,而我最接近复制此数据框的是使用以下内容,其中有很多不必要的列和不必要的空间,我稍后必须使用它们来df.col.str.strip()清理。

#Clicking edit on the question, and copying the underlying markdown
pd.read_clipboard('|')
Run Code Online (Sandbox Code Playgroud)
   Unnamed: 0   Record ID    Shared On<br/>(UNIX timestamp)    \
0         NaN  ------------                      ------------   
1         NaN   1                                 1611872850    
2         NaN   2                                 1611872851    
3         NaN   3                                 1611872852    
4         NaN   1                                 1611872853    

    Share type       Share To User   Unnamed: 5  
0  ---------------  ---------------         NaN  
1   shared           user A                 NaN  
2   shared           user B                 NaN  
3   shared           user B                 NaN  
4   share_removed    user A                 NaN  

Run Code Online (Sandbox Code Playgroud)

有人知道更好的方法吗?谢谢!

Qua*_*ang 5

好像

pd.read_clipboard(sep='\s*\|\s*').iloc[1:,1:-1]
Run Code Online (Sandbox Code Playgroud)

效果很好。输出:

  Record ID Shared On<br/>(UNIX timestamp)     Share type Share To User
1         1                     1611872850         shared        user A
2         2                     1611872851         shared        user B
3         3                     1611872852         shared        user B
4         1                     1611872853  share_removed        user A
Run Code Online (Sandbox Code Playgroud)

  • +1,但我还认为应该注意的是,如果您可以编辑问题并复制降价,那么这是有效的,但仅复制问题中渲染的表格是行不通的。 (3认同)