小编vic*_*tor的帖子

数据透视表索引中的 NaN 值导致数据丢失

这是一个简单的数据帧:

> df = pd.DataFrame({'a': ['a1', 'a2', 'a3'],
                     'b': ['optional1', None, 'optional3'],
                     'c': ['c1', 'c2', 'c3'],
                     'd': [1, 2, 3]})
> df

    a          b   c  d
0  a1  optional1  c1  1
1  a2       None  c2  2
2  a3  optional3  c3  3
Run Code Online (Sandbox Code Playgroud)

枢轴方法 1

数据可以转为:

> df.pivot_table(index=['a','b'], columns='c')
                d     
c              c1   c3
a  b                  
a1 optional1  1.0  NaN
a3 optional3  NaN  3.0
Run Code Online (Sandbox Code Playgroud)

缺点:第 2 行中的数据丢失,因为df['b'][1] == None.

枢轴方法 2

> df.pivot_table(index=['a'], columns='c')
      d          
c    c1   c2   c3
a                
a1 …
Run Code Online (Sandbox Code Playgroud)

python pivot dataframe pandas

7
推荐指数
1
解决办法
3384
查看次数

为什么同线打印之间没有延迟?

print 'foo',
time.sleep(1)
print 'bar'
Run Code Online (Sandbox Code Playgroud)

这似乎先运行time.sleep(1),然后"foo bar"一次打印.

但是,打印两者foobar在其自己的行上打印会在打印语句之间产生预期的延迟:

print 'foo'
time.sleep(1)
print 'bar'
Run Code Online (Sandbox Code Playgroud)

是否有东西堆叠所有打印语句,直到收到新的行字符?

python printing delay output

3
推荐指数
1
解决办法
73
查看次数

标签 统计

python ×2

dataframe ×1

delay ×1

output ×1

pandas ×1

pivot ×1

printing ×1