大熊猫应用更改 dtype

Seb*_*zny 5 python python-3.x pandas

我正在尝试将 Pandas 数据帧转换为一系列元组:

示例输入:

df = pd.DataFrame([[1,2,3.0],[3,4,5.0]])
Run Code Online (Sandbox Code Playgroud)

期望输出:

0    (1, 2, 3.0)
1    (3, 4, 5.0)
dtype: object    
Run Code Online (Sandbox Code Playgroud)

然而,熊猫似乎强迫我的整数列浮动。

我试过

import pandas as pd

df = pd.DataFrame([[1,2,3.0],[3,4,5]])
print(df)
print(df.dtypes)
print(df.apply(tuple,axis=1,reduce=False).apply(str))
Run Code Online (Sandbox Code Playgroud)

实际输出:

   0  1    2
0  1  2  3.0
1  3  4  5.0

0      int64
1      int64
2    float64
dtype: object

0    (1.0, 2.0, 3.0)
1    (3.0, 4.0, 5.0)
dtype: object
Run Code Online (Sandbox Code Playgroud)

这个问题建议使用,reduce=False但这对我来说没有任何改变。

有人能解释为什么大熊猫在途中强制某个地方的数据类型吗?

piR*_*red 5

pandas.DataFrame.itertuples

避免强迫你的整数浮动

pd.Series([*df.itertuples(index=False)])

0    (1, 2, 3.0)
1    (3, 4, 5.0)
dtype: object
Run Code Online (Sandbox Code Playgroud)

zip, map, splat... 魔法

pd.Series([*zip(*map(df.get, df))])

0    (1, 2, 3.0)
1    (3, 4, 5.0)
dtype: object
Run Code Online (Sandbox Code Playgroud)

  • 替代方案:`df.astype(object).apply(tuple,axis=1)` (5认同)