小编Eli*_* K.的帖子

在 Pandas 数据框中将列转换为多行

我有一个看起来像这样的数据框:

   Deal  Year  Quarter_1  Quarter_2  Quarter_3  Financial_Data
h     1  1991          1          2          3             120
i     2  1992          4          5          6              80
j     3  1993          7          8          9             100
Run Code Online (Sandbox Code Playgroud)

我想将所有季度合并到一个新列中并复制交易编号、年份和财务数据。最终结果应如下所示:

   Deal  Year  Quarter  Financial_Data
h     1  1991        1             120
i     1  1991        2             120
j     1  1991        3             120
k     2  1992        4              80
l     2  1992        5              80
m     2  1992        6              80
n     3  1993        7             100
o     3  1993        8             100
p     3  1993        9             100
Run Code Online (Sandbox Code Playgroud)

python dataframe pandas

6
推荐指数
1
解决办法
5254
查看次数

在导入时指定 dtype 选项或设置 low_memory=False

我正在使用以下代码:

df = pd.read_csv('/Python Test/AcquirerRussell3000.csv')
Run Code Online (Sandbox Code Playgroud)

我有以下类型的数据:

18.07.2000  27.1875         0 08.08.2000  25.3125       0.1 05.09.2000  \
0   19.07.00  26.6250 -0.020690   09.08.00  25.2344 -0.003085   06.09.00   
1   20.07.00  26.6250  0.000000   10.08.00  25.1406 -0.003717   07.09.00   
2   21.07.00  25.6875 -0.035211   11.08.00  25.5781  0.017402   08.09.00   
3   24.07.00  26.2500  0.021898   14.08.00  25.4375 -0.005497   11.09.00   
4   25.07.00  26.6875  0.016667   15.08.00  25.5625  0.004914   12.09.00 
Run Code Online (Sandbox Code Playgroud)

我收到以下错误:

Pythone Test/untitled0.py:1: DtypeWarning: Columns (long list of numbers) have mixed types. 
Specify dtype option on import or set low_memory=False.
Run Code Online (Sandbox Code Playgroud)

所以每第三列是一个日期,其余的都是数字。我想没有单一的数据类型,因为日期是字符串,其余的是浮点数或整数?我有大约 5000 列或更多和大约 400 行。

我见过与此类似的问题,但不太知道如何将其应用于我的数据。此外,我想在堆叠数据帧之后运行以下代码。 …

python dataframe pandas

3
推荐指数
1
解决办法
1万
查看次数

标签 统计

dataframe ×2

pandas ×2

python ×2