小编Fri*_*ker的帖子

熊猫:如何从Excel文件中读取DataFrame,其中多行有时由换行符(\ n)分隔

我正在尝试在熊猫中读取一些Excel文件。在某些文件中,目标表的格式不完美,即多行被格式化为单行,但每一行都有多行。因此,当您查看excel文件时,数据看起来很好。同样,使用pandas解析时,每行此类的末尾确实会有换行符(\ n)。

问题是,当我使用read_excel()函数读取它时,它会将其转换为DataFrame,该DataFrame不会将此换行符视为单独的一行,而是将其放入其中带有\ n的一行。我想编写一个代码,将N行这样的每一行都作为N行来对待/转换(使用换行符作为新行的指示器)。

有没有办法在解析文件时或在Python中对数据帧进行后处理?

在这里,我提供了我的虚拟excel文件的非常简化的版本以及一些解释该问题的代码。

样本Excel文件:

Name                | Price
-------------------------------
Coca Cola           |     46.66
-------------------------------
Google              |   1204.44
Facebook            |    177.58
-------------------------------
Berkshire Hathaway  | 306513.75
Run Code Online (Sandbox Code Playgroud)

我只是在Python中使用Pandas的read_excel:

dataframe_parsed = pandas.read_excel(file_name)
print(dataframe_parsed.head())
Run Code Online (Sandbox Code Playgroud)

我得到以下DataFrame作为输出:

                 Name            Price
0           Coca Cola            46.66
1    Google\nFacebook  1204.44\n177.58
2  Berkshire Hathaway        306513.75
Run Code Online (Sandbox Code Playgroud)

所需的输出是:

                 Name           Price
0           Coca Cola           46.66
1              Google         1204.44
2            Facebook          177.58
3  Berkshire Hathaway       306513.75
Run Code Online (Sandbox Code Playgroud)

任何帮助将不胜感激。

python excel parsing dataframe pandas

5
推荐指数
1
解决办法
229
查看次数

如何在 Debian 上安装 Clang 11

我正在尝试使用“Debian GNU/Linux 10”在 PC 上编译 C++ 项目。该项目需要 clang,所以我安装了它:

sudo apt-get install clang
Run Code Online (Sandbox Code Playgroud)

但是我遇到了以下错误:

Clang version must be at least 11, the version used is 7.0.1
Run Code Online (Sandbox Code Playgroud)

我如何安装clang 11?

注意:我不想再次安装整个 LLVM 包。只想将 Clang 从版本 7 升级到 11,最好通过命令行。

c++ linux debian gnu clang

2
推荐指数
1
解决办法
6227
查看次数

标签 统计

c++ ×1

clang ×1

dataframe ×1

debian ×1

excel ×1

gnu ×1

linux ×1

pandas ×1

parsing ×1

python ×1