小编use*_*336的帖子

如何制作进度条,以便从大型xlsx文件加载pandas DataFrame?

来自https://pypi.org/project/tqdm/

import pandas as pd
import numpy as np
from tqdm import tqdm

df = pd.DataFrame(np.random.randint(0, 100, (100000, 6)))
tqdm.pandas(desc="my bar!")p`
df.progress_apply(lambda x: x**2)
Run Code Online (Sandbox Code Playgroud)

我接受了这段代码并对其进行了编辑,以便从load_excel创建一个DataFrame而不是使用随机数:

import pandas as pd
from tqdm import tqdm
import numpy as np

filename="huge_file.xlsx"
df = pd.DataFrame(pd.read_excel(filename))
tqdm.pandas()
df.progress_apply(lambda x: x**2)
Run Code Online (Sandbox Code Playgroud)

这给了我一个错误,所以我将df.progress_apply更改为:

df.progress_apply(lambda x: x)
Run Code Online (Sandbox Code Playgroud)

这是最终代码:

import pandas as pd
from tqdm import tqdm
import numpy as np

filename="huge_file.xlsx"
df = pd.DataFrame(pd.read_excel(filename))
tqdm.pandas()
df.progress_apply(lambda x: x)
Run Code Online (Sandbox Code Playgroud)

这会产生一个进度条,但实际上并没有显示任何进度,而是加载进度条,并且当​​操作完成时,它会跳到100%,无法达到目的。

我的问题是:如何使进度条起作用?
progress_apply内部的函数实际上是做什么的?
有没有更好的方法?也许是tqdm的替代品?

任何帮助是极大的赞赏。

python excel pandas tqdm

5
推荐指数
2
解决办法
2699
查看次数

标签 统计

excel ×1

pandas ×1

python ×1

tqdm ×1