我很新的python和pandas.任何指导,评论和建议表示赞赏!
这是我的问题:在我打电话df.shape或之后返回结果需要几分钟df.dtypes.将DataFrame有1610658行5列.存储三列int64,一列为float64,另一列为datetime64.
我使用以下代码练习加载和转换python.加载和转换都有很好的性能,但是当我检查输出时遇到了这个问题.
更新1:
将一些列设置为索引后,df.shape时间从80 + s下降到1.7s,但df.dtypes仍然保持在80 + s
import pandas as pd
###############
# Load
###############
raw = pd.read_csv("data.zip", compression='zip')
###############
# Transform
###############
payment_method = {
"Cash": 1
"Card": 2
}
df = raw. \
assign(
# Encode site ids to int. Only two sites in this data …Run Code Online (Sandbox Code Playgroud)