任何人都可以告诉我如何使用 dask 在数据框中选择带有“loc”的一列?
作为旁注,当我使用 dd.read_csv 加载数据帧时,标题等于“None”,列名称从零开始到 131094。我即将选择列名称为 131094 的最后一列,我得到错误。
代码:
> import dask.dataframe as dd
> df = dd.read_csv('filename.csv', header=None)
> y = df.loc['131094']
Run Code Online (Sandbox Code Playgroud)
错误:
文件“/usr/local/dask-2018-08-22/lib/python2.7/site-packages/dask-0.5.0-py2.7.egg/dask/dataframe/core.py”,第180行,位于_loc“无法在没有已知分区的情况下在 DataFrame 上使用 loc”)ValueError:无法在没有已知分区的情况下在 DataFrame 上使用 loc
根据此指南http://dask.pydata.org/en/latest/dataframe-indexing.html#positional-indexing,我的代码应该可以正常工作,但不知道是什么导致了问题。
我有一个大型数据集.我试图用Pandas Dataframe阅读它.我想从其中一列中分离出一些值.假设列的名称是"A",则值范围从90到300.我想将270到280之间的任何值分开.我确实尝试下面的代码,但这是错误的!
%matplotlib inline
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
df = pd.read_csv('....csv')
df2 = df[ 270 < df['A'] < 280]
Run Code Online (Sandbox Code Playgroud) 有谁知道无论如何将分类报告输出为文本文件或CSV文件?
print(metrics.classification_report(y_test, y_pred))python中的这一行给了我分类报告。我想要这份报告的csv格式。
我试图复制和粘贴,但列会混在一起!任何帮助表示赞赏!
我有一个包含多个子目录的目录。我想浏览目录和子目录并找到 jpg 文件并使用 mogrify 命令转换大小。我希望尽可能动态地完成它,这就是我编写脚本的原因。这$1是我在执行 bash 脚本时传递的第一个参数。运行脚本后,它给我一个关于“mogrify无法读取[@]%”的错误。我猜我的代码有问题,而且我对 bash 还不成熟。谁能告诉我如何动态地执行这个脚本,这样会很快。
ps:jpg 文件的名称不是特殊格式...只是一堆数字。
for folder in $1/*
do
for file in "$folder"/*
do
if [ -e "${file[@]%.jpg}" ]; then
mogrify -resize 112x112! "${file[@]%.jpg}"
fi
done
done
Run Code Online (Sandbox Code Playgroud)