小编use*_*918的帖子

如何使用“loc”在 dask 中选择数据框的列

任何人都可以告诉我如何使用 dask 在数据框中选择带有“loc”的一列?

作为旁注,当我使用 dd.read_csv 加载数据帧时,标题等于“None”,列名称从零开始到 131094。我即将选择列名称为 131094 的最后一列,我得到错误。

代码:

> import dask.dataframe as dd
> df = dd.read_csv('filename.csv', header=None)
> y = df.loc['131094']
Run Code Online (Sandbox Code Playgroud)

错误:

文件“/usr/local/dask-2018-08-22/lib/python2.7/site-packages/dask-0.5.0-py2.7.egg/dask/dataframe/core.py”,第180行,位于_loc“无法在没有已知分区的情况下在 DataFrame 上使用 loc”)ValueError:无法在没有已知分区的情况下在 DataFrame 上使用 loc

根据此指南http://dask.pydata.org/en/latest/dataframe-indexing.html#positional-indexing,我的代码应该可以正常工作,但不知道是什么导致了问题。

python distributed dataframe pandas dask

5
推荐指数
1
解决办法
3089
查看次数

在数据框中分隔特定值

我有一个大型数据集.我试图用Pandas Dataframe阅读它.我想从其中一列中分离出一些值.假设列的名称是"A",则值范围从90到300.我想将270到280之间的任何值分开.我确实尝试下面的代码,但这是错误的!

%matplotlib inline
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
df = pd.read_csv('....csv')
df2 = df[ 270 < df['A'] < 280]
Run Code Online (Sandbox Code Playgroud)

python indexing dataframe pandas

4
推荐指数
1
解决办法
49
查看次数

如何将 Sklearn 的分类报告输出到 csv 文件中?

有谁知道无论如何将分类报告输出为文本文件或CSV文件?

print(metrics.classification_report(y_test, y_pred))python中的这一行给了我分类报告。我想要这份报告的csv格式。

我试图复制和粘贴,但列会混在一起!任何帮助表示赞赏!

python classification scikit-learn

4
推荐指数
2
解决办法
2万
查看次数

循环遍历目录以获取图像文件

我有一个包含多个子目录的目录。我想浏览目录和子目录并找到 jpg 文件并使用 mogrify 命令转换大小。我希望尽可能动态地完成它,这就是我编写脚本的原因。这$1是我在执行 bash 脚本时传递的第一个参数。运行脚本后,它给我一个关于“mogrify无法读取[@]%”的错误。我猜我的代码有问题,而且我对 bash 还不成熟。谁能告诉我如何动态地执行这个脚本,这样会很快。

ps:jpg 文件的名称不是特殊格式...只是一堆数字。

for folder in $1/*
do
    for file in "$folder"/*
    do
        if [  -e "${file[@]%.jpg}" ]; then
            mogrify -resize 112x112! "${file[@]%.jpg}"
        fi

    done
done
Run Code Online (Sandbox Code Playgroud)

bash image find mogrify

1
推荐指数
1
解决办法
3616
查看次数