小编use*_*918的帖子

如何使用“loc”在 dask 中选择数据框的列

任何人都可以告诉我如何使用 dask 在数据框中选择带有“loc”的一列？

作为旁注，当我使用 dd.read_csv 加载数据帧时，标题等于“None”，列名称从零开始到 131094。我即将选择列名称为 131094 的最后一列，我得到错误。

代码：

> import dask.dataframe as dd
> df = dd.read_csv('filename.csv', header=None)
> y = df.loc['131094']

Run Code Online (Sandbox Code Playgroud)

错误：

文件“/usr/local/dask-2018-08-22/lib/python2.7/site-packages/dask-0.5.0-py2.7.egg/dask/dataframe/core.py”，第180行，位于_loc“无法在没有已知分区的情况下在 DataFrame 上使用 loc”）ValueError：无法在没有已知分区的情况下在 DataFrame 上使用 loc

根据此指南http://dask.pydata.org/en/latest/dataframe-indexing.html#positional-indexing，我的代码应该可以正常工作，但不知道是什么导致了问题。

python distributed dataframe pandas dask

use*_*918

2018 08-26

5
推荐指数

1
解决办法

3089
查看次数

在数据框中分隔特定值

我有一个大型数据集.我试图用Pandas Dataframe阅读它.我想从其中一列中分离出一些值.假设列的名称是"A",则值范围从90到300.我想将270到280之间的任何值分开.我确实尝试下面的代码,但这是错误的!

%matplotlib inline
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
df = pd.read_csv('....csv')
df2 = df[ 270 < df['A'] < 280]

Run Code Online (Sandbox Code Playgroud)

python indexing dataframe pandas

use*_*918

lucky-day

4
推荐指数

1
解决办法

49
查看次数

如何将 Sklearn 的分类报告输出到 csv 文件中？

有谁知道无论如何将分类报告输出为文本文件或CSV文件？

print(metrics.classification_report(y_test, y_pred))python中的这一行给了我分类报告。我想要这份报告的csv格式。

我试图复制和粘贴，但列会混在一起！任何帮助表示赞赏！

python classification scikit-learn

use*_*918

2021 06-13

4
推荐指数

2
解决办法

2万
查看次数

循环遍历目录以获取图像文件

我有一个包含多个子目录的目录。我想浏览目录和子目录并找到 jpg 文件并使用 mogrify 命令转换大小。我希望尽可能动态地完成它，这就是我编写脚本的原因。这$1是我在执行 bash 脚本时传递的第一个参数。运行脚本后，它给我一个关于“mogrify无法读取[@]%”的错误。我猜我的代码有问题，而且我对 bash 还不成熟。谁能告诉我如何动态地执行这个脚本，这样会很快。

ps：jpg 文件的名称不是特殊格式...只是一堆数字。

for folder in $1/*
do
    for file in "$folder"/*
    do
        if [  -e "${file[@]%.jpg}" ]; then
            mogrify -resize 112x112! "${file[@]%.jpg}"
        fi

    done
done

Run Code Online (Sandbox Code Playgroud)

bash image find mogrify

use*_*918

lucky-day

1
推荐指数

1
解决办法

3616
查看次数