小编Abh*_*kur的帖子

在pandas groupby中对列表中的行进行分组

我有一个像熊猫一样的数据框:

a b
A 1
A 2
B 5
B 5
B 4
C 6
Run Code Online (Sandbox Code Playgroud)

我希望按第一列分组,并将第二列作为行中的列表:

A [1,2]
B [5,5,4]
C [6]
Run Code Online (Sandbox Code Playgroud)

使用pandas groupby可以做这样的事吗?

python pandas pandas-groupby

222
推荐指数
11
解决办法
15万
查看次数

精确的时间测量

我在C++中使用time.h来测量函数的时间.

clock_t t = clock();
someFunction();
printf("\nTime taken: %.4fs\n", (float)(clock() - t)/CLOCKS_PER_SEC);
Run Code Online (Sandbox Code Playgroud)

但是,我总是把时间花在0.0000上.clock()和t单独打印时,具有相同的值.我想知道是否有办法在C++中精确测量时间(可能是纳秒级).我正在使用VS2010.

c++ visual-studio-2010 ctime c++-chrono

45
推荐指数
3
解决办法
7万
查看次数

使用numpy.round时的`AttributeError:rint`

我有一个看起来像这样的numpy数组:

[[41.743617 -87.626839]
 [41.936943 -87.669838]
 [41.962665 -87.65571899999999]]
Run Code Online (Sandbox Code Playgroud)

我想将数组中的数字四舍五入到两位小数,或三位.我尝试使用numpy.around和numpy.round,但它们都给我以下错误:

  File "/Library/Python/2.7/site-packages/numpy-1.8.0.dev_3084618_20130514-py2.7-macosx-10.8-intel.egg/numpy/core/fromnumeric.py", line 2452, in round_
    return round(decimals, out)
AttributeError: rint
Run Code Online (Sandbox Code Playgroud)

我用过numpy.around(x, decimals = 2)numpy.round(x,decimals=2)

难道我做错了什么?有没有其他方法可以有效地为大型阵列做到这一点?

python arrays numpy

25
推荐指数
1
解决办法
3万
查看次数

Docker输入/输出在容器外部

我用python脚本创建了一个docker容器.python脚本接受输入文件,进行一些处理并将输出文件保存在某个指定位置.

docker run /app/script.py --input /data/input.csv --output /data/output.csv
Run Code Online (Sandbox Code Playgroud)

由于每次运行脚本时输入文件都可能不同,我希望它在docker容器之外.我还想将输出存储在容器外的某个地方.

docker run /app/script.py --input /my/local/location/outside/docker/input.csv --output /my/local/location/outside/docker/output.csv
Run Code Online (Sandbox Code Playgroud)

docker支持这个吗?如果是这样,人们将如何实现它?

Dockerfile看起来如下:

FROM phusion/baseimage

RUN apt-get update
RUN apt-get install -y build-essential
RUN apt-get install -y python-dev
RUN apt-get install -y python-pip
RUN apt-get install -y python-numpy && \
    apt-get install -y python-scipy

COPY ./requirements.txt /app/requirements.txt
COPY ./src/script.py /app/script.py

WORKDIR /app
COPY . /app
Run Code Online (Sandbox Code Playgroud)

python docker

15
推荐指数
1
解决办法
9650
查看次数

pandas groupby并转换为json列表

我有一个像下面这样的pandas数据帧

idx, f1, f2, f3
1,   a,  a,  b
2,   b,  a,  c
3,   a,  b,  c
.
.
.
87   e,  e,  e
Run Code Online (Sandbox Code Playgroud)

我需要将其他列转换为基于idx列的字典列表.所以,最终结果应该是:

idx, features
1 ,  [{f1:a, f2:a, f3:b}, {f1:b, f2:a, f3:c}, {f1:a, f2:b, f3:c}]
.
.
.
87,  [{f1: e, f2:e, f3:e}]
Run Code Online (Sandbox Code Playgroud)

是否有可能在pandas中使用groupby做这样的事情?

python dictionary pandas

14
推荐指数
1
解决办法
5387
查看次数

如何找到向量中n个最小元素的索引

如何在MATLAB中获得1D数组中"n个最小元素"的索引?

该数组是行向量.

我可以找到最小元素及其索引;

[C, ind] = min(featureDist);
Run Code Online (Sandbox Code Playgroud)

矢量如下:

featureDist =

  Columns 1 through 8

   48.4766   47.3743   59.5736   59.7450   55.0489   58.2620   63.3865   50.1101
Run Code Online (Sandbox Code Playgroud)

等等...

matlab

13
推荐指数
1
解决办法
2万
查看次数

忽略熊猫中数据类型不匹配的行

我在读取一个巨大的 CSV 时指定 dtypes pandas

pd.read_csv('29_2016/data.csv', 
            error_bad_lines=False, 
            encoding='utf-8', 
            dtype={'a': str, 'b': np.float64, 'c':np.float64}, 
            na_values=['na'], quotechar='"')
Run Code Online (Sandbox Code Playgroud)

但是我的数据中有一些“坏”行,由于一些数据准备问题,它们与 dtype 不匹配。例如,我可能在 b 列或 c 列中有字符串。

有没有办法在使用 CSV 读取 CSV 时忽略这些坏行pandas read_csv

错误:

pandas/parser.pyx in pandas.parser.TextReader.read (pandas/parser.c:7988)()

pandas/parser.pyx in pandas.parser.TextReader._read_low_memory (pandas/parser.c:8244)()

pandas/parser.pyx in pandas.parser.TextReader._read_rows (pandas/parser.c:9261)()

pandas/parser.pyx in pandas.parser.TextReader._convert_column_data (pandas/parser.c:10654)()

pandas/parser.pyx in pandas.parser.TextReader._convert_tokens (pandas/parser.c:11891)()

ValueError: could not convert string to float: some string "\
Run Code Online (Sandbox Code Playgroud)

python csv pandas

11
推荐指数
1
解决办法
5547
查看次数

Mat to unsigned char*

任何人都可以告诉我如何在OpenCV中转换Matunsigned char*数据以及数据是否为数组?另外,我想知道如何能同样的事情可以做的vector<vector<double>>float*,从而使它数组的指针?谢谢.

c++ opencv

8
推荐指数
1
解决办法
1万
查看次数

Python数组到1-D Vector

是否有一种将结构化数组转换为向量的pythonic方法?

例如:

我正在尝试转换数组,如:

[(9,), (1,), (1, 12), (9,), (8,)]
Run Code Online (Sandbox Code Playgroud)

到一个像这样的矢量:

[9,1,1,12,9,8]
Run Code Online (Sandbox Code Playgroud)

python numpy

6
推荐指数
3
解决办法
2万
查看次数

堆叠稀疏和密集的矩阵

是否可以在python中堆叠稀疏和密集的numpy数组?我知道这可以使用vstack/hstack为密集的numpy数组完成.我有一些列,我想添加到稀疏矩阵,以增加特征向量的数量

python arrays numpy matrix scipy

6
推荐指数
1
解决办法
4070
查看次数