小编Abh*_*kur的帖子

在pandas groupby中对列表中的行进行分组

我有一个像熊猫一样的数据框:

a b
A 1
A 2
B 5
B 5
B 4
C 6

Run Code Online (Sandbox Code Playgroud)

我希望按第一列分组,并将第二列作为行中的列表:

A [1,2]
B [5,5,4]
C [6]

Run Code Online (Sandbox Code Playgroud)

使用pandas groupby可以做这样的事吗？

python pandas pandas-groupby

Abh*_*kur

2019 04-25

222
推荐指数

11
解决办法

15万
查看次数

精确的时间测量

我在C++中使用time.h来测量函数的时间.

clock_t t = clock();
someFunction();
printf("\nTime taken: %.4fs\n", (float)(clock() - t)/CLOCKS_PER_SEC);

Run Code Online (Sandbox Code Playgroud)

但是,我总是把时间花在0.0000上.clock()和t单独打印时,具有相同的值.我想知道是否有办法在C++中精确测量时间(可能是纳秒级).我正在使用VS2010.

c++ visual-studio-2010 ctime c++-chrono

Abh*_*kur

2016 04-28

45
推荐指数

3
解决办法

7万
查看次数

使用numpy.round时的`AttributeError:rint`

我有一个看起来像这样的numpy数组:

[[41.743617 -87.626839]
 [41.936943 -87.669838]
 [41.962665 -87.65571899999999]]

Run Code Online (Sandbox Code Playgroud)

我想将数组中的数字四舍五入到两位小数,或三位.我尝试使用numpy.around和numpy.round,但它们都给我以下错误:

  File "/Library/Python/2.7/site-packages/numpy-1.8.0.dev_3084618_20130514-py2.7-macosx-10.8-intel.egg/numpy/core/fromnumeric.py", line 2452, in round_
    return round(decimals, out)
AttributeError: rint

Run Code Online (Sandbox Code Playgroud)

我用过numpy.around(x, decimals = 2) 和numpy.round(x,decimals=2)

难道我做错了什么？有没有其他方法可以有效地为大型阵列做到这一点？

python arrays numpy

Abh*_*kur

2015 06-05

25
推荐指数

1
解决办法

3万
查看次数

Docker输入/输出在容器外部

我用python脚本创建了一个docker容器.python脚本接受输入文件,进行一些处理并将输出文件保存在某个指定位置.

docker run /app/script.py --input /data/input.csv --output /data/output.csv

Run Code Online (Sandbox Code Playgroud)

由于每次运行脚本时输入文件都可能不同,我希望它在docker容器之外.我还想将输出存储在容器外的某个地方.

docker run /app/script.py --input /my/local/location/outside/docker/input.csv --output /my/local/location/outside/docker/output.csv

Run Code Online (Sandbox Code Playgroud)

docker支持这个吗？如果是这样,人们将如何实现它？

我Dockerfile看起来如下:

FROM phusion/baseimage

RUN apt-get update
RUN apt-get install -y build-essential
RUN apt-get install -y python-dev
RUN apt-get install -y python-pip
RUN apt-get install -y python-numpy && \
    apt-get install -y python-scipy

COPY ./requirements.txt /app/requirements.txt
COPY ./src/script.py /app/script.py

WORKDIR /app
COPY . /app

Run Code Online (Sandbox Code Playgroud)

python docker

Abh*_*kur

2017 03-06

15
推荐指数

1
解决办法

9650
查看次数

pandas groupby并转换为json列表

我有一个像下面这样的pandas数据帧

idx, f1, f2, f3
1,   a,  a,  b
2,   b,  a,  c
3,   a,  b,  c
.
.
.
87   e,  e,  e

Run Code Online (Sandbox Code Playgroud)

我需要将其他列转换为基于idx列的字典列表.所以,最终结果应该是:

idx, features
1 ,  [{f1:a, f2:a, f3:b}, {f1:b, f2:a, f3:c}, {f1:a, f2:b, f3:c}]
.
.
.
87,  [{f1: e, f2:e, f3:e}]

Run Code Online (Sandbox Code Playgroud)

是否有可能在pandas中使用groupby做这样的事情？

python dictionary pandas

Abh*_*kur

2019 05-20

14
推荐指数

1
解决办法

5387
查看次数

如何找到向量中n个最小元素的索引

如何在MATLAB中获得1D数组中"n个最小元素"的索引？

该数组是行向量.

我可以找到最小元素及其索引;

[C, ind] = min(featureDist);

Run Code Online (Sandbox Code Playgroud)

矢量如下:

featureDist =

  Columns 1 through 8

   48.4766   47.3743   59.5736   59.7450   55.0489   58.2620   63.3865   50.1101

Run Code Online (Sandbox Code Playgroud)

等等...

matlab

Abh*_*kur

2013 01-03

13
推荐指数

1
解决办法

2万
查看次数

忽略熊猫中数据类型不匹配的行

我在读取一个巨大的 CSV 时指定 dtypes pandas：

pd.read_csv('29_2016/data.csv', 
            error_bad_lines=False, 
            encoding='utf-8', 
            dtype={'a': str, 'b': np.float64, 'c':np.float64}, 
            na_values=['na'], quotechar='"')

Run Code Online (Sandbox Code Playgroud)

但是我的数据中有一些“坏”行，由于一些数据准备问题，它们与 dtype 不匹配。例如，我可能在 b 列或 c 列中有字符串。

有没有办法在使用 CSV 读取 CSV 时忽略这些坏行pandas read_csv？

错误：

pandas/parser.pyx in pandas.parser.TextReader.read (pandas/parser.c:7988)()

pandas/parser.pyx in pandas.parser.TextReader._read_low_memory (pandas/parser.c:8244)()

pandas/parser.pyx in pandas.parser.TextReader._read_rows (pandas/parser.c:9261)()

pandas/parser.pyx in pandas.parser.TextReader._convert_column_data (pandas/parser.c:10654)()

pandas/parser.pyx in pandas.parser.TextReader._convert_tokens (pandas/parser.c:11891)()

ValueError: could not convert string to float: some string "\

Run Code Online (Sandbox Code Playgroud)

python csv pandas

Abh*_*kur

2016 07-25

11
推荐指数

1
解决办法

5547
查看次数