小编laz*_*zy1的帖子

Pandas DataFrame - 查找列的值最大的行

如何找到特定列的值最大的行

df.max() 会给我每列的最大值,我不知道如何得到相应的行.

python pandas argmax

196
推荐指数
7
解决办法
21万
查看次数

只有在服务器A上获得404时,ngnix才能代理服务器B.

我正在尝试配置nginx(0.7.65),因此它将代理服务器A,如果它获得404将尝试代理服务器B.

我尝试了以下,但它不起作用.有任何想法吗?

    server {
    error_log  /tmp/nginx.error.log;
    access_log   /tmp/nginx.access.log;
    listen 4433;
    server_name localhost;

    location / {
        proxy_pass http://localhost:5984;
        error_page 404 = @fallback;
    }

    location @fallback {
        proxy_pass http://localhost:5983;
    }
}
Run Code Online (Sandbox Code Playgroud)

proxy nginx

11
推荐指数
1
解决办法
3131
查看次数

Python实现avro慢?

我正在使用avro库从avro文件中读取一些数据.从文件加载33K对象大约需要一分钟.这对我来说似乎很慢,特别是Java版本在大约1秒内读取相同的文件.

这是代码,我做错了什么?

import avro.datafile
import avro.io
from time import time

def load(filename):
    fo = open(filename, "rb")
    reader = avro.datafile.DataFileReader(fo, avro.io.DatumReader())
    for i, record in enumerate(reader):
        pass

    return i + 1

def main(argv=None):
    import sys
    from argparse import ArgumentParser

    argv = argv or sys.argv

    parser = ArgumentParser(description="Read avro file")


    start = time()
    num_records = load("events.avro")
    end = time()

    print("{0} records in {1} seconds".format(num_records, end - start))

if __name__ == "__main__":
    main()
Run Code Online (Sandbox Code Playgroud)

python avro

6
推荐指数
1
解决办法
2592
查看次数

从Ubuntu到CentOs的bdist_rpm

我们在Ubuntu/Mac上开发并将RPM部署到CentOS(这是设置,不能改变太多).

问题是当从rpm安装时,包转到/usr/local/lib/python2.7/dist-packages(这是Ubuntu的正确位置).但是,CentOS中的默认python路径正在查看/usr/local/lib/python2.7/site-packages.

有没有办法告诉bdist_rpm在哪里安装文件?

python ubuntu centos rpm

6
推荐指数
1
解决办法
1154
查看次数

如何处理文本和数字功能的组合?

看看Kaggel的工作薪资预测,我看到数字特征(如类别)和文本特征(如FullDescription).

我如何进行这些数据的培训?我想过使用TfidfTransformer对文本进行矢量化,但它会创建稀疏矩阵,许多学习算法(例如RandomForestRegressor)拒绝使用它.此外,一旦我有文本的特征向量,我如何将其与其他功能结合?

有关如何处理此类数据的任何指示?

谢谢!

python scikit-learn

6
推荐指数
1
解决办法
1486
查看次数

登录后,Twisted FTP服务器不显示文件

我在跑 twistd -n ftp --root=/tmp --password-file=/tmp/pass.dat

我可以连接ftp ftp://localhost:2121并运行ls.但是,如果我登录,并尝试相同,ls那么我收到以下错误:

550 []: No such file or directory.
Run Code Online (Sandbox Code Playgroud)

有任何想法吗?

谢谢,三木

python ftp twisted

6
推荐指数
1
解决办法
1383
查看次数

在运行之前绘制 Celery 画布

有文档介绍如何在 Celery 中运行画布作业后生成图表。不过,我想在运行作业之前生成一个图表。

假设我创建了一个简单的链:

c = chain(add.s(1, 2), mul(4))
Run Code Online (Sandbox Code Playgroud)

如何生成链图?

谢谢,

三木

python graph graphviz celery

5
推荐指数
1
解决办法
1723
查看次数

unicode字符名称列表

在Python中,我可以按名称打印一个unicode字符(例如print(u'\N{snowman}')).有没有办法获得所有有效名称的列表?

python unicode

2
推荐指数
2
解决办法
2687
查看次数

"转置"熊猫系列

我有一个带有ID列和一些功能列的DataFrame.我想看一下每列值有多少唯一ID的说明.

以下代码有效,但我想知道是否有比to_frame().unstack().unstack().describe()系列结果转置到DataFrame 的行更好的方法,其中列是百分位数,最大值,最小值...

def unique_ids(df):
    rows = []
    for col in sorted(c for c in df.columns if c != id_col):
        v = df.groupby(col)[id_col].nunique().describe()
        v = v.to_frame().unstack().unstack()  # Transpose
        v.index = [col]
        rows.append(v)

    return pd.concat(rows)
Run Code Online (Sandbox Code Playgroud)

pandas

2
推荐指数
1
解决办法
5349
查看次数

标签 统计

python ×7

pandas ×2

argmax ×1

avro ×1

celery ×1

centos ×1

ftp ×1

graph ×1

graphviz ×1

nginx ×1

proxy ×1

rpm ×1

scikit-learn ×1

twisted ×1

ubuntu ×1

unicode ×1