小编Com*_*low的帖子

专栏的累计金额和百分比?

DataFrame喜欢这样的:

df:

 fruit    val1 val2
0 orange    15    3
1 apple     10   13
2 mango     5    5 
Run Code Online (Sandbox Code Playgroud)

我如何让Pandas只给我一个累积金额和百分比列val1

期望的输出:

df_with_cumsum:

 fruit    val1 val2   cum_sum    cum_perc
0 orange    15    3    15          50.00
1 apple     10   13    25          83.33
2 mango     5    5     30          100.00
Run Code Online (Sandbox Code Playgroud)

我试过了df.cumsum(),但它给了我这个错误:

TypeError:输入类型不支持ufunc'isnan',根据强制转换规则''safe',输入无法安全地强制转换为任何支持的类型

python dataframe cumulative-sum pandas

43
推荐指数
2
解决办法
6万
查看次数

XAMPP:另一个Web服务器守护程序已在运行?

如果我有另外一个运行的apache/web-server实例,我已经痛苦地分析了所有这些命令

ps aux
ps -e
lsof 
netstat tunap
Run Code Online (Sandbox Code Playgroud)

我没有在端口8080上运行的另一个Apache或任何其他服务器实例.

然而,XAMPP给了我这个:

XAMPP: Another web server daemon is already running
Run Code Online (Sandbox Code Playgroud)

我该怎么办?

我还将httpd.conf编辑到LISTEN到端口9876,仍然是一样的.

unix linux apache xampp ubuntu

13
推荐指数
5
解决办法
3万
查看次数

只加载PIG中的特定字段?

这是我的档案:

Col1, Col2, Col3, Col4, Col5

我只需要Col2Col3.

目前我这样做:

a = load 'input' as (Col1:chararray, 
                     Col2:chararray, 
                     Col3:chararray, 
                     Col4:chararray);
b = foreach a generate Col2, Col3;
Run Code Online (Sandbox Code Playgroud)

有没有办法直接加载Col2Col3不是加载整个input然后generate需要的列?

hadoop mapreduce apache-pig

10
推荐指数
1
解决办法
1万
查看次数

我如何获得旧版本的Django?皮普说无法找到版本

我需要Django 0.96.我有一个庞大的Django项目,我需要运行,但它与0.96非常相关,我可以花一点时间来移植它1.x

当我这样做时,pip install django==0.96我得到了这个

Could not find a version that satisfies the requirement django==0.96 (from versions: 1.1.3, 1.1.4, 1.2.1, 1.2.2, 1.2.3, 1.2.4, 1.2.5, 1.2.6, 1.2.7, 1.2, 1.3.1, 1.3.2, 1.3.3, 1.3.4, 1.3.5, 1.3.6, 1.3.7, 1.3, 1.4.1, 1.4.2, 1.4.3, 1.4.4, 1.4.5, 1.4.6, 1.4.7, 1.4.8, 1.4, 1.5.1, 1.5.2, 1.5.3, 1.5.4, 1.5)
Run Code Online (Sandbox Code Playgroud)

如何安装Django 0.96?

python django

9
推荐指数
2
解决办法
1489
查看次数

ValueError:信号量或锁释放次数太多了?

ValueError: semaphore or lock released too many times当我pip install matplotlib在Cygwin 尝试做的时候,我得到了.我该怎么办?

更新:

$ pip install matplotlib
Downloading/unpacking matplotlib
  You are installing an externally hosted file. Future versions of pip will default to disallowing externally hosted files.
  You are installing a potentially insecure and unverifiable file. Future versions of pip will default to disallowing insecure files.
  Downloading matplotlib-1.3.0.tar.gz (42.1MB): 42.1MB downloaded
  Running setup.py egg_info for package matplotlib
    ============================================================================
    Edit setup.cfg to change the build options

    BUILDING MATPLOTLIB
                matplotlib: …
Run Code Online (Sandbox Code Playgroud)

python cygwin pip matplotlib

8
推荐指数
1
解决办法
3156
查看次数

RabbitMQ可移植在Windows上?

我无法访问Windows 7中的管理员帐户.有没有办法在没有管理员权限的情况下安装RabbitMQ及其所需的Erlang?以某种便携方式?

我需要在我的Python Celery项目中使用它.

谢谢!

python windows erlang admin rabbitmq

8
推荐指数
1
解决办法
2118
查看次数

按列排序唯一 - 排序命令?

我有这个文件:

hello 1
hello 2
world 1
world 2
hello 3
hi    3
hi    4
Run Code Online (Sandbox Code Playgroud)

我想这样排序,

hello 1
hi  3
world 1
Run Code Online (Sandbox Code Playgroud)

问题是我只需要第1列中的第一个唯一项目.

我尝试过,sort -k1 -u file.txt但它没有像我期望的那样工作.我该怎么做?

unix linux sorting bash shell

7
推荐指数
2
解决办法
2万
查看次数

为什么空字典的大小与Python中非空字典的大小相同?

这可能是微不足道的,但我不确定我理解,我试着用Google搜索,但没有找到令人信服的答案.

>>> sys.getsizeof({})
140
>>> sys.getsizeof({'Hello':'World'})
140
>>>
>>> yet_another_dict = {}
>>> for i in xrange(5000):
        yet_another_dict[i] = i**2

>>> 
>>> sys.getsizeof(yet_another_dict)
98444
Run Code Online (Sandbox Code Playgroud)

我怎么理解这个?为什么空字典与非空字典的大小相同?

python memory dictionary python-2.7

7
推荐指数
2
解决办法
766
查看次数

规范化随机无休止的未知系列?

我有一个没有等式的无休止的系列,并且是随机的,像这样,

   X = 1, 456, 555, 556, 557, 789 ... 
Run Code Online (Sandbox Code Playgroud)

请注意,我将此列表作为流,我不知道未来的值,我不知道min和max X.

我如何找出N(X)任何倒置法线x in X,这样,

N(x) --> 0 如果 x --> inf

N(x) --> 1 如果 x --> 0

读取它,x越接近它应该越接近0,x越接近它应该越接近1.

我怎样才能实现这样的转变?

我尝试了以下方法:

#python
def invnorm(x):
    denom = 1 + math.exp(-x)
    return 2 - (2/denom)

invnorm(200)
Out[8]: 0.0

invnorm(20)
Out[9]: 4.1223073843355e-09

invnorm(2)
Out[10]: 0.23840584404423537

invnorm(1)
Out[11]: 0.5378828427399902
Run Code Online (Sandbox Code Playgroud)

不知怎的,这并没有给出一个令人满意的结果,因为我的范围很大,而且200它本身给出了0我的范围将倾向于0.

python algorithm math normalization

7
推荐指数
1
解决办法
132
查看次数

大熊猫数据帧的中位数

我有一个DataFrame df:

name   count    
aaaa   2000    
bbbb   1900    
cccc    900    
dddd    500    
eeee    100
Run Code Online (Sandbox Code Playgroud)

我想查看与计数列的中位数相差10倍的行.

我试过df['count'].median()并得到了中位数.但不知道如何进一步.你能建议我如何使用pandas/numpy吗?

预期产出:

name count distance from median

aaaa  2000   *****
Run Code Online (Sandbox Code Playgroud)

我可以使用任何度量作为距中位数的距离(绝对偏离中位数,分位数等).

python numpy r pandas

7
推荐指数
1
解决办法
3万
查看次数