小编Com*_*low的帖子

专栏的累计金额和百分比？

我DataFrame喜欢这样的:

df:

 fruit    val1 val2
0 orange    15    3
1 apple     10   13
2 mango     5    5

Run Code Online (Sandbox Code Playgroud)

我如何让Pandas只给我一个累积金额和百分比列val1？

期望的输出:

df_with_cumsum:

 fruit    val1 val2   cum_sum    cum_perc
0 orange    15    3    15          50.00
1 apple     10   13    25          83.33
2 mango     5    5     30          100.00

Run Code Online (Sandbox Code Playgroud)

我试过了df.cumsum(),但它给了我这个错误:

TypeError:输入类型不支持ufunc'isnan',根据强制转换规则''safe',输入无法安全地强制转换为任何支持的类型

python dataframe cumulative-sum pandas

Com*_*low

2015 11-26

43
推荐指数

2
解决办法

6万
查看次数

XAMPP:另一个Web服务器守护程序已在运行？

如果我有另外一个运行的apache/web-server实例,我已经痛苦地分析了所有这些命令

ps aux
ps -e
lsof 
netstat tunap

Run Code Online (Sandbox Code Playgroud)

我没有在端口8080上运行的另一个Apache或任何其他服务器实例.

然而,XAMPP给了我这个:

XAMPP: Another web server daemon is already running

Run Code Online (Sandbox Code Playgroud)

我该怎么办？

我还将httpd.conf编辑到LISTEN到端口9876,仍然是一样的.

unix linux apache xampp ubuntu

Com*_*low

lucky-day

13
推荐指数

5
解决办法

3万
查看次数

只加载PIG中的特定字段？

这是我的档案:

Col1, Col2, Col3, Col4, Col5

我只需要Col2和Col3.

目前我这样做:

a = load 'input' as (Col1:chararray, 
                     Col2:chararray, 
                     Col3:chararray, 
                     Col4:chararray);
b = foreach a generate Col2, Col3;

Run Code Online (Sandbox Code Playgroud)

有没有办法直接加载Col2而Col3不是加载整个input然后generate需要的列？

hadoop mapreduce apache-pig

Com*_*low

lucky-day

10
推荐指数

1
解决办法

1万
查看次数

我如何获得旧版本的Django？皮普说无法找到版本

我需要Django 0.96.我有一个庞大的Django项目,我需要运行,但它与0.96非常相关,我可以花一点时间来移植它1.x

当我这样做时,pip install django==0.96我得到了这个

Could not find a version that satisfies the requirement django==0.96 (from versions: 1.1.3, 1.1.4, 1.2.1, 1.2.2, 1.2.3, 1.2.4, 1.2.5, 1.2.6, 1.2.7, 1.2, 1.3.1, 1.3.2, 1.3.3, 1.3.4, 1.3.5, 1.3.6, 1.3.7, 1.3, 1.4.1, 1.4.2, 1.4.3, 1.4.4, 1.4.5, 1.4.6, 1.4.7, 1.4.8, 1.4, 1.5.1, 1.5.2, 1.5.3, 1.5.4, 1.5)

Run Code Online (Sandbox Code Playgroud)

如何安装Django 0.96？

python django

Com*_*low

2013 10-04

9
推荐指数

2
解决办法

1489
查看次数

ValueError:信号量或锁释放次数太多了？

ValueError: semaphore or lock released too many times当我pip install matplotlib在Cygwin 尝试做的时候,我得到了.我该怎么办？

更新:

$ pip install matplotlib
Downloading/unpacking matplotlib
  You are installing an externally hosted file. Future versions of pip will default to disallowing externally hosted files.
  You are installing a potentially insecure and unverifiable file. Future versions of pip will default to disallowing insecure files.
  Downloading matplotlib-1.3.0.tar.gz (42.1MB): 42.1MB downloaded
  Running setup.py egg_info for package matplotlib
    ============================================================================
    Edit setup.cfg to change the build options

    BUILDING MATPLOTLIB
                matplotlib: …

Run Code Online (Sandbox Code Playgroud)

python cygwin pip matplotlib

Com*_*low

2013 09-05

8
推荐指数

1
解决办法

3156
查看次数

RabbitMQ可移植在Windows上？

我无法访问Windows 7中的管理员帐户.有没有办法在没有管理员权限的情况下安装RabbitMQ及其所需的Erlang？以某种便携方式？

我需要在我的Python Celery项目中使用它.

谢谢!

python windows erlang admin rabbitmq

Com*_*low

lucky-day

8
推荐指数

1
解决办法

2118
查看次数

按列排序唯一 - 排序命令？

我有这个文件:

hello 1
hello 2
world 1
world 2
hello 3
hi    3
hi    4

Run Code Online (Sandbox Code Playgroud)

我想这样排序,

hello 1
hi  3
world 1

Run Code Online (Sandbox Code Playgroud)

问题是我只需要第1列中的第一个唯一项目.

我尝试过,sort -k1 -u file.txt但它没有像我期望的那样工作.我该怎么做？

unix linux sorting bash shell

Com*_*low

lucky-day

7
推荐指数

2
解决办法

2万
查看次数

为什么空字典的大小与Python中非空字典的大小相同？

这可能是微不足道的,但我不确定我理解,我试着用Google搜索,但没有找到令人信服的答案.

>>> sys.getsizeof({})
140
>>> sys.getsizeof({'Hello':'World'})
140
>>>
>>> yet_another_dict = {}
>>> for i in xrange(5000):
        yet_another_dict[i] = i**2

>>> 
>>> sys.getsizeof(yet_another_dict)
98444

Run Code Online (Sandbox Code Playgroud)

我怎么理解这个？为什么空字典与非空字典的大小相同？

python memory dictionary python-2.7

Com*_*low

2013 09-01

7
推荐指数

2
解决办法

766
查看次数

规范化随机无休止的未知系列？

我有一个没有等式的无休止的系列,并且是随机的,像这样,

   X = 1, 456, 555, 556, 557, 789 ...

Run Code Online (Sandbox Code Playgroud)

请注意,我将此列表作为流,我不知道未来的值,我不知道min和max X.

我如何找出N(X)任何倒置法线x in X,这样,

N(x) --> 0 如果 x --> inf

N(x) --> 1 如果 x --> 0

读取它,x越接近它应该越接近0,x越接近它应该越接近1.

我怎样才能实现这样的转变？

我尝试了以下方法:

#python
def invnorm(x):
    denom = 1 + math.exp(-x)
    return 2 - (2/denom)

invnorm(200)
Out[8]: 0.0

invnorm(20)
Out[9]: 4.1223073843355e-09

invnorm(2)
Out[10]: 0.23840584404423537

invnorm(1)
Out[11]: 0.5378828427399902

Run Code Online (Sandbox Code Playgroud)

不知怎的,这并没有给出一个令人满意的结果,因为我的范围很大,而且200它本身给出了0我的范围将倾向于0.

python algorithm math normalization

Com*_*low

2014 01-22

7
推荐指数

1
解决办法

132
查看次数

大熊猫数据帧的中位数

我有一个DataFrame df:

name   count    
aaaa   2000    
bbbb   1900    
cccc    900    
dddd    500    
eeee    100

Run Code Online (Sandbox Code Playgroud)

我想查看与计数列的中位数相差10倍的行.

我试过df['count'].median()并得到了中位数.但不知道如何进一步.你能建议我如何使用pandas/numpy吗？

预期产出:

name count distance from median

aaaa  2000   *****

Run Code Online (Sandbox Code Playgroud)

我可以使用任何度量作为距中位数的距离(绝对偏离中位数,分位数等).

python numpy r pandas

Ssa*_*ank

2015 04-22

7
推荐指数

1
解决办法

3万
查看次数

标签统计

python ×7

linux ×2

pandas ×2

unix ×2

admin ×1

algorithm ×1

apache ×1

apache-pig ×1

bash ×1

cumulative-sum ×1

cygwin ×1

dataframe ×1

dictionary ×1

django ×1

erlang ×1

hadoop ×1

mapreduce ×1

math ×1

matplotlib ×1

memory ×1

normalization ×1

numpy ×1

pip ×1

python-2.7 ×1

r ×1

rabbitmq ×1

shell ×1

sorting ×1

ubuntu ×1

windows ×1

xampp ×1

标签 统计

小编Com_low的帖子

标签统计