小编Ohu*_*nen的帖子

使用列值的函数对pandas DataFrame进行排序

鉴于:

from pandas import DataFrame
import pandas as pd

d = {'one':[2,3,1,4,5],
     'two':[5,4,3,2,1],
     'letter':['a','a','b','b','c']}

df = DataFrame(d)

Run Code Online (Sandbox Code Playgroud)

df然后看起来像这样:

df:
      letter  one  two
    0      a    2    5
    1      a    3    4
    2      b    1    3
    3      b    4    2
    4      c    5    1

Run Code Online (Sandbox Code Playgroud)

我希望有类似的东西:

f = lambda x,y: x**2 + y**2
test = df.sort(f('one', 'two'))

Run Code Online (Sandbox Code Playgroud)

这应该按照"一"和"二"列的平方值之和对整个数据帧进行排序,并给我:

test:
      letter  one  two
    2      b    1    3
    3      b    4    2
    1      a    3    4
    4      c    5    1
    0      a …

Run Code Online (Sandbox Code Playgroud)

python sorting dataframe pandas

Ohu*_*nen

2017 05-23

14
推荐指数

2
解决办法

7593
查看次数

Python：打开 Thunderbird 编写带有附加文件的新邮件

我想在 Debian 和 Windows 上打开 Thunderbird，并附上新电子邮件的附件。

所以我想做与此线程中相同的操作，但发布的解决方案不起作用：

Python 打开带有附件的电子邮件客户端

我和 user2686223 有同样的问题。该文件不会附加到邮件中。谁能帮我这个？

也许有另一种解决方案？

编辑：现在这就是它的工作原理：

import os
os.system("thunderbird -compose to='test@test.de',subject='subject',body='body',attachment='/path/to/file'")

Run Code Online (Sandbox Code Playgroud)

python email thunderbird cross-platform email-attachments

Ohu*_*nen

2017 05-23

6
推荐指数

1
解决办法

7366
查看次数

使用命令在R中的最大值不同

我有以下R代码:

 library(ggplot2)
 data(diamonds)
 by(diamonds$price, diamonds$cut, summary)
 by(diamonds$price, diamonds$cut, max)

Run Code Online (Sandbox Code Playgroud)

这给了我:

diamonds$cut: Fair
Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
337    2050    3282    4359    5206   18570 
---------------------------------------------- 
  diamonds$cut: Good
Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
327    1145    3050    3929    5028   18790 
---------------------------------------------- 
  diamonds$cut: Very Good
Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
336     912    2648    3982    5373   18820 
---------------------------------------------- 
  diamonds$cut: Premium
Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
326    1046    3185    4584    6296   18820 
---------------------------------------------- 
  diamonds$cut: …

Run Code Online (Sandbox Code Playgroud)

r max unique-values distinct-values

Ohu*_*nen

lucky-day

3
推荐指数

1
解决办法

37
查看次数

从pandas数据帧中删除具有极不平等分布值的列

给出以下代码:

import numpy as np
import pandas as pd

arr = np.array([
    [1,2,9,1,1,1],
    [2,3,3,1,0,1],
    [1,4,2,1,2,1],
    [2,3,1,1,2,1],
    [1,2,3,1,8,1],
    [2,2,5,1,1,1],
    [1,3,8,7,4,1],
    [2,4,7,8,3,3]
    ])
#    1,2,3,4,5,6 <- Number of the columns.
df = pd.DataFrame(arr)

for _ in df.columns.values:
    print {x: list(df[_]).count(x) for x in set(df[_])}

Run Code Online (Sandbox Code Playgroud)

我想从数据框中删除一个值出现的所有列,而不是列的所有其他值.在这种情况下,我想删除第4列和第6列(请参阅注释),因为数字1的出现频率高于这些列中的所有其他数字(第4列中的6> 2和第6列中的7> 1).我不想放弃第一列(4 = 4).我该怎么办？

python distribution dataframe pandas data-cleaning

Ohu*_*nen

lucky-day

2
推荐指数

1
解决办法

52
查看次数

强制函数调用者决定使用哪个默认值

可以说我有以下功能:

def myFun(a=None, b=None):
    print a, b

Run Code Online (Sandbox Code Playgroud)

现在我调用函数:

myFun("hi") # Case 1
>>>hi None

myFun(b="hi") # Case 2
>>>None hi

myFun(a="hi") # Case 3
>>>hi None

Run Code Online (Sandbox Code Playgroud)

如果函数调用者没有决定将值"hi"分配给哪个变量,是否有办法抛出异常？这意味着我希望在第一种情况下有例外,但在第二种情况和第三种情况下没有例外.我使用python 2.7.

python parameter-passing default-value variable-assignment function-call

Ohu*_*nen

2016 06-23

1
推荐指数

1
解决办法

45
查看次数

标签统计

python ×4

dataframe ×2

pandas ×2

cross-platform ×1

data-cleaning ×1

default-value ×1

distinct-values ×1

distribution ×1

email ×1

email-attachments ×1

function-call ×1

max ×1

parameter-passing ×1

r ×1

sorting ×1

thunderbird ×1

unique-values ×1

variable-assignment ×1

使用列值的函数对pandas DataFrame进行排序

Python：打开 Thunderbird 编写带有附加文件的新邮件

使用命令在R中的最大值不同

从pandas数据帧中删除具有极不平等分布值的列

强制函数调用者决定使用哪个默认值

标签 统计

小编Ohu_nen的帖子

标签统计