鉴于:
from pandas import DataFrame
import pandas as pd
d = {'one':[2,3,1,4,5],
'two':[5,4,3,2,1],
'letter':['a','a','b','b','c']}
df = DataFrame(d)
Run Code Online (Sandbox Code Playgroud)
df然后看起来像这样:
df:
letter one two
0 a 2 5
1 a 3 4
2 b 1 3
3 b 4 2
4 c 5 1
Run Code Online (Sandbox Code Playgroud)
我希望有类似的东西:
f = lambda x,y: x**2 + y**2
test = df.sort(f('one', 'two'))
Run Code Online (Sandbox Code Playgroud)
这应该按照"一"和"二"列的平方值之和对整个数据帧进行排序,并给我:
test:
letter one two
2 b 1 3
3 b 4 2
1 a 3 4
4 c 5 1
0 a …Run Code Online (Sandbox Code Playgroud) 我想在 Debian 和 Windows 上打开 Thunderbird,并附上新电子邮件的附件。
所以我想做与此线程中相同的操作,但发布的解决方案不起作用:
我和 user2686223 有同样的问题。该文件不会附加到邮件中。谁能帮我这个?
也许有另一种解决方案?
编辑:现在这就是它的工作原理:
import os
os.system("thunderbird -compose to='test@test.de',subject='subject',body='body',attachment='/path/to/file'")
Run Code Online (Sandbox Code Playgroud) 我有以下R代码:
library(ggplot2)
data(diamonds)
by(diamonds$price, diamonds$cut, summary)
by(diamonds$price, diamonds$cut, max)
Run Code Online (Sandbox Code Playgroud)
这给了我:
diamonds$cut: Fair
Min. 1st Qu. Median Mean 3rd Qu. Max.
337 2050 3282 4359 5206 18570
----------------------------------------------
diamonds$cut: Good
Min. 1st Qu. Median Mean 3rd Qu. Max.
327 1145 3050 3929 5028 18790
----------------------------------------------
diamonds$cut: Very Good
Min. 1st Qu. Median Mean 3rd Qu. Max.
336 912 2648 3982 5373 18820
----------------------------------------------
diamonds$cut: Premium
Min. 1st Qu. Median Mean 3rd Qu. Max.
326 1046 3185 4584 6296 18820
----------------------------------------------
diamonds$cut: …Run Code Online (Sandbox Code Playgroud) 给出以下代码:
import numpy as np
import pandas as pd
arr = np.array([
[1,2,9,1,1,1],
[2,3,3,1,0,1],
[1,4,2,1,2,1],
[2,3,1,1,2,1],
[1,2,3,1,8,1],
[2,2,5,1,1,1],
[1,3,8,7,4,1],
[2,4,7,8,3,3]
])
# 1,2,3,4,5,6 <- Number of the columns.
df = pd.DataFrame(arr)
for _ in df.columns.values:
print {x: list(df[_]).count(x) for x in set(df[_])}
Run Code Online (Sandbox Code Playgroud)
我想从数据框中删除一个值出现的所有列,而不是列的所有其他值.在这种情况下,我想删除第4列和第6列(请参阅注释),因为数字1的出现频率高于这些列中的所有其他数字(第4列中的6> 2和第6列中的7> 1).我不想放弃第一列(4 = 4).我该怎么办?
可以说我有以下功能:
def myFun(a=None, b=None):
print a, b
Run Code Online (Sandbox Code Playgroud)
现在我调用函数:
myFun("hi") # Case 1
>>>hi None
myFun(b="hi") # Case 2
>>>None hi
myFun(a="hi") # Case 3
>>>hi None
Run Code Online (Sandbox Code Playgroud)
如果函数调用者没有决定将值"hi"分配给哪个变量,是否有办法抛出异常?这意味着我希望在第一种情况下有例外,但在第二种情况和第三种情况下没有例外.我使用python 2.7.
python parameter-passing default-value variable-assignment function-call
python ×4
dataframe ×2
pandas ×2
distribution ×1
email ×1
max ×1
r ×1
sorting ×1
thunderbird ×1