小编kil*_*les的帖子

如何使用Python通过HTTP下载文件?

我有一个小工具,用于按计划从网站下载MP3,然后构建/更新播客XML文件,我显然已将其添加到iTunes.

创建/更新XML文件的文本处理是用Python编写的.我在Windows .bat文件中使用wget 来下载实际的MP3.我宁愿用Python编写整个实用程序.

我努力寻找一种方法来实际下载Python中的文件,因此我采用了wget.

那么,我如何使用Python下载文件?

python http urllib

813
推荐指数
20
解决办法
100万
查看次数

更好的方法来放弃熊猫中的纳米行

我自己找到了一种从熊猫数据帧中删除nan行的方法.给定一个包含nan值的dat列的数据框x,是否有一种更优雅的方法来删除列中的每个行dat都有一个nan值x

dat = dat[np.logical_not(np.isnan(dat.x))]
dat = dat.reset_index(drop=True)
Run Code Online (Sandbox Code Playgroud)

python pandas

41
推荐指数
3
解决办法
9万
查看次数

Pandas:将Timestamp转换为datetime.date

我有一个Pandas列的Timestamp数据

In [27]: train["Original_Quote_Date"][6] 
Out[27]: Timestamp('2013-12-25 00:00:00')
Run Code Online (Sandbox Code Playgroud)

如何检查这些对象与datetime.date该类型对象的等价性

datetime.date(2013, 12, 25)
Run Code Online (Sandbox Code Playgroud)

python datetime timestamp pandas

37
推荐指数
6
解决办法
8万
查看次数

"符号未找到/期望:平面命名空间"实际上是什么意思?

当我导入我构建的模块时,我得到了与boost-python相关的错误:

Traceback (most recent call last):
  File "<string>", line 1, in <module>
ImportError: dlopen(./myMod.so, 2): Symbol not found: __ZN5boost6python7objects15function_objectERKNS1_11py_functionERKSt4pairIPKNS0_6detail7keywordES9_E
  Referenced from: ./myMod.so
  Expected in: flat namespace
 in ./myMod.so
Run Code Online (Sandbox Code Playgroud)

这究竟意味着什么?为什么会出现这个错误?

c++ python import namespaces importerror

27
推荐指数
3
解决办法
2万
查看次数

大熊猫获得两列的最小值作为等式的一部分

如何将两个数据帧的最小值作为pandas数据帧方程的一部分引用?我尝试使用min()不起作用的python 函数.对不起,如果这在某处有详细记载,但我无法找到解决此问题的有效方法.我正在寻找类似的东西:

data['eff'] = pd.DataFrame([data['flow_h'], data['flow_c']]).min() *Cp* (data[' Thi'] - data[' Tci'])
Run Code Online (Sandbox Code Playgroud)

我也尝试使用pandas min()功能,这也是行不通的.

min_flow = pd.DataFrame([data['flow_h'], data['flow_c']]).min()

InvalidIndexError: Reindexing only valid with uniquely valued Index objects
Run Code Online (Sandbox Code Playgroud)

我对此错误感到困惑.数据列只是数字和名称,我不确定索引在哪里发挥作用.

In [108]: data['flow_c']
Out[108]: 
0       74.014640
1       74.150579
2       74.014640
3       73.960195
4       74.069046
5       73.960195
6       73.987423
7       73.905710
Run Code Online (Sandbox Code Playgroud)

python dataframe pandas

24
推荐指数
2
解决办法
3万
查看次数

mpirun - 没有足够的插槽可用

通常当我使用mpirun时,我可以"超载"它,使用的处理器比我的计算机上的处理器多.例如,在我的四核mac上,我可以运行mpirun -np 29 python -c "print 'hey'"没问题.我现在在另一台机器上,这会引发以下错误:

$ mpirun -np 25 python -c "print 'hey'"
--------------------------------------------------------------------------
There are not enough slots available in the system to satisfy the 25 slots 
that were requested by the application:
  python

Either request fewer slots for your application, or make more slots available
for use.
--------------------------------------------------------------------------
Run Code Online (Sandbox Code Playgroud)

为什么不"超频"mpirun在这里工作?有没有办法可以克服此错误消息并使用比可用处理器更多的处理器成功运行?

hpc mpi openmpi

22
推荐指数
2
解决办法
2万
查看次数

理解python xgboost cv

我想使用xgboost cv函数来查找我的训练数据集的最佳参数.api我很困惑.我如何找到最佳参数?这与sklearn grid_search交叉验证功能类似吗?如何max_depth确定参数([2,4,6])的哪个选项最佳?

from sklearn.datasets import load_iris
import xgboost as xgb
iris = load_iris()
DTrain = xgb.DMatrix(iris.data, iris.target)
x_parameters = {"max_depth":[2,4,6]}
xgb.cv(x_parameters, DTrain)
...
Out[6]: 
   test-rmse-mean  test-rmse-std  train-rmse-mean  train-rmse-std
0        0.888435       0.059403         0.888052        0.022942
1        0.854170       0.053118         0.851958        0.017982
2        0.837200       0.046986         0.833532        0.015613
3        0.829001       0.041960         0.824270        0.014501
4        0.825132       0.038176         0.819654        0.013975
5        0.823357       0.035454         0.817363        0.013722
6        0.822580       0.033540         0.816229        0.013598
7        0.822265       0.032209         0.815667        0.013538
8        0.822158       0.031287         0.815390        0.013508
9        0.822140       0.030647 …
Run Code Online (Sandbox Code Playgroud)

python cross-validation xgboost

15
推荐指数
4
解决办法
3万
查看次数

使用numba来加速循环

从我读过的内容来看,numba可以显着加快python程序的速度.使用numba可以提高我的程序的时间效率吗?

import numpy as np

def f_big(A, k, std_A, std_k, mean_A=10, mean_k=0.2, hh=100):
    return ( 1 / (std_A * std_k * 2 * np.pi) ) * A * (hh/50) ** k * np.exp( -1*(k - mean_k)**2 / (2 * std_k **2 ) - (A - mean_A)**2 / (2 * std_A**2))

outer_sum = 0
dk = 0.000001
for k in np.arange(dk,0.4, dk):
    inner_sum = 0
    for A in np.arange(dk, 20, dk):
        inner_sum += dk * f_big(A, k, 1e-5, 1e-5)
    outer_sum += …
Run Code Online (Sandbox Code Playgroud)

python numba

12
推荐指数
1
解决办法
6213
查看次数

返回对象的javascript函数返回[object Object]

我的函数的预期输出是{"name": "bob", "number": 1},但它返回[object Object].如何实现所需的输出?

function myfunc() {
   return {"name": "bob", "number": 1};
}
myfunc();
Run Code Online (Sandbox Code Playgroud)

javascript

9
推荐指数
1
解决办法
2万
查看次数

如何找出Python包含目录的位置?

我知道在通过Homebrew安装Python后,我的include目录在这里:

/usr/local/Cellar/python/2.7.10_2/Frameworks/Python.framework/Versions/2.7/include/python2.7
Run Code Online (Sandbox Code Playgroud)

有没有办法让Python告诉我include/lib目录在哪里?有点像:

python -c "import sys; print '\n'.join(sys.path)"
Run Code Online (Sandbox Code Playgroud)

python

9
推荐指数
3
解决办法
1万
查看次数