小编Mic*_* WS的帖子

禁用Pylint没有成员 - 特定库的E1101错误

无论如何都要隐藏E1101从特定库创建的对象的错误?我们的大型存储库充斥着#pylint: disable=E1101大熊猫创建的各种对象.

例如,pylint将在以下代码上抛出无成员错误:

import pandas.io.data
import pandas as pd
spy = pandas.io.data.DataReader("SPY", "yahoo")
spy.to_csv("test.csv")
spy = pd.read_csv("test.csv")
close_px = spy.ix["2012":]
Run Code Online (Sandbox Code Playgroud)

会有以下错误:

E:  6,11: Instance of 'tuple' has no 'ix' member (no-member)
E:  6,11: Instance of 'TextFileReader' has no 'ix' member (no-member)
Run Code Online (Sandbox Code Playgroud)

pylint pandas

28
推荐指数
3
解决办法
1万
查看次数

指定cython输出文件

似乎默认设置来自distutils.core并将cmdclass设置为build_ext,在当前工作目录中编译cpp或c文件.有没有办法确定生成的c代码写入的位置?否则,存储库将充满生成的代码.

例如,此文件setup.py将文件example.c写入当前工作目录:

from distutils.core import setup
from Cython.Build import cythonize

setup(
      ext_modules = cythonize("example.pyx"))
Run Code Online (Sandbox Code Playgroud)

c++ python cython

22
推荐指数
3
解决办法
5316
查看次数

Pandas加入/合并/连接两个数据帧

我遇到了大熊猫加入的问题,我正在试图找出问题所在.说我有一个dataframex:

<class 'pandas.core.frame.DataFrame'>
DatetimeIndex: 1941 entries, 2004-10-19 00:00:00 to 2012-07-23 00:00:00
Data columns:
close    1941  non-null values
high     1941  non-null values
low      1941  non-null values
open     1941  non-null values
dtypes: float64(4)
Run Code Online (Sandbox Code Playgroud)

我应该能够使用简单的连接命令将其与y连接在一起,其中y = x除了colnames有+2.

 <class 'pandas.core.frame.DataFrame'>
 DatetimeIndex: 1941 entries, 2004-10-19 00:00:00 to 2012-07-23 00:00:00
 Data columns:
 close2    1941  non-null values
 high2     1941  non-null values
 low2      1941  non-null values
 open2     1941  non-null values
 dtypes: float64(4)

 y.join(x) or pandas.DataFrame.join(y,x):
 <class 'pandas.core.frame.DataFrame'>
 DatetimeIndex: 34879 entries, 2004-12-16 00:00:00 to 2012-07-12 00:00:00
 Data …
Run Code Online (Sandbox Code Playgroud)

python pandas

20
推荐指数
2
解决办法
3万
查看次数

来自pandas的JS dataTables

我想将pandas dataFrames与dataTables一起使用.我无法弄清楚如何在没有id的情况下初始化表.

当我调用df.to_html()时,有没有办法在table标签中设置id?

python datatables pandas

13
推荐指数
2
解决办法
4522
查看次数

从numpy数组中删除None的有效方法

有没有一种有效的方法从numpy数组中删除Nones并将数组调整为新的大小?

例如,如果不在python中迭代它,你将如何从这个帧中删除None.我可以轻松地遍历它,但正在进行一次可能被多次调用的api调用.

a = np.array([1,45,23,23,1234,3432,-1232,-34,233,None])
Run Code Online (Sandbox Code Playgroud)

python numpy

13
推荐指数
2
解决办法
1万
查看次数

在cython代码上运行pep8或pylint

有没有办法使用pep8与cython文件?

例如,pep8不适用于运营商.

getline(& line)
Run Code Online (Sandbox Code Playgroud)

产生错误:

E225 missing whitespace around operator
Run Code Online (Sandbox Code Playgroud)

现在,如果我尝试修复它并运行它:

getline( & line)
Run Code Online (Sandbox Code Playgroud)

产生错误:

 E201 whitespace after '('
Run Code Online (Sandbox Code Playgroud)

pep8 pylint cython flake8

11
推荐指数
2
解决办法
1311
查看次数

9
推荐指数
1
解决办法
3998
查看次数

使用datetime索引对大熊猫read_csv进行速度提升

我有大量的文件,如下所示:

5月31日/ 2012,15:30:00.029,130​​6.25,1,E,0,...,1306.25

5月31日/ 2012,15:30:00.029,130​​6.25,8,E,0,...,1306.25

我可以使用以下内容轻松阅读它们:

  pd.read_csv(gzip.open("myfile.gz"), header=None,names=
  ["date","time","price","size","type","zero","empty","last"], parse_dates=[[0,1]])
Run Code Online (Sandbox Code Playgroud)

有没有办法有效地将这样的日期解析成熊猫时间戳?如果没有,是否有任何编写可以传递给date_parser =的cython函数的指南?

我尝试编写自己的解析器函数,但我正在处理的项目仍然需要很长时间.

python performance date-formatting pandas

8
推荐指数
2
解决办法
7674
查看次数

ipython笔记本firefox滚动条

我有一个超过70列的pandas DataFrame.
当我对它进行计算时,firefox(在Windows上)将DataFrame打印在比为其分配的窗口更大的空间中.我希望滚动条适合分配给它的ipython窗口.有没有干净的方法来处理这个?

它可以在ifoxthon笔记本窗口中使用此代码在firefox中重新创建.

df = pd.DataFrame(np.random.randn(100, 20))
df.tail()
Run Code Online (Sandbox Code Playgroud)

python pandas ipython-notebook

5
推荐指数
1
解决办法
292
查看次数

确定从python中导入类的位置

有没有办法确定一个类来自python(尤其是sklearn)的类?我想确定一个类是来自sklearn.linear_models还是sklearn.ensemble.

作为示例,我希望能够确定Ridge()是否是sklearn.linear_model的成员.

拟合函数根据模型有点不同,因此通过patsy输入的公式需要不同.

python scikit-learn

4
推荐指数
1
解决办法
59
查看次数