小编Mar*_*oon的帖子

scikit-learn和sklearn之间的区别

在OS X 10.11.6和python 2.7.10上,我需要从sklearn流形中导入.我有numpy 1.8 Orc1,scipy .13 Ob1和scikit-learn 0.17.1已安装.
我使用pip来安装sklearn(0.0),但是当我尝试从sklearn歧管导入时,我得到以下内容:

回溯(最近通话最后一个):文件"",1号线,在文件"/Library/Python/2.7/site-packages/sklearn/ 初始化 py"为57行,从.base进口克隆文件"/库/的Python/2.7 /站点包/ sklearn/base.py",第11行,从.utils.fixes导入签名文件"/Library/Python/2.7/site-packages/sklearn/utils/ 初始化的.py",10号线,来自.murmurhash import murmurhash3_32文件"numpy.pxd",第155行,在init sklearn.utils.murmurhash(sklearn/utils/murmurhash.c:5029)ValueError:numpy.dtype的大小错误,请尝试重新编译.

scikit-learn和sklearn有什么区别？另外,由于语法错误,我无法导入scikit-learn

python python-2.7 scikit-learn

Bar*_*rry

2016 08-03

24
推荐指数

3
解决办法

4万
查看次数

主脚本停止时后台进程的参数错误无效

我有这个代码通过运行后台进程来获取推文.以下脚本使用subprocess.Popen函数从主脚本运行.这样主脚本将在调用后台进程脚本后停止执行.

def start_listner(unique_id, keyword, limit=200):
    class CustomStreamListener(tweepy.StreamListener):

        def __init__(self, api):
            logger.info('runnning')
            self.api = api
            super(tweepy.StreamListener, self).__init__()

            #setup rabbitMQ Connection


        def on_status(self, status):
            print status.text.encode('utf-8'), "\n"
            #queue the tweet and writes the tweet to the log

        def on_error(self, status_code):
          #some code to not kill the stream

        def on_timeout(self):
          #some code to not kill the stream

    sapi = tweepy.streaming.Stream(auth, CustomStreamListener(api))
    try:
        logger.info('tracking started')
        logger.info(keyword)
        logger.info(type(keyword))
        kw = keyword
        sapi.filter(track=[kw])  # keeps listening to the streaming api
    except Exception, err:
        logger.info(kw) …

Run Code Online (Sandbox Code Playgroud)

python daemon background-process tweepy python-2.7

Mar*_*oon

2017 05-23

10
推荐指数

1
解决办法

565
查看次数

通过bigquery-python库向BigQuery插入大量数据

我有大型csv文件和excel文件,我在其中读取它们并根据它具有的字段和类型动态创建所需的创建表脚本.然后将数据插入到创建的表中.

我已经阅读了这篇文章并理解我应该发送它们jobs.insert()而不是tabledata.insertAll()大量的数据.

这就是我所说的(适用于较小的文件而不是较大的文件).

result  = client.push_rows(datasetname,table_name,insertObject) # insertObject is a list of dictionaries

Run Code Online (Sandbox Code Playgroud)

当我使用库的push_rows时,它会在Windows中出现此错误.

[Errno 10054] An existing connection was forcibly closed by the remote host

Run Code Online (Sandbox Code Playgroud)

这在ubuntu中.

[Errno 32] Broken pipe

Run Code Online (Sandbox Code Playgroud)

因此,当我使用BigQuery-Python代码时table_data.insertAll().

我怎么能用这个库做这个？我知道我们可以上传谷歌存储,但我需要直接上传方法.

python large-data python-2.7 google-bigquery

Mar*_*oon

2017 09-23

7
推荐指数

1
解决办法

936
查看次数

适用于Windows的pgadmin3黑暗主题？

Windows下的pgadmin3是否有黑暗主题？我一直在搜索选项和谷歌谷歌试图找到任何指向它的东西,无济于事.

我运气不好吗？

postgresql themes pgadmin

use*_*710

2016 06-07

6
推荐指数

2
解决办法

4601
查看次数

根据查询结果创建插入脚本

每周有几次，我需要根据 pgAdmin III 中的查询结果创建 SQL 插入脚本。

目前，我手动执行此操作。pgAdmin 中是否有函数可以将查询结果导出到 SQL 插入脚本？我使用 postgreSQL 数据库。

或者是否有另一个（开源）工具可以做到这一点？我正在运行 Ubuntu Linux。

谢谢

postgresql pgadmin

tmm*_*ls2

2016 07-31

6
推荐指数

1
解决办法

7843
查看次数

MongoDB:ReadPreferenceServerSelector未选择任何服务器

最近我使用的是新发布的mongodb java异步驱动程序.我正在写一些简单的测试代码,它们是:

    MongoClient mongoClient = MongoClients.create();
    System.out.println("database has been connected!");

    SingleResultCallback<Void> callbackWhenFinished = new SingleResultCallback<Void>() {
        @Override
        public void onResult(final Void result, final Throwable t) {
            System.out.println("Operation Finished!");
        }
    };

    mongoClient.listDatabaseNames().forEach(new Block<String>() {
        @Override
        public void apply(final String s) {
            System.out.println(s);
        }
    }, callbackWhenFinished);

Run Code Online (Sandbox Code Playgroud)

但是,没有调用回调函数,控制台输出是:

2015年4月18日下午10:50:27 com.mongodb.diagnostics.logging.JULLogger日志消息:使用设置创建的集群{hosts = [localhost:27017],mode = SINGLE,requiredClusterType = UNKNOWN,serverSelectionTimeout ='30000 ms', maxWaitQueueSize = 500}
数据库已连接! 2015年4月18日下午10:50:28 com.mongodb.diagnostics.logging.JULLogger日志消息:ReadPreferenceServerSelector {readPreference = primary}从集群描述ClusterDescription中选择的服务器 {type = UNKNOWN,connectionMode = SINGLE,all = [ServerDescription { address = localhost:27017,type = UNKNOWN,state = …

mongodb mongodb-java

ahw*_*100

2015 04-18

5
推荐指数

1
解决办法

2万
查看次数

从Intellij IDEA运行JHipster Gradle任务

当我从Intellij IDEA运行Gradle时发生此错误..但是从控制台一切正常......有人知道为什么？

执行外部任务'run --stacktrace'...:compileJava UP-TO-DATE:compileScala UP-TO-DATE:bower FAILED

org.gradle.api.tasks.TaskExecutionException:任务':bower'的执行失败.

引起:java.io.IOException:无法运行程序"bower"(在目录"/ Users/eduardo/Development/projects/jhipster"中):error = 2,没有这样的文件或目录

intellij-idea spring-boot jhipster

edu*_*tos

2015 04-11

3
推荐指数

2
解决办法

2783
查看次数

Statsmodels.formula.api OLS 不显示截距的统计值

我正在运行以下源代码：

import statsmodels.formula.api as sm

# Add one column of ones for the intercept term
X = np.append(arr= np.ones((50, 1)).astype(int), values=X, axis=1)

regressor_OLS = sm.OLS(endog=y, exog=X).fit()
print(regressor_OLS.summary())

Run Code Online (Sandbox Code Playgroud)

在哪里

X 是一个 50x5（在添加截距项之前）的 numpy 数组，如下所示：

[[0 1 165349.20 136897.80 471784.10]
 [0 0 162597.70 151377.59 443898.53]...]

Run Code Online (Sandbox Code Playgroud)

并且y是一个 50x1 numpy 数组，具有因变量的浮点值。

前两列用于具有三个不同值的虚拟变量。其余的列是三个不同的独立变量。

虽然，据说statsmodels.formula.api.OLS自动添加了一个拦截项（参见@stellacia 的回答：OLS using statsmodel.formula.api vs statsmodel.api）它summary没有显示拦截项的统计值，在我的情况下如下所示：

                            OLS Regression Results                            
==============================================================================
Dep. Variable:                 Profit   R-squared:                       0.988
Model:                            OLS   Adj. R-squared:                  0.986
Method:                 Least Squares   F-statistic: …

Run Code Online (Sandbox Code Playgroud)

python statistics regression linear-regression statsmodels

Poe*_*dit

2018 07-04

2
推荐指数

1
解决办法

2717
查看次数

为什么 async/await 不同步 forEach 循环内 ioredis get 方法的执行？

异步/等待方法：

Ids = ['abc','lmn','xyz']

Ids.forEach(function (resId){
    console.log('inside loop');
    async function operation(){
        var curObj = await redisClient.get('key1');
        console.log('done waiting');
  }
}

Run Code Online (Sandbox Code Playgroud)

另一个函数的回调方法：

function operation(cb) {
         redisClient.get('key1', cb);
       }
operation(function(){
    console.log('inside operation');
});

Run Code Online (Sandbox Code Playgroud)

我想等到 curObj 变量设置并按顺序执行代码以打印“完成等待”。我使用了 async/await 但它似乎没有按预期工作。然后我用相同的 get 方法使用回调仍然相同。我使用 ioredis 库。

我做错了什么？

node.js async-await ioredis

Mar*_*oon

lucky-day

1
推荐指数

1
解决办法

4760
查看次数

在勺中保存/创建新的转换文件时发生错误

保存/在勺子中创建新转换或作业时，出现以下错误。

从输入流中读取信息时出错，文件过早结束。

要重新创建，

File-> New-> Transformation然后单击保存

重新启动汤匙将无法解决此问题。单击错误消息的“确定”按钮时，一切正常。
Pentaho版本：5.3.0.0-213
操作系统：Windows Server 2008 R2 Enterprise

详细的错误消息附在此处。

16 11:55:16-常规-错误（版本5.3.0.0-213，由buildguy于2015-02-02_12-17-08创建，版本1）：读取共享对象时发生错误（持续加载）：org。 pentaho.di.core.exception.KettleXMLException：2015/04/16 11:55:16-常规-从XML文件读取共享对象时出现意外问题：null 2015/04/16 11:55:16-常规-2015/04 / 16 11:55:16-常规-从输入流中读取信息时出错2015/04/16 11:55:16-常规-文件过早结束。2015/04/16 11:55:16-常规-错误（版本5.3.0.0-213，由buildguy从2015-02-02_12-17-08构建1）：org.pentaho.di.core.exception.KettleXMLException： 2015/04/16 11:55:16-常规-从XML文件读取共享对象时出现意外问题：null 2015/04/16 11:55:16-常规-2015/04/16 11:55：16-常规-从输入流中读取信息时出错2015/04/16 11:55:16-常规-文件过早结束。2015/04/16 11:55:16-常规-2015/04/16 11:55:16-常规-2015/04/16 11:55:16-常规-在org.pentaho.di.shared.SharedObjects。（SharedObjects.java:165）2015/04/16 11:55:16-常规-在org.pentaho.di.trans.TransMeta.readSharedObjects（TransMeta.java:3332）2015/04/16 11:55:16-常规-org.pentaho.di.trans.TransMeta.loadXML（TransMeta.java:2865）2015/04/16 11:55:16-常规-org.pentaho.di.trans.TransMeta。（TransMeta.java： 2671）2015/04/16 11:55:16-常规-在org.pentaho.di.trans.TransMeta。（TransMeta.java:2623）2015/04/16 11:55:16-常规-在org.pentaho .di.trans.TransMeta。（TransMeta.java:2600）2015/04/16 11:55:16-General-at org.pentaho.di.trans.TransMeta。（TransMeta。

pentaho

Mar*_*oon

lucky-day

0
推荐指数

1
解决办法

2437
查看次数