小编use*_*838的帖子

如何摆脱“类路径包含多个 SLF4J 绑定”警告？

这或多或少是一个“常见”问题，但是，我还没有找到一个好的答案。所以，再次警告：

SLF4J: Class path contains multiple SLF4J bindings.
SLF4J: Found binding in [jar:file:/home/eualin/.m2/repository/org/slf4j/slf4j-jcl/1.6.0/slf4j-jcl-1.6.0.jar!/org/slf4j/impl/StaticLoggerBinder.class]
SLF4J: Found binding in [jar:file:/home/eualin/.m2/repository/org/slf4j/slf4j-log4j12/1.5.11/slf4j-log4j12-1.5.11.jar!/org/slf4j/impl/StaticLoggerBinder.class]
SLF4J: See http://www.slf4j.org/codes.html#multiple_bindings for an explanation.

Run Code Online (Sandbox Code Playgroud)

这里有两个可能的问题解决方案[1] [2]。

假设它们都为我工作，显然，它们只是黑客，我不确定我是否应该依赖它们中的任何一个。你会推荐我什么？请记住，在终端中不会出现警告；仅当我通过 IntelliJIDEA 运行应用程序时。

任何建议都将受到高度赞赏。

java warnings slf4j

use*_*838

2017 05-23

5
推荐指数

2
解决办法

2万
查看次数

如何在Apache Spark中编码分类功能

我有一组数据,我想根据这些数据创建一个分类模型.每行都有以下形式:

user1,class1,product1
user1,class1,product2
user1,class1,product5
user2,class1,product2
user2,class1,product5
user3,class2,product1

Run Code Online (Sandbox Code Playgroud)

大约有1M个用户,2个类和1M个产品.我接下来要做的是创建稀疏向量(MLlib已经支持的东西)但为了应用该函数,我必须首先创建密集向量(使用0).换句话说,我必须将数据二进制化.这样做最简单(或最优雅)的方式是什么？

鉴于我是MLlib的新手,请问您提供一个具体的例子？我正在使用MLlib 1.2.

编辑

我最终得到了以下一段代码,但事实证明是非常慢......除了提供我只能使用MLlib 1.2之外的任何其他想法？

val data = test11.map(x=> ((x(0) , x(1)) , x(2))).groupByKey().map(x=> (x._1 , x._2.toArray)).map{x=>
  var lt : Array[Double] = new Array[Double](test12.size)
  val id = x._1._1
  val cl = x._1._2
  val dt = x._2
  var i = -1
  test12.foreach{y => i += 1; lt(i) = if(dt contains y) 1.0 else 0.0}
  val vs = Vectors.dense(lt)
  (id , cl , vs)
}

Run Code Online (Sandbox Code Playgroud)

scala apache-spark apache-spark-1.2 apache-spark-mllib

use*_*838

2016 04-25

5
推荐指数

1
解决办法

8452
查看次数

如何在现有的Flask应用程序中使用Flask-APScheduler

我试图通过以下示例代码熟悉Flask-APScheduler插件:https://github.com/viniciuschiele/flask-apscheduler/blob/master/examples/jobs.py#L1

我的项目有以下结构:

backend
    run.py
    application
        __init__.py
        utilities
            __init__.py
            views
            models

Run Code Online (Sandbox Code Playgroud)

哪里,

backend>run.py 是:

from application import app
app.run(debug=True)
from application import scheduler
scheduler.start()

Run Code Online (Sandbox Code Playgroud)

backend>application>__init__.py 是:

from flask import Flask
app = Flask(__name__)
from application.utilities.views import Config
from flask_apscheduler import APScheduler
app.config.from_object(Config())
scheduler = APScheduler()
scheduler.init_app(app)

Run Code Online (Sandbox Code Playgroud)

backend>application>utilities>__init__.py 是空的

backend>application>utilities>models.py 是空的

backend>application>utilities>views.py 是:

class Config(object):
    JOBS = [
        {
            'id': 'job1',
            'func': 'application:utilities:views:job1',
            'args': (1, 2),
            'trigger': {
                'type': 'cron',
                'second': 10
            }
        }
    ]

def job1(a, b):
    print(str(a) …

Run Code Online (Sandbox Code Playgroud)

flask apscheduler

use*_*838

lucky-day

5
推荐指数

1
解决办法

6825
查看次数

Python中的语言代码列表(ISO639-1)？

是否有可能从pycountry 1.15获取所有ISO639-1语言代码的列表？例如,['en','it','el','fr',...]？如果是,那怎么样？

以下不起作用我害怕:

import pycountry
pycountry.languages

Run Code Online (Sandbox Code Playgroud)

python

use*_*838

2015 09-25

5
推荐指数

1
解决办法

3541
查看次数

如何计算一个数字与平均值的标准差有多少？

我有一个大小为 (61964, 25) 的矩阵。这是一个示例：

array([[  1.,   0.,   0.,   4.,   0.,   1.,   0.,   0.,   0.,   0.,   3.,
          0.,   2.,   1.,   0.,   0.,   3.,   0.,   3.,   0.,  14.,   0.,
          2.,   0.,   4.],
       [  0.,   0.,   0.,   1.,   2.,   0.,   0.,   0.,   0.,   0.,   1.,
          0.,   2.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   5.,   0.,
          0.,   0.,   1.]])

Run Code Online (Sandbox Code Playgroud)

Scikit-learn 提供了一个有用的函数，前提是我们的数据呈正态分布：

from sklearn import preprocessing

X_2 = preprocessing.scale(X[:, :3])

Run Code Online (Sandbox Code Playgroud)

然而，我的问题是我必须按行进行工作 - 这不仅仅包含 25 个观察值 - 因此正态分布在这里不适用。解决方案是使用 t 分布，但如何在 Python 中做到这一点？

通常，值从 0 到 …

python arrays numpy standard-deviation scikit-learn

use*_*838

2017 01-10

4
推荐指数

1
解决办法

4745
查看次数

如何用re.split()分割所有特殊字符

我试图re.split()从import re包中使用任何特殊字符进行拆分.这是我到目前为止所做的,但似乎还没有真正解决.有任何想法吗？

word = [b for b in re.split(r'\`\-\=\~\!\@\#\$\%\^\&\*\(\)\_\+\[\]\{\}\;\'\\\:\"\|\<\,\.\/\>\<\>\?', a)]

Run Code Online (Sandbox Code Playgroud)

python regex

use*_*838

2014 01-09

3
推荐指数

3
解决办法

2万
查看次数

我的计算机上安装了两个Anaconda.第一个基于Python 2.7,另一个基于Python 3.4.默认的Python版本是3.4.更重要的是,我可以通过键入/home/eualin/.bin/anaconda3/bin/python或只是python来启动Python 3.4 .我可以通过键入/home/eualin/.bin/anaconda2/bin/python为Python 2.7做同样的事情.我的问题是我不知道如何在某些环境下安装新的库(在Python 2.7或Python 3.4下).例如,当我执行pip install seaborn时,默认情况下在Python 3.4下安装库,而实际上我想在Python 2.7下安装它.有任何想法吗？

编辑

这就是我到目前为止所做的:〜/ .bashrc文件包含以下两个块,其中只有一个在任何给定时间启用.

# added by Anaconda 2.1.0 installer
export PATH="/home/eualin/.bin/anaconda2/bin:$PATH"

# added by Anaconda3 2.1.0 installer
#export PATH="/home/eualin/.bin/anaconda3/bin:$PATH"

Run Code Online (Sandbox Code Playgroud)

根据我想要工作的版本,我打开fie,注释相反的块source ~/.bashrc然后,我安装我想逐个使用的库.但是,这是推荐的方式吗？

python anaconda

use*_*838

2014 12-31

3
推荐指数

1
解决办法

7129
查看次数

如何在docker中恢复postgres？

我创建这样的备份: docker exec DOCKER pg_dump -U USER -F t DB | gzip > ./FILE.tar.gz

鉴于数据库在容器内运行,恢复数据库的最佳方法是什么？

postgresql restore docker

use*_*838

2017 11-17

3
推荐指数

1
解决办法

3500
查看次数

在MATLAB中加入矩阵

我有两个矩阵,如下所示:

'01/01/2010'          1
'02/01/2010'          2
'03/01/2010'          3
'05/01/2010'         11
'06/01/2010'         17

'01/01/2010'          4
'02/01/2010'          5
'04/01/2010'          6
'05/01/2010'          7

Run Code Online (Sandbox Code Playgroud)

在MATLAB中做了一些棘手的事情后,我想创建以下三个矩阵:

'01/01/2010'          1          4
'02/01/2010'          2          5
'03/01/2010'          3        NaN
'04/01/2010'        NaN          6
'05/01/2010'         11          7
'06/01/2010'         17        NaN


'01/01/2010'          1          4
'02/01/2010'          2          5
'05/01/2010'         11          7

Run Code Online (Sandbox Code Playgroud)

关于如何加入这些表的任何想法？干杯.

编辑:真的很抱歉我的错别字,伙计们.我更新了问题和输入/输出数据.请随时提供建议.

matlab join inner-join dataset outer-join

use*_*838

2012 06-12

2
推荐指数

1
解决办法

6198
查看次数

使用Scala计算数组B中的数组A的元素

比方说,我有两个字符串数组

A = ('abc', 'joia', 'abas8', '09ma09', 'oiam0')

Run Code Online (Sandbox Code Playgroud)

和

B = ('gfdg', '89jkjj', '09ma09', 'asda', '45645ghf', 'dgfdg', 'yui345gd', '6456ds', '456dfs3', 'abas8', 'sfgds').

Run Code Online (Sandbox Code Playgroud)

我想要做的只是计算B中出现的A中每个字符串的元素数量(如果有的话).例如,此处生成的数组应为:C = (0, 0, 1, 1, 0).我怎样才能做到这一点？

arrays scala

use*_*838

2015 01-01

1
推荐指数

1
解决办法

740
查看次数

标签统计

python ×4

arrays ×2

scala ×2

anaconda ×1

apache-spark ×1

apache-spark-1.2 ×1

apache-spark-mllib ×1

apscheduler ×1

dataset ×1

docker ×1

flask ×1

inner-join ×1

java ×1

join ×1

matlab ×1

numpy ×1

outer-join ×1

postgresql ×1

regex ×1

restore ×1

scikit-learn ×1

slf4j ×1

standard-deviation ×1

warnings ×1

小编use_838的帖子

如何摆脱“类路径包含多个 SLF4J 绑定”警告？

如何在Apache Spark中编码分类功能

如何在现有的Flask应用程序中使用Flask-APScheduler

Python中的语言代码列表(ISO639-1)？

如何计算一个数字与平均值的标准差有多少？

如何用re.split()分割所有特殊字符

如何在特定环境下安装Python库

如何在docker中恢复postgres？

在MATLAB中加入矩阵

使用Scala计算数组B中的数组A的元素

标签统计

标签 统计

小编use_838的帖子

标签统计