小编use*_*838的帖子

rgdal包安装

这里的问题并不完全是如何通过R绘制地图,因为我已经发现这里有一个非常好的例子,而是如何让它工作.实际上,我无法加载库rgdal:

library(rgdal)
Error in library(rgdal) : there is no package called ‘rgdal’
Run Code Online (Sandbox Code Playgroud)

但是,当我尝试手动安装上面的包时,我收到以下错误:

....
configure: error: proj_api.h not found in standard or given locations.
ERROR: configuration failed for package ‘rgdal’
* removing ‘/home/eualin/R/i686-pc-linux-gnu-library/2.15/rgdal’
Warning in install.packages : installation of package ‘/home/eualin/Downloads/rgdal_0.8-5.tar.gz’ had non-zero exit status
Run Code Online (Sandbox Code Playgroud)

欢迎任何投入!

maps r

107
推荐指数
7
解决办法
7万
查看次数

如何通过Docker在MongoDB上启用身份验证?

我想启动一个docker,mongodb:latest但只允许某些用户访问某些db(即启用--auth).没有人应该访问mongodb!作为docker启动的一部分,我该如何做?

BTW,data directory在启动期间使用以下命令位于主机上:-v /my/own/datadir:/data/db.

mongodb docker

50
推荐指数
10
解决办法
6万
查看次数

如何在Apache Spark中计算百分位数

我有一个整数rdd(即RDD[Int]),我想做的是计算以下十个百分位:[0th, 10th, 20th, ..., 90th, 100th].最有效的方法是什么?

apache-spark

25
推荐指数
3
解决办法
3万
查看次数

通过Python连接远程MySQL数据库

我尝试过以下脚本,但遗憾的是无效.我正在使用免费的MySQL数据库提供程序.有任何想法吗?

import MySQLdb

myDB = MySQLdb.connect(host="208.11.220.249",port=3306,user="XXXXX",passwd="XXXXX",db="XXXXX")
cHandler = myDB.cursor()
cHandler.execute("SHOW DATABASES")
results = cHandler.fetchall()
for items in results:
    print items[0]
Run Code Online (Sandbox Code Playgroud)

目前,我收到以下错误:

super(Connection, self).__init__(*args, **kwargs2)
_mysql_exceptions.OperationalError: (1044, "Access denied for user 'XXXXX'@'%' to database 'XXXXX'")
Run Code Online (Sandbox Code Playgroud)

python mysql

15
推荐指数
2
解决办法
4万
查看次数

通过GridSearchCV()探索svm.SVC()超参数的有效值范围是多少?

我遇到的问题是我的超参数svm.SVC()太宽,以至于GridSearchCV()永远不会完成!一个想法是改为使用RandomizedSearchCV().但同样,我的数据集相对较大,因此500次迭代需要大约1小时!

我的问题是,为了阻止浪费资源,GridSearchCV(或RandomizedSearchCV)的一个好的设置(就每个超参数的值范围而言)是什么?

换句话说,如何判断C100以上的值是否有意义和/或1的步长既不大也不小?很感谢任何形式的帮助.这是我目前正在使用的设置:

parameters = {
    'C':            np.arange( 1, 100+1, 1 ).tolist(),
    'kernel':       ['linear', 'rbf'],                   # precomputed,'poly', 'sigmoid'
    'degree':       np.arange( 0, 100+0, 1 ).tolist(),
    'gamma':        np.arange( 0.0, 10.0+0.0, 0.1 ).tolist(),
    'coef0':        np.arange( 0.0, 10.0+0.0, 0.1 ).tolist(),
    'shrinking':    [True],
    'probability':  [False],
    'tol':          np.arange( 0.001, 0.01+0.001, 0.001 ).tolist(),
    'cache_size':   [2000],
    'class_weight': [None],
    'verbose':      [False],
    'max_iter':     [-1],
    'random_state': [None],
    }

model = grid_search.RandomizedSearchCV( n_iter              = 500,
                                        estimator           = svm.SVC(),
                                        param_distributions = parameters,
                                        n_jobs              = 4, …
Run Code Online (Sandbox Code Playgroud)

machine-learning svm scikit-learn hyperparameters

15
推荐指数
2
解决办法
2万
查看次数

如何从命令行中将PDF数据从PDF中提取出来?

我想从这里提取所有行,同时忽略列标题以及所有页面标题,即Supported Devices.

pdftotext -layout DAC06E7D1302B790429AF6E84696FCFAB20B.pdf - \
 | sed '$d'                                                  \
 | sed -r 's/ +/,/g; s/ //g'                                 \
 > output.csv
Run Code Online (Sandbox Code Playgroud)

生成的文件应采用CSV电子表格格式(逗号分隔值字段).

换句话说,我想改进上面的命令,以便输出根本不会制动.有任何想法吗?

pdf grep pdftotext

14
推荐指数
3
解决办法
1万
查看次数

如何在本地模式下使用Spark进行日志记录?

在本地模式下工作时,是否可以在Apache Spark中对某个路径进行日志记录(将作为输入参数提供)?

val conf = new SparkConf().
  setAppName("SparkProgrammingGuide").
  setMaster(master).
  set("spark.eventLog.enabled", "true").
  set("spark.eventLog.dir", "file:///home/USER")
val sc = new SparkContext(conf)
Run Code Online (Sandbox Code Playgroud)

logging apache-spark

10
推荐指数
1
解决办法
2032
查看次数

pyOCR没有可用的工具

似乎我没有正确安装pyOCR,因为当我这样做时我得到一个空列表:

import pyocr.builders
pyocr.get_available_tools()
Run Code Online (Sandbox Code Playgroud)

有任何想法吗?

我已经通过pip在一个环境中安装了pyOCR:

pip install pyocr --upgrade
Run Code Online (Sandbox Code Playgroud)

编辑

以下是诀窍.

sudo apt-get install tesseract-ocr
sudo apt-get install tesseract-ocr-eng
sudo apt-get install tesseract-ocr-ell
Run Code Online (Sandbox Code Playgroud)

python ocr

7
推荐指数
1
解决办法
5312
查看次数

计算字符串出现次数并绘制直方图

是否有任何直接的方法从像下面的单元格数组创建直方图?连续条之间的间距应该完全相同,并且x轴的标签应该是垂直方向下面的变量的相应名称.

'w464'
'w462'
'w461'
'w464'
'w461'
'w463'
'w466'
'w461'
Run Code Online (Sandbox Code Playgroud)

matlab cell histogram

6
推荐指数
2
解决办法
7454
查看次数

使用 F1-score 进行 Keras 多标签图像分类

我正在研究multi-label图像分类问题,并根据F1-score系统预测和真实标签之间的评估进行评估。

鉴于这种情况,我应该使用loss="binary_crossentropy"loss=keras_metrics.f1_score()地方keras_metrics.f1_score()就是从这里取:https://pypi.org/project/keras-metrics/?我有点困惑,因为我在网上找到的所有关于multi-label分类的教程都是基于binary_crossentropy损失函数的,但在这里我必须针对F1-score.

此外,我应该设置metrics=["accuracy"]还是metrics=[keras_metrics.f1_score()]应该将其完全留空?

python classification multilabel-classification keras tensorflow

6
推荐指数
1
解决办法
1395
查看次数