小编SiH*_*iHa的帖子

matplotlib:生成矢量图

我想用matplotlib生成一个矢量图.我努力了 - 但输出是光栅图像.这是我使用的:

import matplotlib
matplotlib.use('Agg')
import matplotlib.pyplot as plt
Run Code Online (Sandbox Code Playgroud)

最后:

myfig.savefig('myfig.eps', format='eps')
Run Code Online (Sandbox Code Playgroud)

我发现导出ps给出了一个矢量图像,但问题eps仍然存在.

matplotlib vector-graphics

14
推荐指数
4
解决办法
3万
查看次数

如何从Python中的HTML页面中提取URL

我必须用Python编写一个Web爬虫.我不知道如何解析页面并从HTML中提取URL.我应该去哪里学习编写这样的程序?

换句话说,是否有一个简单的python程序可以用作通用Web爬虫的模板?理想情况下,它应该使用相对简单易用的模块,并且应该包含大量注释来描述每行代码的作用.

python url web-crawler

13
推荐指数
4
解决办法
5万
查看次数

https安全性受到损害

IE9在我的网站上有这些错误:

 SEC7111:  HTTPS security is compromised by res://ieframe.dll/dnserrordiagoff.htm 
 SEC7111:  HTTPS security is compromised by res://ieframe.dll/ErrorPageTemplate.css 
 SEC7111:  HTTPS security is compromised by res://ieframe.dll/errorPageStrings.js 
 SEC7111:  HTTPS security is compromised by res://ieframe.dll/httpErrorPagesScripts.js 
 SEC7111:  HTTPS security is compromised by res://ieframe.dll/noConnect.png 
 SEC7111:  HTTPS security is compromised by res://ieframe.dll/bullet.png 
Run Code Online (Sandbox Code Playgroud)

我知道这个错误的产生是因为我试图http通过https协议获取内容.但我无法在页面中看到可能导致此问题的任何地方.我调查过这个问题可能通过自定义浏览器来解决,但这不是一个好的解决方案.

有谁知道导致这些错误的原因是什么?

https internet-explorer

13
推荐指数
1
解决办法
1万
查看次数

使用GridSearchCV的随机森林 - param_grid出错

我试图用GridSearchCV创建一个随机森林模型但是得到一个与param_grid有关的错误:"ValueError:估算器管道的参数max_features无效.用`estimator.get_params().keys()"检查可用参数列表.我正在对文档进行分类,所以我也将tf-idf矢量化器推送到管道.这是代码:

from sklearn import metrics
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import classification_report, f1_score, accuracy_score, precision_score, confusion_matrix
from sklearn.pipeline import Pipeline

 #Classifier Pipeline
pipeline = Pipeline([
    ('tfidf', TfidfVectorizer()),
    ('classifier', RandomForestClassifier())
])
# Params for classifier
params = {"max_depth": [3, None],
              "max_features": [1, 3, 10],
              "min_samples_split": [1, 3, 10],
              "min_samples_leaf": [1, 3, 10],
              # "bootstrap": [True, False],
              "criterion": ["gini", "entropy"]}

# Grid Search Execute
rf_grid = GridSearchCV(estimator=pipeline , param_grid=params) #cv=10
rf_detector = rf_grid.fit(X_train, Y_train)
print(rf_grid.grid_scores_)
Run Code Online (Sandbox Code Playgroud)

我无法弄清楚错误显示的原因.当我使用GridSearchCV运行决策树时,正在发生相同的顺便说一句.(Scikit-learn 0.17)

python random-forest scikit-learn grid-search

13
推荐指数
2
解决办法
2万
查看次数

glm()模型的交叉验证

我正在尝试对我之前在R中构建的一些glm模型进行10倍交叉验证.虽然我已经阅读了很多帮助文件,但我cv.glm()boot包中的函数有点困惑.当我提供以下公式时:

library(boot)
cv.glm(data, glmfit, K=10)
Run Code Online (Sandbox Code Playgroud)

这里的"数据"参数是指整个数据集还是仅指测试集?

到目前为止我看到的例子提供了"数据"参数作为测试集,但这并没有真正有意义,例如为什么在同一测试集上有10倍?它们都会给出完全相同的结果(我假设!).

不幸的是,?cv.glm它以模糊的方式解释:

data:包含数据的矩阵或数据帧.行应为case,列对应变量,其中一个是响应

我的另一个问题是$delta[1]结果.这是10次试验的平均预测误差吗?如果我想获得每个折叠的错误怎么办?

这是我的脚本的样子:

##data partitioning
sub <- sample(nrow(data), floor(nrow(x) * 0.9))
training <- data[sub, ]
testing <- data[-sub, ]

##model building
model <- glm(formula = groupcol ~ var1 + var2 + var3,
        family = "binomial", data = training)

##cross-validation
cv.glm(testing, model, K=10)
Run Code Online (Sandbox Code Playgroud)

partitioning r prediction glm cross-validation

12
推荐指数
2
解决办法
2万
查看次数

X上的Dojo对话框关闭事件(右上角)

我使用Dojo创建一个简单的对话框来在系统中创建用户.问题是我收到错误:

Tried to register widget with `id==user_submit` but that `id` is already registered
Run Code Online (Sandbox Code Playgroud)

user_submit,是一个Dojo按钮,我必须完成对话框内的表单.当我通过单击并提交表单关闭对话框时,再次打开对话框没有问题(在按钮上的单击事件中,我有这行代码:

dijit.byId("user_submit").destroy();
Run Code Online (Sandbox Code Playgroud)

但是如果我通过右上角的[x] -link /按钮关闭对话框,我不会破坏按钮,然后在不重新加载页面的情况下无法再次打开对话框.

如何让Dojo破坏按钮或如何重载[X] -link /按钮上的click事件,这样我可以为按钮编写destroy命令?

javascript dojo dialog button

11
推荐指数
2
解决办法
2万
查看次数

Android Studio 3.0参数提示信息并不总是可见?

对不起,我不知道这个新功能是如何被完全调用的,请看截图: 在此输入图像描述

因此,参数名称在方法调用中可见.这很酷,但正如您所看到的,在这种情况下,只有第一个参数,第二个参数没有可见的名称.根据我的观察,它有时是有效的,有时却没有,我无法弄清楚为什么.

我可以配置它,还是只是一个bug?或许我不明白该功能是如何工作的.

android android-studio-3.0

11
推荐指数
3
解决办法
4180
查看次数

关注超链接和"过滤后的异地请求"

我知道那里有几个相关的线程,他们帮助了我很多,但我仍然不能一路走来.我正处于运行代码不会导致错误的程度,但我的csv文件中没有任何内容.我有以下Scrapy蜘蛛在一个网页上开始,然后跟随一个超链接,并抓取链接的页面:

from scrapy.http import Request
from scrapy.spider import BaseSpider
from scrapy.selector import HtmlXPathSelector
from scrapy.item import Item, Field

class bbrItem(Item):
    Year = Field()
    AppraisalDate = Field()
    PropertyValue = Field()
    LandValue = Field()
    Usage = Field()
    LandSize = Field()
    Address = Field()    

class spiderBBRTest(BaseSpider):
    name = 'spiderBBRTest'
    allowed_domains = ["http://boliga.dk"]
    start_urls = ['http://www.boliga.dk/bbr/resultater?sort=hus_nr_sort-a,etage-a,side-a&gade=Septembervej&hus_nr=29&ipostnr=2730']

    def parse2(self, response):        
        hxs = HtmlXPathSelector(response)
        bbrs2 = hxs.select("id('evaluationControl')/div[2]/div")
        bbrs = iter(bbrs2)
        next(bbrs)
        for bbr in bbrs:
            item = bbrItem()
            item['Year'] = bbr.select("table/tbody/tr[1]/td[2]/text()").extract()
            item['AppraisalDate'] …
Run Code Online (Sandbox Code Playgroud)

python callback scrapy web-scraping

10
推荐指数
2
解决办法
8785
查看次数

使用RSpec和Capybara测试模态对话框

当我单击导航栏上的"登录"时,会弹出一个模态对话框,将该日志部分呈现.

我将如何使用RSpec和Capybara进行测试?

<!--....-->
<li><%= link_to "Log in", '#', data: {:'reveal-id' => 'loginModal'} %></li>
<!--....-->

<div id="loginModal" class="reveal-modal">
  <%= render 'devise/sessions/new' %>
  <a class="close-reveal-modal">&#215;</a>
</div>
Run Code Online (Sandbox Code Playgroud)

rspec ruby-on-rails

10
推荐指数
1
解决办法
9871
查看次数

如何在Liquid中的for循环中创建数组?

我正在尝试使用Liquid语法从对象列表中创建一个数组:

{% for operation in menuItems %}
      {% assign words1 = operation.Title | split: '_' %}
      {% assign controllerName = words1 | first %}
      {% assign controllersTmp = controllersTmp | append: '_' | append: controllerName %}
{% endfor %}
Run Code Online (Sandbox Code Playgroud)

我想分裂controllersTmp得到我的数组,但此时我的controllersTmp是空的.

有帮助吗?

arrays liquid azure-api-management

10
推荐指数
2
解决办法
7957
查看次数