小编Mat*_*ien的帖子

使用easy_install和sklearn-pandas

我正在尝试安装sklearn-pandas.

在我的尝试:

easy_install sklearn-pandas
Run Code Online (Sandbox Code Playgroud)

我得到了结果:

软件包安装脚本已尝试修改系统中不在EasyInstall构建区域内且已中止的文件.

EasyInstall无法安全地安装此软件包,即使您手动运行其安装脚本,也可能不支持备用安装位置.请通知软件包的作者和EasyInstall维护人员,以了解是否有可用的修复程序或解决方法.

我在Windows 7上(我承认它!),使用Python 2.7.3

这是我第一次遇到这样的错误.我探索过的可能的想法是更基本的解决方案:

作者没有写这个包与easy_install一起安装我有一些文件权限问题(?)存在某种依赖性问题

如果有人遇到此错误或对此有任何见解,请告诉我!非常感谢.

python easy-install sklearn-pandas

7
推荐指数
1
解决办法
1286
查看次数

在Shiny中创建涉及行和列的非对称布局

我已经创建了多个闪亮的行ui:

shinyUI(fluidPage(

fluidRow(    
  column(6,
        textOutput("text_col1_row_1")),
  column(6
        textOutput("text_col2_row_1"))),

fluidRow( 
  column(6,
       textOutput("text_col1_row_2")),
  column(6,
       textOutput("text_col2_row_2"))),
   ))
Run Code Online (Sandbox Code Playgroud)

这创造了一个漂亮的4 X 4网格.

似乎Shiny的目标是允许用户将对象组织到列中.

我想看看我是否可以将我的显示组织成具有两列的内容,但在一列中,它有两行 - 如果我掀起一个简单的插图,它可能更清晰:

在此输入图像描述

(这只是一个普遍的想法,目前没有任何关于列/行大小的内容 - 只是寻找这个结构的裸骨模板,可以这么说.)

我搜索了文档,似乎找不到合理的解决方案.如果有人想过并解决了这个或有任何想法,我很乐意听到他们.谢谢.

layout r data-visualization shiny

7
推荐指数
1
解决办法
5966
查看次数

改变Shiny中的井板高度

我有一个很好的wellpanel在我的闪亮即顶部看起来不错:

截图

......但我对实际控件上方和下方的所有额外灰色空间感到恼火!我想删除这个不必要的空间.我的行比它需要的高50%,并且我不确定为什么/如何以这种方式调整Shiny大小.

有css/html/Shiny技能的人是否能够指出我正确的方向,关于如何修改它?到目前为止,我的尝试都没有成功.

这是下面的代码:

shinyUI(fluidPage(


  fluidRow(  
    column(12,
           wellPanel(              
             tags$div(class = "row",
                      tags$div(class = "span"),
                      tags$div(class = "span1", h1(numericInput(inputId="num", label="ID", value=NaN))),
                      tags$div(class = "span2", h1(sliderInput(inputId="age", "Age Range", min=32, max=99, value=c(32, 99), step=1))),
                      tags$div(class = "span1", h1(radioButtons(inputId="gender", "Gender", c("combined" = 0, "male" = 1, "female" = 2), inline=FALSE))),
                      tags$div(class = "span1", h1(textOutput("text")))
             )
           ))),  



  fluidRow(   


    column(4,
           plotOutput("some_plot_not_shown"))

)))
Run Code Online (Sandbox Code Playgroud)

感谢您阅读这篇文章.

r shiny

7
推荐指数
1
解决办法
6121
查看次数

AttributeError:未找到lower; 在scikit-learn中使用带有CountVectorizer的Pipeline

我有一个语料库:

X_train = [ ['this is an dummy example'] 
      ['in reality this line is very long']
      ...
      ['here is a last text in the training set']
    ]
Run Code Online (Sandbox Code Playgroud)

和一些标签:

y_train = [1, 5, ... , 3]
Run Code Online (Sandbox Code Playgroud)

我想使用Pipeline和GridSearch如下:

pipeline = Pipeline([
    ('vect', CountVectorizer()),
    ('tfidf', TfidfTransformer()),
    ('reg', SGDRegressor())
])


parameters = {
    'vect__max_df': (0.5, 0.75, 1.0),
    'tfidf__use_idf': (True, False),
    'reg__alpha': (0.00001, 0.000001),
}

grid_search = GridSearchCV(pipeline, parameters, n_jobs=1, verbose=1)

grid_search.fit(X_train, y_train)
Run Code Online (Sandbox Code Playgroud)

当我运行这个时,我收到一个错误说AttributeError: lower not found.

在这里搜索并发现了一个关于这个错误的问题,这让我相信我的文本没有被标记化存在问题(这听起来就像它击中了头部,因为我使用列表列表作为输入数据,其中每个列表包含一个单个不间断的字符串).

我制作了一个快速而肮脏的标记器来测试这个理论:

def my_tokenizer(X): …
Run Code Online (Sandbox Code Playgroud)

python pipeline scikit-learn

7
推荐指数
1
解决办法
1万
查看次数

理解记录(sort = TRUE)

所以之前有这个代码:

flights %>%
  group_by(dest) %>%
  summarise(arr_delay = mean(arr_delay, na.rm = TRUE),
  n = n()) %>%
arrange(desc(arr_delay))
Run Code Online (Sandbox Code Playgroud)

这个代码我明白了.但是,正确的下面的代码显示:

flights %>%
  group_by(carrier, flight, dest) %>%
  tally(sort = TRUE) %>% # Save some typing
  filter( n == 365)
Run Code Online (Sandbox Code Playgroud)

所以这段代码我没有得到

tally(sort = TRUE)
Run Code Online (Sandbox Code Playgroud)

当它说保存一些打字时,它究竟节省了什么?我理解tally(sort = TRUE)替换summerise(n = n()),但它如何"节省打字"以及它如何相互关联?如果有人能给我一个分解,tally(sort = TRUE)那将非常感激!

r dplyr

6
推荐指数
1
解决办法
6055
查看次数

使用熊猫时,dateutil.tz包显然丢失了吗?

我的python 2.7代码如下:

import pandas as pd
from pandas import DataFrame

DF_rando = DataFrame([1,2,3])
Run Code Online (Sandbox Code Playgroud)

......然后当我执行时,我得到一个奇怪的错误dateutil.tz.

/Library/Frameworks/Python.framework/Versions/2.7/bin/python2.7 /Users/mattobrien/pandas_test.py
No module named dateutil.tz
Traceback (most recent call last):
  File "/Users/mattobrien/pandas_test.py", line 2, in <module>
    import pandas as pd
  File "/Library/Python/2.7/site-packages/pandas/__init__.py", line 7, in <module>
    from . import hashtable, tslib, lib
  File "pandas/tslib.pyx", line 37, in init pandas.tslib (pandas/tslib.c:76999)
ImportError: No module named dateutil.tz

Process finished with exit code 1
Run Code Online (Sandbox Code Playgroud)

很奇怪.我检查确实dateutil.tz确实安装了.我卸载Pandas并重新安装它以确保.没问题.

为什么我收到此错误?

python pandas

6
推荐指数
1
解决办法
1万
查看次数

从Shiny中的RadioButton返回整数值

我在Shiny中创建了一些单选按钮; 但是,我想知道是否有办法让返回的值为整数,而不是字符.

想要整数出现在用于选择性别的RadioButton的背景下.

当我做:

radioButtons(inputId="gender", "Gender", choices = list("combined" = 0, "male" = 1, "female" = 2)
Run Code Online (Sandbox Code Playgroud)

我发现

print(str((input$gender)))
Run Code Online (Sandbox Code Playgroud)

给我

chr "0" 
Run Code Online (Sandbox Code Playgroud)

我知道我可以在服务器中更改此内容:

gender <- as.integer(input$gender)
Run Code Online (Sandbox Code Playgroud)

但我正努力通过减少线条来清理代码.

有没有办法在UI中更改输出类型?

r shiny

6
推荐指数
1
解决办法
1219
查看次数

在R中考虑两列的唯一行,没有顺序

与我发现的问题不同,我希望得到两个没有顺序的列的唯一.

我有一个df:

df<-cbind(c("a","b","c","b"),c("b","d","e","a"))
> df
     [,1] [,2]
 [1,] "a"  "b" 
 [2,] "b"  "d" 
 [3,] "c"  "e" 
 [4,] "b"  "a" 
Run Code Online (Sandbox Code Playgroud)

在这种情况下,在ba与ba相同的意义上,第1行和第4行是"重复".

我知道如何找到第1列和第2列的唯一,但我会发现在这种方法下每行都是唯一的.

r unique plyr dplyr

6
推荐指数
2
解决办法
7221
查看次数

如何在没有工具栏的情况下显示我的情节?

这个问题的扩展这个问题.

我正在Shiny中绘制一个相当大的gglot.

使用renderPlot(width = 1500, height = 1000, ...我能够显示整个情节; 但是,我现在右边有一个滚动条.我想在fluidRow中扩展列的高度,而不是使用此滚动条.

在此输入图像描述

根据我的理解,Shiny(也称为bootstrap)应该动态调整fluidRow的高度,使其与绘图的大小无关.为什么我的可见区域这么小?滚动条很不错,但我希望整个情节都可见.

UI.R

source("helper.R")    
shinyUI(fluidPage(theme='test.css',

    fluidRow(
    column(2, 
           fluidRow(
             h3("Select Customer:"),
                    wellPanel(class="info", numericInput(inputId="num", label="Select ID:", value=NaN),
                              if(show_age_slider=='Yes'){textOutput("")},
                              if(show_edu_slider=='Yes'){textOutput("")},
                              if(show_gender_buttons=='Yes'){textOutput("")}
                    ))),

    #do.call will call the navbarPage function with the arguments in the tabs list
    shinyUI(fluidRow(
      column(12,
             "", 
             do.call(navbarPage,tabs)
    ))))))
Run Code Online (Sandbox Code Playgroud)

SERVER.R

library("shiny")
library("ggplot2")

DF_for_plotting <- structure(list(col1 = c(0, 0, 0, 0, 0, 0, 0, 0, 0, 0), col2 = c(100, 
                                                                                   100, 61.9433678425096, 10.7823906941804, 4.18175346165306, 3.24251454697229, 
                                                                                   6.68573373055455, 14.945119260922, 18.9296271776082, 11.0742379220636
), …
Run Code Online (Sandbox Code Playgroud)

html css r shiny twitter-bootstrap-3

6
推荐指数
1
解决办法
549
查看次数

AttributeError:“ TimedeltaProperties”对象在熊猫中没有属性“ years”

在熊猫中,为什么一个TimedeltaProperties对象没有属性“年”?

毕竟,datetime对象具有此属性。

对于一个与时间有关的物体来说,这似乎是很自然的事情。特别是如果它已经具有小时,秒等属性。

有一种解决方法,使我的专栏,这是完全一样的值
10060 days
可以转换为年?还是更好,只是将其转换为整数表示形式多年?

python datetime pandas

6
推荐指数
2
解决办法
6439
查看次数