我正在尝试安装sklearn-pandas.
在我的尝试:
easy_install sklearn-pandas
Run Code Online (Sandbox Code Playgroud)
我得到了结果:
软件包安装脚本已尝试修改系统中不在EasyInstall构建区域内且已中止的文件.
EasyInstall无法安全地安装此软件包,即使您手动运行其安装脚本,也可能不支持备用安装位置.请通知软件包的作者和EasyInstall维护人员,以了解是否有可用的修复程序或解决方法.
我在Windows 7上(我承认它!),使用Python 2.7.3
这是我第一次遇到这样的错误.我探索过的可能的想法是更基本的解决方案:
作者没有写这个包与easy_install一起安装我有一些文件权限问题(?)存在某种依赖性问题
如果有人遇到此错误或对此有任何见解,请告诉我!非常感谢.
我已经创建了多个闪亮的行ui
:
shinyUI(fluidPage(
fluidRow(
column(6,
textOutput("text_col1_row_1")),
column(6
textOutput("text_col2_row_1"))),
fluidRow(
column(6,
textOutput("text_col1_row_2")),
column(6,
textOutput("text_col2_row_2"))),
))
Run Code Online (Sandbox Code Playgroud)
这创造了一个漂亮的4 X 4网格.
似乎Shiny的目标是允许用户将对象组织到列中.
我想看看我是否可以将我的显示组织成具有两列的内容,但在一列中,它有两行 - 如果我掀起一个简单的插图,它可能更清晰:
(这只是一个普遍的想法,目前没有任何关于列/行大小的内容 - 只是寻找这个结构的裸骨模板,可以这么说.)
我搜索了文档,似乎找不到合理的解决方案.如果有人想过并解决了这个或有任何想法,我很乐意听到他们.谢谢.
我有一个很好的wellpanel
在我的闪亮即顶部看起来不错:
......但我对实际控件上方和下方的所有额外灰色空间感到恼火!我想删除这个不必要的空间.我的行比它需要的高50%,并且我不确定为什么/如何以这种方式调整Shiny大小.
有css/html/Shiny技能的人是否能够指出我正确的方向,关于如何修改它?到目前为止,我的尝试都没有成功.
这是下面的代码:
shinyUI(fluidPage(
fluidRow(
column(12,
wellPanel(
tags$div(class = "row",
tags$div(class = "span"),
tags$div(class = "span1", h1(numericInput(inputId="num", label="ID", value=NaN))),
tags$div(class = "span2", h1(sliderInput(inputId="age", "Age Range", min=32, max=99, value=c(32, 99), step=1))),
tags$div(class = "span1", h1(radioButtons(inputId="gender", "Gender", c("combined" = 0, "male" = 1, "female" = 2), inline=FALSE))),
tags$div(class = "span1", h1(textOutput("text")))
)
))),
fluidRow(
column(4,
plotOutput("some_plot_not_shown"))
)))
Run Code Online (Sandbox Code Playgroud)
感谢您阅读这篇文章.
我有一个语料库:
X_train = [ ['this is an dummy example']
['in reality this line is very long']
...
['here is a last text in the training set']
]
Run Code Online (Sandbox Code Playgroud)
和一些标签:
y_train = [1, 5, ... , 3]
Run Code Online (Sandbox Code Playgroud)
我想使用Pipeline和GridSearch如下:
pipeline = Pipeline([
('vect', CountVectorizer()),
('tfidf', TfidfTransformer()),
('reg', SGDRegressor())
])
parameters = {
'vect__max_df': (0.5, 0.75, 1.0),
'tfidf__use_idf': (True, False),
'reg__alpha': (0.00001, 0.000001),
}
grid_search = GridSearchCV(pipeline, parameters, n_jobs=1, verbose=1)
grid_search.fit(X_train, y_train)
Run Code Online (Sandbox Code Playgroud)
当我运行这个时,我收到一个错误说AttributeError: lower not found
.
我在这里搜索并发现了一个关于这个错误的问题,这让我相信我的文本没有被标记化存在问题(这听起来就像它击中了头部,因为我使用列表列表作为输入数据,其中每个列表包含一个单个不间断的字符串).
我制作了一个快速而肮脏的标记器来测试这个理论:
def my_tokenizer(X): …
Run Code Online (Sandbox Code Playgroud) 所以之前有这个代码:
flights %>%
group_by(dest) %>%
summarise(arr_delay = mean(arr_delay, na.rm = TRUE),
n = n()) %>%
arrange(desc(arr_delay))
Run Code Online (Sandbox Code Playgroud)
这个代码我明白了.但是,正确的下面的代码显示:
flights %>%
group_by(carrier, flight, dest) %>%
tally(sort = TRUE) %>% # Save some typing
filter( n == 365)
Run Code Online (Sandbox Code Playgroud)
所以这段代码我没有得到
tally(sort = TRUE)
Run Code Online (Sandbox Code Playgroud)
当它说保存一些打字时,它究竟节省了什么?我理解tally(sort = TRUE)
替换summerise(n = n())
,但它如何"节省打字"以及它如何相互关联?如果有人能给我一个分解,tally(sort = TRUE)
那将非常感激!
我的python 2.7代码如下:
import pandas as pd
from pandas import DataFrame
DF_rando = DataFrame([1,2,3])
Run Code Online (Sandbox Code Playgroud)
......然后当我执行时,我得到一个奇怪的错误dateutil.tz
.
/Library/Frameworks/Python.framework/Versions/2.7/bin/python2.7 /Users/mattobrien/pandas_test.py
No module named dateutil.tz
Traceback (most recent call last):
File "/Users/mattobrien/pandas_test.py", line 2, in <module>
import pandas as pd
File "/Library/Python/2.7/site-packages/pandas/__init__.py", line 7, in <module>
from . import hashtable, tslib, lib
File "pandas/tslib.pyx", line 37, in init pandas.tslib (pandas/tslib.c:76999)
ImportError: No module named dateutil.tz
Process finished with exit code 1
Run Code Online (Sandbox Code Playgroud)
很奇怪.我检查确实dateutil.tz
确实安装了.我卸载Pandas
并重新安装它以确保.没问题.
为什么我收到此错误?
我在Shiny中创建了一些单选按钮; 但是,我想知道是否有办法让返回的值为整数,而不是字符.
想要整数出现在用于选择性别的RadioButton的背景下.
当我做:
radioButtons(inputId="gender", "Gender", choices = list("combined" = 0, "male" = 1, "female" = 2)
Run Code Online (Sandbox Code Playgroud)
我发现
print(str((input$gender)))
Run Code Online (Sandbox Code Playgroud)
给我
chr "0"
Run Code Online (Sandbox Code Playgroud)
我知道我可以在服务器中更改此内容:
gender <- as.integer(input$gender)
Run Code Online (Sandbox Code Playgroud)
但我正努力通过减少线条来清理代码.
有没有办法在UI中更改输出类型?
与我发现的问题不同,我希望得到两个没有顺序的列的唯一.
我有一个df:
df<-cbind(c("a","b","c","b"),c("b","d","e","a"))
> df
[,1] [,2]
[1,] "a" "b"
[2,] "b" "d"
[3,] "c" "e"
[4,] "b" "a"
Run Code Online (Sandbox Code Playgroud)
在这种情况下,在ba与ba相同的意义上,第1行和第4行是"重复".
我知道如何找到第1列和第2列的唯一,但我会发现在这种方法下每行都是唯一的.
这个问题的扩展这个问题.
我正在Shiny中绘制一个相当大的gglot.
使用renderPlot(width = 1500, height = 1000, ...
我能够显示整个情节; 但是,我现在右边有一个滚动条.我想在fluidRow中扩展列的高度,而不是使用此滚动条.
根据我的理解,Shiny(也称为bootstrap)应该动态调整fluidRow的高度,使其与绘图的大小无关.为什么我的可见区域这么小?滚动条很不错,但我希望整个情节都可见.
UI.R
source("helper.R")
shinyUI(fluidPage(theme='test.css',
fluidRow(
column(2,
fluidRow(
h3("Select Customer:"),
wellPanel(class="info", numericInput(inputId="num", label="Select ID:", value=NaN),
if(show_age_slider=='Yes'){textOutput("")},
if(show_edu_slider=='Yes'){textOutput("")},
if(show_gender_buttons=='Yes'){textOutput("")}
))),
#do.call will call the navbarPage function with the arguments in the tabs list
shinyUI(fluidRow(
column(12,
"",
do.call(navbarPage,tabs)
))))))
Run Code Online (Sandbox Code Playgroud)
SERVER.R
library("shiny")
library("ggplot2")
DF_for_plotting <- structure(list(col1 = c(0, 0, 0, 0, 0, 0, 0, 0, 0, 0), col2 = c(100,
100, 61.9433678425096, 10.7823906941804, 4.18175346165306, 3.24251454697229,
6.68573373055455, 14.945119260922, 18.9296271776082, 11.0742379220636
), …
Run Code Online (Sandbox Code Playgroud) 在熊猫中,为什么一个TimedeltaProperties
对象没有属性“年”?
毕竟,datetime
对象具有此属性。
对于一个与时间有关的物体来说,这似乎是很自然的事情。特别是如果它已经具有小时,秒等属性。
有一种解决方法,使我的专栏,这是完全一样的值
10060 days
,
可以转换为年?还是更好,只是将其转换为整数表示形式多年?