小编zes*_*sla的帖子

错误：从 keras.preprocessing.text 导入 base_filter

我刚开始使用 Keras。刚刚尝试导入 base_filter 进行文本预处理。我做了：

from keras.preprocessing.text import base_filter

Run Code Online (Sandbox Code Playgroud)

我有错误：

ImportError: cannot import name 'Base_filter'

Run Code Online (Sandbox Code Playgroud)

令人惊讶的是，我进行了谷歌搜索，但找不到任何答案。有谁知道出了什么问题？base_filter 在哪里位于 keras

多谢。

python keras

zes*_*sla

2017 03-17

2
推荐指数

1
解决办法

3362
查看次数

statsmodel:模拟数据并运行简单的线性回归

我是python statsmodels包的新手.我正在尝试模拟与log(x)线性相关的一些数据,并使用statsmodels公式接口运行简单的线性回归.以下是代码:

import pandas as pd
import numpy as np
import statsmodels.formula.api as smf

B0 = 3
B1 = 0.5
x = np.linspace(10, 1e4, num = 1000)
epsilon = np.random.normal(0,3, size=1000)

y=B0 + B1*np.log(x)+epsilon
df1 = pd.DataFrame({'Y':y, 'X':x})

model = smf.OLS ('Y~np.log(X)', data=df1).fit()

Run Code Online (Sandbox Code Playgroud)

我收到以下错误:

ValueError                                Traceback (most recent call last)
<ipython-input-34-c0ab32ca2acf> in <module>()
      7 y=B0 + B1*np.log(X)+epsilon
      8 df1 = pd.DataFrame({'Y':y, 'X':X})
----> 9 smf.OLS ('Y~np.log(X)', data=df1)

/Users/tiger/anaconda/lib/python3.5/site-packages/statsmodels/regression/linear_model.py in __init__(self, endog, exog, missing, hasconst, **kwargs)
    689                  **kwargs):
    690         super(OLS, self).__init__(endog, …

Run Code Online (Sandbox Code Playgroud)

python statsmodels

zes*_*sla

lucky-day

1
推荐指数

1
解决办法

1768
查看次数

如何在两个变量的组合上运行模型,并使用tidyverse为每个模型返回一个p值和r-square的数据帧

我正在尝试在不同的变量组合上运行模型.我希望有一个包含3列的数据框:每个模型的变量,p值和r-square.我正在使用mtcars数据集作为示例.这是我的代码:

c('wt', 'hp', 'qsec') %>% 
    combn(2, paste, collapse='*') %>% 
    structure(., names=.) %>% 
    map(~formula(paste('mpg~', .x))) %>% 
    map(lm, data=mtcars) %>%
    map(~coef(summary(.x))[4,4]) %>% 
    unlist() %>% 
    data.frame(p.value=.) %>% 
    rownames_to_column(var='interaction')

Run Code Online (Sandbox Code Playgroud)

这是我的输出:

interaction      p.value
1       wt*hp 0.0008108307
2     wt*qsec 0.2652596233
3     hp*qsec 0.0001411028

Run Code Online (Sandbox Code Playgroud)

问题是如何在从每个模型中提取r-square后向数据框添加另一列？我想在上面的链接操作中实现这一点.由于我希望将方法推广到其他类型的模型,所以我想在不使用扫帚包的情况下这样做.感谢它,如果有人可以帮助我.非常感谢.

r dplyr purrr tidyverse

zes*_*sla

lucky-day

1
推荐指数

1
解决办法

272
查看次数

在熊猫中合并两个数据框时如何“模糊”匹配字符串

我有两个数据框df1和df2。

df1 = pd.DataFrame ({'Name': ['Adam Smith', 'Anne Kim', 'John Weber', 'Ian Ford'],
                     'Age': [43, 21, 55, 24]})
df2 = pd.DataFrame ({'Name': ['adam Smith', 'Annie Kim', 'John  Weber', 'Ian Ford'],
                     'gender': ['M', 'F', 'M', 'M']})

Run Code Online (Sandbox Code Playgroud)

我需要在列上将pandas.merge与这两个数据框连接起来Name。但是，您注意到，Name两个数据框的列之间存在一些细微差异。假设他们是同一个人。如果我只是这样做：

pd.merge(df1, df2, how='inner', on='Name')

Run Code Online (Sandbox Code Playgroud)

我只得到了只有一行的数据帧，即“ Ian Ford”。

有谁知道如何合并这两个数据框？我猜如果在字符串列上连接两个表，这是很常见的情况。我绝对不知道该如何处理。非常感谢。

python pandas

zes*_*sla

lucky-day

1
推荐指数

1
解决办法

2204
查看次数

如何控制autoplot.forecast中的置信区间？

预测时间序列后，我们可以使用自动绘图来绘制时间序列及其预测。我正在使用该forecast包。但我想控制预测部分的置信区间。如何使绘图仅显示 95% 间隔或仅 80% 间隔，或根本不显示间隔。我将参数设置conf.int为FALSE. 但它似乎并没有抑制图中的conf间隔。任何人都可以帮助使其发挥作用吗？谢谢。

fc <- ses(AirPassengers, h = 5)
autoplot(fc, conf.int = F)

Run Code Online (Sandbox Code Playgroud)

r time-series forecasting

zes*_*sla

2018 08-19

1
推荐指数

1
解决办法

3513
查看次数

使用 pheatmap 包在热图中添加间隙

我使用下面的代码制作了热图：

library(pheatmap)
library(dplyr)

data = data.frame(matrix(runif(10*10), ncol=10))
data$sample = rep(c("tumour", "normal"), 5)
data$subject.ID = paste('Subject', 1:10)
data = data %>% arrange(sample)

# for row annotation
my_sample_col = data %>% select(sample)
rownames(my_sample_col) = data$subject.ID
# data matrix
mat = as.matrix(data %>% select(-sample, -subject.ID))
rownames(mat) = data$subject.ID

pheatmap(mat,
         scale='row',
         annotation_row = my_sample_col,
         annotation_names_row=F,
         cluster_rows = FALSE,
         cluster_cols = FALSE,
         show_colnames = FALSE,
         show_rownames = FALSE)

Run Code Online (Sandbox Code Playgroud)

我想在第 5 行和第 6 行之间放置一个间隙，以根据我的行注释分隔热图。

从pheatmap功能上看，这个论证gaps_row似乎起到了作用。

vector of row indices that show shere …

Run Code Online (Sandbox Code Playgroud)

r heatmap pheatmap

zes*_*sla

2018 12-30

1
推荐指数

1
解决办法

1万
查看次数

使用 stringr 将下划线分隔的两个单词的第一个字母大写

我有一个类似的字符串word_string。我想要的是Word_String。str_to_title如果我使用from 的函数stringr，我得到的是Word_string. 它不将第二个单词大写。

有谁知道有什么优雅的方式来实现这一点吗stringr？谢谢！

r stringr

zes*_*sla

lucky-day

1
推荐指数

1
解决办法

917
查看次数

在容器外加载数据时，dockerized 闪亮的应用程序不起作用

我有一个简单的闪亮应用程序，它从data文件夹加载数据并生成一个交互式绘图。我对我闪亮的应用程序进行了docker化。我将data文件夹放在容器中。dockerized 应用程序可以在我的本地主机上成功部署。这是我的global.r文件：

library(shiny) 
library(dplyr)
df = readRDS('./data/mydata.rds')

Run Code Online (Sandbox Code Playgroud)

最终我需要闪亮的应用程序从外部文件夹加载数据。所以我global.r像这样改变了我的文件：

library(shiny) 
library(dplyr)
df = readRDS('c:/user/document/data/mydata.rds')

Run Code Online (Sandbox Code Playgroud)

在这里，我希望应用程序从本地驱动器上的文件夹之一加载数据。c:/user/document/data/. 该应用程序可以完美运行。但是在我将它docker化并尝试在本地主机上运行docker镜像之后。它失败了！

我似乎应用程序无法连接到 docker 容器之外的文件夹？我是 docker 新手。我糊涂了....

有谁知道如何使闪亮的应用程序连接并从 docker 容器外的文件夹加载数据？来自本地驱动器上的文件夹或共享点文件夹或....？非常感谢！

r shiny docker shiny-server

zes*_*sla

lucky-day

1
推荐指数

1
解决办法

377
查看次数

如何在闪亮的可编辑数据表中指定文件名并限制列编辑

我这里有一个闪亮的应用程序示例。它使用包显示可编辑的DT数据表。

为了能够下载多个页面上显示的所有数据，我server=FALSE与一起使用renderDT。

我现在想要实现的是

限制用户编辑某些特定列。下面的代码似乎不起作用。

editable = list(target = 'cell', disable = list(column = c("Sepal.Length", "Sepal.Width")))
我想在导出到 csv 时指定默认文件名，例如 data.csv. 那可能吗？

如果有人能帮助我，我将非常感激。多谢。

    library(shiny)
    library(DT)
    library(dplyr)    
    # UI
    ui = fluidPage(
        selectInput("nrows",
                    "select n entries",
                    choices = 100:150,
                    selected = 100,
                    multiple = FALSE),
        DT::dataTableOutput('tbl'),
                   checkboxGroupInput('datacols', 
                                      label='Select Columns:',
                                      choices= c('Sepal.Length', 'Sepal.Width', 'Petal.Length', 'Petal.Width', 'Specie'),
                                      selected = c('Sepal.Length', 'Sepal.Width', 'Petal.Length', 'Petal.Width', 'Specie'),
                                      inline=TRUE )

    )

    # SERVER
    server = function(input, output) {



        df = …

Run Code Online (Sandbox Code Playgroud)

r shiny dt

zes*_*sla

lucky-day

1
推荐指数

1
解决办法

2021
查看次数

在 pandas 数据框中替换列中的多个值并保持其他值不变

我有一个如下所示的示例数据框：

df = pd.DataFrame({'name': ['red', 'orange', 'blue'],
                   'value': [22,44,66]})

    name    value
0   red     22
1   orange  44
2   blue    66

Run Code Online (Sandbox Code Playgroud)

我需要在列中替换red为1和，blue并保持原样。2orangename

我使用如下所示的地图功能：

df.name.map({'red': 0, 'blue': 1})

Run Code Online (Sandbox Code Playgroud)

我得到的结果如下：

    name    value
0   0.0     22
1   NaN     44
2   1.0     66

Run Code Online (Sandbox Code Playgroud)

在该列中，orange变为NaN

替换值的最佳方法是什么？
我不想使用df.name.str.replace(..)很多次来替换很多值。在我的真实数据中，一列中有 10 个值需要替换。谢谢。

python pandas

zes*_*sla

lucky-day

1
推荐指数

1
解决办法

5389
查看次数

分隔字符列并在r中转换为整齐的格式

我有一个数据集，其中的＃标签列包含可变数量的＃标签，并用分隔;。例如：

id  hashtags
1   #apple;#peach           
2   #apple          
3   #pear;#orange;#banana

Run Code Online (Sandbox Code Playgroud)

我需要做的是将列分开并将其转换为整洁的数据。因此，每一行都包含ID和一个单独的＃标签。

id  hashtag
1   #apple          
1   #peach          
2   #apple          
3   #pear           
3   #orange         
3   #banana

Run Code Online (Sandbox Code Playgroud)

我可以使用下面的循环来做到这一点。

library(tidyverse)
df = data.frame(id=1:3, hashtags=c("#apple;#peach", "#apple", "#pear;#orange;#banana"))

dat = data.frame()
for (i in 1:nrow(df)) {
  dt = data.frame(id = df$id[i], 
                  hashtag = str_split(df$hashtags[i], ';')[[1]])
  dat = bind_rows(dat, dt)
}

Run Code Online (Sandbox Code Playgroud)

但是我认为上述方法不是一个好的解决方案。当我有一个非常大的数据集（我的实际数据）时，我发现它非常慢。

有没有人有更好，更快的方法来实现这一目标？请注意，每个ID的＃标签数量变化很大。tidyr::separate似乎不适用于这里。非常感谢。

r dplyr tidyr

zes*_*sla

lucky-day

0
推荐指数

1
解决办法

38
查看次数

如何从 SQL Server 的日期列中提取两位数格式的月份？

我需要从 SQL Server 的数据库表中以两位数的形式提取月份。

SELECT 
   Cast(datepart(month, prod_date) as nvarchar(10))
FROM myTbl

Run Code Online (Sandbox Code Playgroud)

我得到了什么：

1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12

Run Code Online (Sandbox Code Playgroud)

我需要的：

01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12

Run Code Online (Sandbox Code Playgroud)

实现这一目标的最佳方法是什么？

sql sql-server

zes*_*sla

2019 12-31

-1
推荐指数

2
解决办法

5900
查看次数

标签统计

r ×7

python ×4

dplyr ×2

pandas ×2

shiny ×2

docker ×1

dt ×1

forecasting ×1

heatmap ×1

keras ×1

pheatmap ×1

purrr ×1

shiny-server ×1

sql ×1

sql-server ×1

statsmodels ×1

stringr ×1

tidyr ×1

tidyverse ×1

time-series ×1

标签 统计

小编zes_sla的帖子

标签统计