我刚开始使用 Keras。刚刚尝试导入 base_filter 进行文本预处理。我做了:
from keras.preprocessing.text import base_filter
Run Code Online (Sandbox Code Playgroud)
我有错误:
ImportError: cannot import name 'Base_filter'
Run Code Online (Sandbox Code Playgroud)
令人惊讶的是,我进行了谷歌搜索,但找不到任何答案。有谁知道出了什么问题?base_filter 在哪里位于 keras
多谢。
我是python statsmodels包的新手.我正在尝试模拟与log(x)线性相关的一些数据,并使用statsmodels公式接口运行简单的线性回归.以下是代码:
import pandas as pd
import numpy as np
import statsmodels.formula.api as smf
B0 = 3
B1 = 0.5
x = np.linspace(10, 1e4, num = 1000)
epsilon = np.random.normal(0,3, size=1000)
y=B0 + B1*np.log(x)+epsilon
df1 = pd.DataFrame({'Y':y, 'X':x})
model = smf.OLS ('Y~np.log(X)', data=df1).fit()
Run Code Online (Sandbox Code Playgroud)
我收到以下错误:
ValueError Traceback (most recent call last)
<ipython-input-34-c0ab32ca2acf> in <module>()
7 y=B0 + B1*np.log(X)+epsilon
8 df1 = pd.DataFrame({'Y':y, 'X':X})
----> 9 smf.OLS ('Y~np.log(X)', data=df1)
/Users/tiger/anaconda/lib/python3.5/site-packages/statsmodels/regression/linear_model.py in __init__(self, endog, exog, missing, hasconst, **kwargs)
689 **kwargs):
690 super(OLS, self).__init__(endog, …Run Code Online (Sandbox Code Playgroud) 我正在尝试在不同的变量组合上运行模型.我希望有一个包含3列的数据框:每个模型的变量,p值和r-square.我正在使用mtcars数据集作为示例.这是我的代码:
c('wt', 'hp', 'qsec') %>%
combn(2, paste, collapse='*') %>%
structure(., names=.) %>%
map(~formula(paste('mpg~', .x))) %>%
map(lm, data=mtcars) %>%
map(~coef(summary(.x))[4,4]) %>%
unlist() %>%
data.frame(p.value=.) %>%
rownames_to_column(var='interaction')
Run Code Online (Sandbox Code Playgroud)
这是我的输出:
interaction p.value
1 wt*hp 0.0008108307
2 wt*qsec 0.2652596233
3 hp*qsec 0.0001411028
Run Code Online (Sandbox Code Playgroud)
问题是如何在从每个模型中提取r-square后向数据框添加另一列?我想在上面的链接操作中实现这一点.由于我希望将方法推广到其他类型的模型,所以我想在不使用扫帚包的情况下这样做.感谢它,如果有人可以帮助我.非常感谢.
我有两个数据框df1和df2。
df1 = pd.DataFrame ({'Name': ['Adam Smith', 'Anne Kim', 'John Weber', 'Ian Ford'],
'Age': [43, 21, 55, 24]})
df2 = pd.DataFrame ({'Name': ['adam Smith', 'Annie Kim', 'John Weber', 'Ian Ford'],
'gender': ['M', 'F', 'M', 'M']})
Run Code Online (Sandbox Code Playgroud)
我需要在列上将pandas.merge与这两个数据框连接起来Name。但是,您注意到,Name两个数据框的列之间存在一些细微差异。假设他们是同一个人。如果我只是这样做:
pd.merge(df1, df2, how='inner', on='Name')
Run Code Online (Sandbox Code Playgroud)
我只得到了只有一行的数据帧,即“ Ian Ford”。
有谁知道如何合并这两个数据框?我猜如果在字符串列上连接两个表,这是很常见的情况。我绝对不知道该如何处理。非常感谢。
预测时间序列后,我们可以使用自动绘图来绘制时间序列及其预测。我正在使用该forecast包。但我想控制预测部分的置信区间。如何使绘图仅显示 95% 间隔或仅 80% 间隔,或根本不显示间隔。我将参数设置conf.int为FALSE. 但它似乎并没有抑制图中的conf间隔。任何人都可以帮助使其发挥作用吗?谢谢。
fc <- ses(AirPassengers, h = 5)
autoplot(fc, conf.int = F)
Run Code Online (Sandbox Code Playgroud) 我使用下面的代码制作了热图:
library(pheatmap)
library(dplyr)
data = data.frame(matrix(runif(10*10), ncol=10))
data$sample = rep(c("tumour", "normal"), 5)
data$subject.ID = paste('Subject', 1:10)
data = data %>% arrange(sample)
# for row annotation
my_sample_col = data %>% select(sample)
rownames(my_sample_col) = data$subject.ID
# data matrix
mat = as.matrix(data %>% select(-sample, -subject.ID))
rownames(mat) = data$subject.ID
pheatmap(mat,
scale='row',
annotation_row = my_sample_col,
annotation_names_row=F,
cluster_rows = FALSE,
cluster_cols = FALSE,
show_colnames = FALSE,
show_rownames = FALSE)
Run Code Online (Sandbox Code Playgroud)
我想在第 5 行和第 6 行之间放置一个间隙,以根据我的行注释分隔热图。
从pheatmap功能上看,这个论证gaps_row似乎起到了作用。
vector of row indices that show shere …Run Code Online (Sandbox Code Playgroud) 我有一个类似的字符串word_string。我想要的是Word_String。str_to_title如果我使用from 的函数stringr,我得到的是Word_string. 它不将第二个单词大写。
有谁知道有什么优雅的方式来实现这一点吗stringr?谢谢!
我有一个简单的闪亮应用程序,它从data文件夹加载数据并生成一个交互式绘图。我对我闪亮的应用程序进行了docker化。我将data文件夹放在容器中。dockerized 应用程序可以在我的本地主机上成功部署。这是我的global.r文件:
library(shiny)
library(dplyr)
df = readRDS('./data/mydata.rds')
Run Code Online (Sandbox Code Playgroud)
最终我需要闪亮的应用程序从外部文件夹加载数据。所以我global.r像这样改变了我的文件:
library(shiny)
library(dplyr)
df = readRDS('c:/user/document/data/mydata.rds')
Run Code Online (Sandbox Code Playgroud)
在这里,我希望应用程序从本地驱动器上的文件夹之一加载数据。c:/user/document/data/. 该应用程序可以完美运行。但是在我将它docker化并尝试在本地主机上运行docker镜像之后。它失败了!
我似乎应用程序无法连接到 docker 容器之外的文件夹?我是 docker 新手。我糊涂了....
有谁知道如何使闪亮的应用程序连接并从 docker 容器外的文件夹加载数据?来自本地驱动器上的文件夹或共享点文件夹或....?非常感谢!
我这里有一个闪亮的应用程序示例。它使用包显示可编辑的DT数据表。
为了能够下载多个页面上显示的所有数据,我server=FALSE与 一起使用renderDT。
我现在想要实现的是
限制用户编辑某些特定列。下面的代码似乎不起作用。
editable = list(target = 'cell', disable = list(column = c("Sepal.Length", "Sepal.Width")))
我想在导出到 csv 时指定默认文件名,例如 data.csv. 那可能吗?
如果有人能帮助我,我将非常感激。多谢。
library(shiny)
library(DT)
library(dplyr)
# UI
ui = fluidPage(
selectInput("nrows",
"select n entries",
choices = 100:150,
selected = 100,
multiple = FALSE),
DT::dataTableOutput('tbl'),
checkboxGroupInput('datacols',
label='Select Columns:',
choices= c('Sepal.Length', 'Sepal.Width', 'Petal.Length', 'Petal.Width', 'Specie'),
selected = c('Sepal.Length', 'Sepal.Width', 'Petal.Length', 'Petal.Width', 'Specie'),
inline=TRUE )
)
# SERVER
server = function(input, output) {
df = …Run Code Online (Sandbox Code Playgroud) 我有一个如下所示的示例数据框:
df = pd.DataFrame({'name': ['red', 'orange', 'blue'],
'value': [22,44,66]})
name value
0 red 22
1 orange 44
2 blue 66
Run Code Online (Sandbox Code Playgroud)
我需要在列中替换red为1和,blue并保持原样。2orangename
我使用如下所示的地图功能:
df.name.map({'red': 0, 'blue': 1})
Run Code Online (Sandbox Code Playgroud)
我得到的结果如下:
name value
0 0.0 22
1 NaN 44
2 1.0 66
Run Code Online (Sandbox Code Playgroud)
在该列中,orange变为NaN
替换值的最佳方法是什么?
我不想使用df.name.str.replace(..)很多次来替换很多值。在我的真实数据中,一列中有 10 个值需要替换。谢谢。
我有一个数据集,其中的#标签列包含可变数量的#标签,并用分隔;。例如:
id hashtags
1 #apple;#peach
2 #apple
3 #pear;#orange;#banana
Run Code Online (Sandbox Code Playgroud)
我需要做的是将列分开并将其转换为整洁的数据。因此,每一行都包含ID和一个单独的#标签。
id hashtag
1 #apple
1 #peach
2 #apple
3 #pear
3 #orange
3 #banana
Run Code Online (Sandbox Code Playgroud)
我可以使用下面的循环来做到这一点。
library(tidyverse)
df = data.frame(id=1:3, hashtags=c("#apple;#peach", "#apple", "#pear;#orange;#banana"))
dat = data.frame()
for (i in 1:nrow(df)) {
dt = data.frame(id = df$id[i],
hashtag = str_split(df$hashtags[i], ';')[[1]])
dat = bind_rows(dat, dt)
}
Run Code Online (Sandbox Code Playgroud)
但是我认为上述方法不是一个好的解决方案。当我有一个非常大的数据集(我的实际数据)时,我发现它非常慢。
有没有人有更好,更快的方法来实现这一目标?请注意,每个ID的#标签数量变化很大。tidyr::separate似乎不适用于这里。非常感谢。
我需要从 SQL Server 的数据库表中以两位数的形式提取月份。
SELECT
Cast(datepart(month, prod_date) as nvarchar(10))
FROM myTbl
Run Code Online (Sandbox Code Playgroud)
我得到了什么:
1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12
Run Code Online (Sandbox Code Playgroud)
我需要的:
01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12
Run Code Online (Sandbox Code Playgroud)
实现这一目标的最佳方法是什么?
r ×7
python ×4
dplyr ×2
pandas ×2
shiny ×2
docker ×1
dt ×1
forecasting ×1
heatmap ×1
keras ×1
pheatmap ×1
purrr ×1
shiny-server ×1
sql ×1
sql-server ×1
statsmodels ×1
stringr ×1
tidyr ×1
tidyverse ×1
time-series ×1