在我的Windows PC上,我安装了anaconda,当我打开一个jupyter笔记本时,它在Internet Explorer中打开,但我想用Chrome代替.有谁知道如何实现这一目标?
我是python的新手,我开始自学如何使用此链接中的练习在jupyter上使用pandas:
我有一个问题,当我在Jupyter中执行时,1.3的绘图不会出现,我只得到以下输出:
matplotlib.axes._subplots.AxesSubplot at 0x8ad24a8>"
Run Code Online (Sandbox Code Playgroud)
但是,当我在Spyder中运行相同的代码时,它确实出现了.有人知道为什么吗?这是我的代码:
import pandas as pd
import os
fixed_df = pd.read_csv('bikes.csv', sep=';', encoding='latin1', parse_dates=['Date'], dayfirst=True, index_col='Date')
fixed_df['Berri1'].plot()
Run Code Online (Sandbox Code Playgroud) 如何从数据库'x'的同一列中返回所有可能值组合的列表?例如,我有:
col 1,
1
2
3
4
Run Code Online (Sandbox Code Playgroud)
我想返回所有可能组合的列表,例如
1,2
1,3
1,4
2,3,
2,4
3,4
Run Code Online (Sandbox Code Playgroud)
....
我经常在R中编码,我才意识到将手向下移动到箭头键然后再回到键盘上的字母是多么痛苦.在Rstudio中,我必须定期这样做,因为工作室会自动完成某些synax(如括号和引号),然后我必须按箭头键移出括号(或引号),然后删除任何可能的让R为我完成语法的优势.这对我来说是非常昂贵的,因为我是左撇子.是否有一个更接近字母键的箭头键快捷键?
当我使用dplyr中的select函数时,它不起作用,并给我一个错误,指出我要选择的列名是未使用的参数。但是,如果我在函数调用之前指定dplyr,例如s:“ dplyr :: select”,则它可以正常工作:
这是一个示例df:
sampledf <- structure(list(CRN = c(5497L, 6515L, 7248L, 36956L, 37021L),
varA = structure(c(2L, 2L, 2L, 2L, 2L), .Label = c("A",
"B"), class = "factor"), varB = c(NA_integer_, NA_integer_,
NA_integer_, NA_integer_, NA_integer_), VarC = c(NA, NA,
NA, NA, 2L), varD = c(NA_integer_, NA_integer_,
NA_integer_, NA_integer_, NA_integer_), varE = c(1L, 1L, 4L, NA, NA)), .Names = c("CRN",
"varA", "varB", "varC", "varD", "varE"), row.names = c(NA, 5L), class = "data.frame")
Run Code Online (Sandbox Code Playgroud)
这会产生错误:
sample_error <- select(sampledf, varA)
Run Code Online (Sandbox Code Playgroud)
select(sampledf,varA)中的错误:未使用的参数(varA)
这有效:
sample_working <- …Run Code Online (Sandbox Code Playgroud) 我正在使用插入符号运行弹性净正则化glmnet。
我将值序列传递给trainControlalpha和lambda,然后执行repeatedcv以获得alpha和lambda的最佳调整。
这是一个示例,其中alpha和lambda的最佳调整分别为0.7和0.5:
age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7, 6, 8, 11, 11, 6, 2, 10, 14, 7, 12, 6, 9, 10, 14, 7)
gender <- make.names(as.factor(c(1, 0, 1, 1, 1, 0, 1, 0, 0, 1, 1, 0, 1, 1, 0, 0, 1, 0, 0, 1, 1, 0, 0, 1)))
bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91, 0.29, 0.88, 0.83, 0.48, 0.99, 0.80, 0.85,
0.50, 0.91, 0.29, …Run Code Online (Sandbox Code Playgroud) 我想创建一个空数据框,其中列名来自字符向量。
例如,如果这是我的向量:
vec <- letters[1:3]
Run Code Online (Sandbox Code Playgroud)
我想创建一个空数据框,如下所示:
df <- tibble('a' = character(), 'b' = character(), 'c' = character())
Run Code Online (Sandbox Code Playgroud)
但是,我想遍历向量中的项目以填充数据框名称,而不必手动指定每个项目。实际上,我的向量有 40 多个名称。
我已经尝试了以下方法,但它们不起作用:
df <- tibble(vec[1:3])
df <- tibble(vec)
df <- tibble(for (i in 1:3){
vec[i]
})
Run Code Online (Sandbox Code Playgroud)
对此的任何帮助将不胜感激!
如何将列entires作为参数传递给函数,然后创建一个新列,它是另外两个函数的函数?例如,利用这个优秀的功能将月份添加到日期,并采用此示例数据框:
df <- structure(
list(
date = structure(
c(
17135,
17105,
17105,
17074,
17286,
17317,
17317,
17347,
17105,
17317
),
class = "Date"
),
monthslater = c(10,
11, 13, 14, 3, 3, 3, 3, 4, NA)
),
.Names = c("date", "monthslater"),
row.names = c(NA, 10L),
class = "data.frame"
)
Run Code Online (Sandbox Code Playgroud)
我想创建一个新的列,我通过从列项date,并monthslater 以功能add.months我本来以为像这样的工作:
df$newdate <- add.months(df$date, df$monthslater)
Run Code Online (Sandbox Code Playgroud)
但事实并非如此.
该函数的完整代码是:
add.months <- function(date,n) seq(date, by = paste(n, "months"), length = 2)[2]
Run Code Online (Sandbox Code Playgroud) 我想在一列中,在另一个分类变量的每个级别内重新排列NA的位置.例如,使用此数据框:
df <- data.frame(fact=c(1,1,1,2,2,2), id=rep(1:6), value=c(NA,44,23,NA,NA,76))
Run Code Online (Sandbox Code Playgroud)
我想改变一个新的列,如:
df$newvar <= c(44,23,NA,76,NA,NA)
Run Code Online (Sandbox Code Playgroud)
我原以为以下方法可行,但不会:
dfb <- df %>% group_by(fact) %>% mutate(newvar = df$value[order(is.na(df$value))])
Run Code Online (Sandbox Code Playgroud)
有关如何做到这一点的任何想法?
我有一个折线图,我想重新排序因子在图例中出现的方式.我试过了,scale_fill_discrete但它没有改变顺序.这是我的问题的模拟:
df <- data.frame(var1=c("F", "F", "F", "B", "B", "B"),
var2=c("levelB", "levelC", "levelA"),
value=c("2.487585", "2.535944", "3.444764", "2.917308", "2.954155","3.739049"))
p <- ggplot(data=df, aes(x=var1, y=value,
group=var2, colour=var2, shape = var2)) +
geom_line(size = 0.8) +
geom_point()+
xlab("var1") + ylab("Value") +
scale_x_discrete(limits=c("F","B")) +
theme(legend.title = element_text(size=12)) +
theme(legend.text = element_text(size=10)) +
scale_fill_discrete(breaks=c("levelB","levelC","levelA")) +
theme(title = element_text(size=12)) +
blank + scale_color_manual(values=c("green2", "red", "black")) +
theme(legend.key = element_blank())
p
Run Code Online (Sandbox Code Playgroud)
这创造了这个:
我想一切都保持完全一致,除了传奇,在这里我想的顺序改变levelB,然后levelC再levelA.我猜ggplot2是按字母顺序命令传说,我想覆盖它.重新排序我的数据框架不起作用,scale_fill_discrete也不会改变它.有任何想法吗?
谢谢!