下面是一个几乎完全符合我想要的情节的示例代码.根据下面定义的minor_breaks,我想要添加的唯一内容是x轴上的刻度线(与主刻度相同的大小).
df <- data.frame(x = c(1900,1950,2000), y = c(50,75,60))
p <- ggplot(df, aes(x=x, y=y))
p + geom_line() +
scale_x_continuous(minor_breaks = seq(1900,2000,by=10), breaks = seq(1900,2000,by=50), limits = c(1900,2000), expand = c(0,0)) +
scale_y_continuous(breaks = c(20,40,60,80), limits = c(0,100)) +
theme(legend.position="none", panel.background = element_blank(),
axis.line = element_line(color='black'), panel.grid.minor = element_blank())
Run Code Online (Sandbox Code Playgroud)
在此先感谢, - .JT
是否有任何R套件具有某种形式的功能,可以根据特定日期的不均匀支付来计算IRR,以进行一次性分配.
例:
df <- data.frame(date = c(as.Date("2010-1-24"), as.Date("2011-5-6"), as.Date("2012-3-24")), pmts=c(-2000,-1000,-800))
today <- as.Date("2012-7-25")
lumpsum <- 4580
Run Code Online (Sandbox Code Playgroud)
我正在寻找一种简单的方法来计算今天收到的4580美元的回报率,以换取上面定义的付款时间表.
在此先感谢, - .JT
我是一个有空间数据的完整新手.我有以下代码成功绘制有界地图.我想补充一下,data.frame存储点.我提前道歉,因为无法从OpenStreetMap文档中找到这个...下面的代码:
library(OpenStreetMap)
stores <- data.frame(name=c("Commercial","Union","Bedford"),
longitude=c(-70.25042295455933,-70.26050806045532,-70.27726650238037),
latitude=c(43.657471302616806,43.65663299041943,43.66091757424481))
lat <- c(43.68093,43.64278)
lon <- c(-70.29548,-70.24097)
portland <- openmap(c(lat[1],lon[1]),c(lat[2],lon[2]),zoom=15,'osm')
plot(portland,raster=TRUE)
#can't figure out what to put here.
Run Code Online (Sandbox Code Playgroud)
我怀疑商店的格式不适合空间数据.
我想知道是否有一种更简洁的方式,而不仅仅是虚拟编码月(例如,isJan,isFeb ......),以获得更有意义的自变量名称(在拦截下).我的数据集相当大,所以我在这里模拟了一个简单的数据集.
#create simulated data set with sales, and date
sales <- rnorm(1000, mean = 1000, sd = 40)
dates <- seq(from = 14610, to = 15609)
data <- cbind(sales, dates)
#regression with months
model <- lm(sales ~ months(dates))
summary(model)
Run Code Online (Sandbox Code Playgroud)
我想拦截标签显示他们引用的实际月份...目前我的输出看起来像这样:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 999.1934 1.2673 788.432 <2e-16 ***
months(dates).L -4.9537 4.5689 -1.084 0.2785
months(dates).Q -6.4931 4.4211 -1.469 0.1422
months(dates).C -5.5078 4.4180 -1.247 0.2128
months(dates)^4 2.3713 4.4864 0.529 0.5972
months(dates)^5 -1.7749 4.4605 -0.398 0.6908
months(dates)^6 1.5774 …Run Code Online (Sandbox Code Playgroud) 在布置小提琴图时,是否有一种简单的方法可以忽略零计数类别。在下面的示例中,没有 'Yes:Red' 和 'No:Green' 的情况,但 violinplot 仍然绘制了“缺失”类别。我可以理解为什么这应该是默认行为,但是有什么方法可以改变色调中使用的因素来抑制它并删除空白?
df = pd.DataFrame(
{'Success': 50 * ['Yes'] + 50 * ['No'],
'Category': 25 * ['Green'] + 25 * ['Blue'] + 25 * ['Green'] + 25 * ['Red'],
'value': np.random.randint(1, 25, 100)}
)
sns.violinplot(x='Success', y='value', hue='Category', data=df)
plt.show()
Run Code Online (Sandbox Code Playgroud)
提前致谢。
在下面的示例中,事件开始定义为“值”的先前值大于等于90并且当前值小于90。事件结束表示当前值小于90而下一个值大于等于90。 。
sequential_index <- seq(1,10)
values <- c(91,90,89,89,90,90,89,88,90,91)
df <- data.frame(sequential_index, values)
Run Code Online (Sandbox Code Playgroud)
从上面的示例中的df看,第一个事件发生在观察值3-4,第二个事件发生在观察值7-8。我试图,无济于事,在上面的数据框中添加一个“事件”列,看起来像这样:
sequential_index values events
1 1 91 NA
2 2 90 NA
3 3 89 1
4 4 89 1
5 5 90 NA
6 6 90 NA
7 7 89 2
8 8 88 2
9 9 90 NA
10 10 91 NA
Run Code Online (Sandbox Code Playgroud)
我的数据集很大,我正在尝试避免for循环。
在此先感谢-jt