我在ggplot2包中有一个时间序列图,我已经执行了移动平均线,我想将移动平均值的结果添加到时间序列图中.
数据集样本(p31):
ambtemp dt -1.14
2007-09-29 00:01:57
-1.12 2007-09-29 00:03:57 -1.33
2007-09-29 00:05:57
-1.44 2007-09-29 00:07:57
-1.54 2007-09-29 00:09:57
-1.29 2007-09-29 00:11:57
时间序列演示的应用代码:
Require(ggplot2)
library(scales)
p29$dt=strptime(p31$dt, "%Y-%m-%d %H:%M:%S")
ggplot(p29, aes(dt, ambtemp)) + geom_line() +
scale_x_datetime(breaks = date_breaks("2 hour"),labels=date_format("%H:%M")) + xlab("Time 00.00 ~ 24:00 (2007-09-29)") + ylab("Tempreture")+
opts(title = ("Node 29"))
Run Code Online (Sandbox Code Playgroud)
时间序列演示的样本
移动平均线图样本
预期结果的样本
挑战在于时间序列数据ov =从数据集中获得,其中包括时间戳和温度,但移动平均数据仅包括平均列而不是时间戳,并且拟合这两者可能导致不一致.
我想通过时间戳执行移动平均线.我有两列:温度和时间戳(时间 - 日期),我想基于每15分钟的连续温度观察来执行移动平均.换句话说,选择数据以基于15分钟时间间隔执行平均.而且,对于不同的时间序列,可以具有不同数量的观察.我的意思是所有窗口大小相等(15分钟),但每个窗口中可能有不同数量的观察.例如:对于第一个窗口,我们必须计算n个观测值的平均值,而对于第二个窗口,计算n + 5观测值的平均值.
数据样本:
ID Timestamps Temperature 1 2007-09-14 22:56:12 5.39 2 2007-09-14 22:58:12 5.34 3 2007-09-14 23:00:12 5.16 4 2007-09-14 23:02:12 5.54 5 2007-09-14 23:04:12 5.30 6 2007-09-14 23:06:12 5.20 7 2007-09-14 23:10:12 5.39 8 2007-09-14 23:12:12 5.34 9 2007-09-14 23:20:12 5.16 10 2007-09-14 23:24:12 5.54 11 2007-09-14 23:30:12 5.30 12 2007-09-14 23:33:12 5.20 13 2007-09-14 23:40:12 5.39 14 2007-09-14 23:42:12 5.34 15 2007-09-14 23:44:12 5.16 16 2007-09-14 23:50:12 5.54 17 2007-09-14 23:52:12 5.30 18 2007-09-14 23:57:12 …
我有一个大型数据集,我将在R软件中进行一些分析.虽然我无法将数据正确导入R.
我收到此错误:
Error in postgresqlNewConnection(drv, ...) : RS-DBI driver: (could not connect User@local on dbname "Intel"
我使用PostgreSQL打开数据并以某种方式管理它.如何将PostgreSQL中的现有数据导入R软件?
我是时间序列分析的新手.我试图找到一个短(1天)温度时间序列的趋势,并尝试不同的近似值.此外,采样频率为2分钟.数据被分配给不同的站点.我将比较不同的趋势,看看它们是否相似.
这样做我面临三个挑战:
Q1 - 我如何提取模式?
Q2 - 我如何量化趋势,因为我将比较趋势属于两个不同的地方?
Q3 - 我什么时候可以说两种趋势相似或不相似?
我有一个数据集,包含几周的观察,频率为2分钟.我想将时间间隔从2分钟增加到5分钟.问题是观察的频率并不总是相同的.我的意思是,从理论上讲,每10分钟就应该进行5次观察,但通常情况并非如此.请告诉我如何根据平均函数以及观察的时间和日期汇总观测结果.换句话说,基于每5分钟的聚合,而观察的数量对于每5分钟的时间间隔是不同的.此外,我有时间戳格式的日期和时间.
示例数据:
1 2007-09-14 22:56:12 5.39
2 2007-09-14 22:58:12 5.34
3 2007-09-14 23:00:12 5.16
4 2007-09-14 23:02:12 5.54
5 2007-09-14 23:04:12 5.30
6 2007-09-14 23:06:12 5.20
Run Code Online (Sandbox Code Playgroud)
预期成绩:
1 2007-09-14 23:00 5.29
2 2007-09-14 23:05 5.34
Run Code Online (Sandbox Code Playgroud) 我想比较两张桌子.如果表2的值放在表2的0.3容差(+0.3和-0.3)中,则称其正常,否则称其为异常.
样本数据:
Table 1.
0.17666667
-0.2413333
-0.179666
0.182437
0.012229
0.127333
-0.1180
0.8873
1.24100
1.5213
Table 2.
-1.6
-0.5
-0.4
-0.4
-0.2
2.5
0.6
2.2
2.3
1.3
Run Code Online (Sandbox Code Playgroud)
第一行的预期结果:
如果0.17666667** - 0.3**< - 1.6 <0.17666667**+ 0.3**
结果师范大学 否则异常
我的数据集包含以空格分隔的单独的年,月,日,小时,分钟和第二列:
+-------------------+
|2007|09|28|21|14|06|
|2007|09|28|21|14|06|
|2007|09|28|21|14|06|
|2007|09|28|21|14|06|
|2007|09|28|21|14|06|
+-------------------+
Run Code Online (Sandbox Code Playgroud)
我想在时间戳数据类型下将它们集成为单个列.我在timestamp data-type中创建了一个新列,并通过以下代码更新列:
Update s2
set dt = year || '-' || month || '-' || day
|| ' ' || hour || ':' || min || ':' || second
Run Code Online (Sandbox Code Playgroud)
但我面临以下错误:
ERROR: column "dt" is of type timestamp without time zone but expression is of type text
LINE 1: Update temp set dt= year || '-' || month || '-' || day ||...
^
HINT: You will need to rewrite or cast the …
Run Code Online (Sandbox Code Playgroud) 我有一张桌子,我想用特定值填充一列。
样本表:它包括温度列,该列为空,我想用4.56填充相关列的所有行。
+ ------------ + ------------------ + |温度| dt | + ------------ + ------------------ + | | 9/15/2007 12:12:12 | | | 9/15/2007 12:14:16 | | | 9/15/2007 12:16:02 | | | 9/15/2007 12:18:23 | | | 9/15/2007 12:21:01 | + ------------ + ------------------ +
结果:
+ ------------ + ------------------ + |温度| dt | + ------------ + ------------------ + | 4.56 | 9/15/2007 12:12:12 | | 4.56 | 9/15/2007 12:14:16 | | 4.56 | 9/15/2007 12:16:02 | | 4.56 | …
我想在点ID的情况下在Google地图上绘制坐标:
数据样本:
coordinates id
1 (7.1735, 45.8688) 2
2 (7.17254, 45.8689) 3
3 (7.17164, 45.8692) 4
4 (7.18018, 45.8716) 5
5 (7.17807, 45.8701) 6
6 (7.17723, 45.8692) 7
7 (7.17524, 45.8681) 8
8 (7.18141, 45.8718) 9
9 (7.1793, 45.8702) 10
10 (7.17836, 45.8707) 11
11 (7.17519, 45.8697) 12
12 (7.17938, 45.8708) 13
13 (7.17551, 45.8693) 14
14 (7.17684, 45.8694) 15
15 (7.18099, 45.8726) 17
16 (7.18015, 45.8725) 18
17 (7.18122, 45.8736) 19
18 (7.17491, 45.8692) 20
19 (7.15497, 45.8706) 25 …
Run Code Online (Sandbox Code Playgroud) postgresql ×5
r ×4
timestamp ×3
ggplot2 ×2
sql ×2
time-series ×2
add ×1
aggregation ×1
autofill ×1
compare ×1
fill ×1
ggmap ×1
google-maps ×1
intervals ×1
matching ×1
plot ×1
trend ×1
types ×1