在这篇博文之后,我试图了解lstm时间序列预测.
问题是测试数据的结果太好了,我错过了什么?
每次我重新运行适合它似乎变得更好,是否重新使用相同的权重?
结构很简单,input_shape就是这样[1, 1, 1].
即便如此Epochs = 1,它也能很好地学习测试数据.
这是一个可重复的例子:
library(keras)
library(ggplot2)
library(dplyr)
Run Code Online (Sandbox Code Playgroud)
数据创建和准备:
# create some fake time series
set.seed(123)
df_timeseries <- data.frame(
ts = 1:2500,
value = arima.sim(list(order = c(1,1,0), ar = 0.7), n = 2500)[-1] # fake data
)
#plot(df_timeseries$value, type = "l")
# first order difference
diff_serie <- diff(df_timeseries$value, differences = 1)
# Lagged data ---
lag_transform <- function(x, k= …Run Code Online (Sandbox Code Playgroud) R-Markdown(或更具体地说,bookdown)有没有办法自动给脚注编号,就像它已经为数字所做的那样?我正在处理一本书长度的项目,每次添加或删除脚注时不必重新编号所有脚注会很方便。
每当我尝试使用distplot时seaborn,我都会显示此警告,而我似乎无法弄清楚我做错了什么,对不起,如果这很简单的话.
警告:
FutureWarning:不推荐使用非元组序列进行多维索引; 用
arr[tuple(seq)]而不是arr[seq].将来,这将被解释为数组索引arr[np.array(seq)],这将导致错误或不同的结果.return np.add.reduce(sorted [indexer]*weights,axis = axis)/ sumval
这是一个可重复的例子:
import numpy as np
import pandas as pd
import random
import seaborn as sns
kde_data = np.random.normal(loc=0.0, scale=1, size=100) # fake data
kde_data = pd.DataFrame(kde_data)
kde_data.columns = ["value"]
#kde_data.head()
Run Code Online (Sandbox Code Playgroud)
现在,情节是正确的,但我继续得到warning上述并使用arr[tuple(seq)]而arr[seq]不是帮助我.
sns.distplot(kde_data.value, hist=False, kde=True)
Run Code Online (Sandbox Code Playgroud)
我正在研究Jupyter,这是模块版本:
seaborn==0.9.0
scipy==1.1.0
pandas==0.23.0
numpy==1.15.4
Run Code Online (Sandbox Code Playgroud) 我正在尝试选择以大写结尾的所有变量"T"。
这是一个例子。
df <- data.frame(xt = c(1, 2, 3, 4, 5),
yT = c('a', 'b', 'c', 'd', 'e'),
zT = c(1, 1, 0, 0, 1))`
df %>% select(ends_with("T"))
Run Code Online (Sandbox Code Playgroud)
结果:
我的问题是如何区分ends_with大小写。
根据R文档:〜运算符用于公式中以分离公式的右侧和左侧.右侧是自变量,左侧是因变量.我知道什么时候〜用在lm()包中.然而,以下是什么意思?
x~ 1
Run Code Online (Sandbox Code Playgroud)
右边是1.它是什么意思?可以是任何其他数字而不是1吗?
我有这个Django应用程序,我使用 Highchart 显示一些数据(这里只是一个例子)。
我有两个单独的视图,一个视图在Product表上执行过滤器(除其他外),另一个视图从History表构建 Json以“传递”到绘图的 AJAX 函数(实际数据非常重)。
数据基于History我拥有的表格product_id, year, quantity(我想显示随时间变化的数量)。
在我的模型我也有一个表Products与products, category(每个产品都有一个类别,多个产品可以共享相同的类别)。
这两个表与字段是一对多的关系product。
在我的模板中,我希望用户能够products按category字段过滤(即:过滤类别为“A”的产品),并且此过滤器还应更新图表(即:我只想查看“A”类产品)。
在我的代码下面,我尝试了很多尝试,但到目前为止都没有奏效。
请让我知道代码是否包含您需要的所有信息,我已尝试仅获取必要信息。
class Products(models.Model):
product = models.TextField(primary_key=True)
category = models.TextField(blank=True,null=True)
# ...
class HistoryProducts(models.Model):
product_id = models.ForeignKey(Products)
year = models.TextField(blank=True, null=True)
quantity = models.DecimalFeld(..)
# ...
Run Code Online (Sandbox Code Playgroud)
import django_filters
class ProductsFilter(django_filters.FilterSet):
category_contains = CharFilter(field_name='category', lookup_expr='icontains')
class Meta:
model = Products
fields = ['category']
Run Code Online (Sandbox Code Playgroud)
def …Run Code Online (Sandbox Code Playgroud) 重要性图:
我想将 y 轴文本向右对齐,并且还想根据不同的变量组为变量着色。例如柠檬烯和瓦伦烷,a-Selinene 和 g-Selinen 分别在同一组中。
但是我在包 "randomForest" 中找不到任何用于自定义绘图的代码。您对定制有什么建议吗?谢谢!
"1"是字符值,其他1是数字.甚至,当我尝试执行下面的行时,它给了我真实.
as.character("0")==as.numeric(0)
Run Code Online (Sandbox Code Playgroud)
任何人都可以帮助我理解,为什么?
我有一个庞大的数据集.数据涵盖大约4000个地区.
我需要像这样进行乘法运算:每行中的每个数字应首先乘以相应的列名/值(0或...).然后,应将这些结果数加起来并除以该行中的总数(totaln).
例如,数据是这样的:
region totan 0 1 2 3 4 5 6 7 .....
1 1346 5 7 3 9 23 24 34 54 .....
2 1256 7 8 4 10 34 2 14 30 .....
3 1125 83 43 23 11 16 4 67 21 .....
4 3211 43 21 67 12 13 12 98 12 .....
5 1111 21 8 9 3 23 13 11 0 .....
.... .... .. .. .. .. .. .. .. .. ..... …Run Code Online (Sandbox Code Playgroud)