小编RLa*_*ave的帖子

LSTM理解,可能过度适应

在这篇博文之后,我试图了解lstm时间序列预测.

问题是测试数据的结果太好了,我错过了什么？

每次我重新运行适合它似乎变得更好,是否重新使用相同的权重？

结构很简单,input_shape就是这样[1, 1, 1].

即便如此Epochs = 1,它也能很好地学习测试数据.

这是一个可重复的例子:

library(keras)
library(ggplot2)
library(dplyr)

Run Code Online (Sandbox Code Playgroud)

数据创建和准备:

# create some fake time series
set.seed(123)

df_timeseries <- data.frame(
  ts = 1:2500,
  value = arima.sim(list(order = c(1,1,0), ar = 0.7), n = 2500)[-1] # fake data
)
#plot(df_timeseries$value, type = "l")

# first order difference
diff_serie <- diff(df_timeseries$value, differences = 1)

# Lagged data ---
lag_transform <- function(x, k= …

Run Code Online (Sandbox Code Playgroud)

r lstm keras

RLa*_*ave

2018 09-12

7
推荐指数

0
解决办法

158
查看次数

脚注自动编号？

R-Markdown（或更具体地说，bookdown）有没有办法自动给脚注编号，就像它已经为数字所做的那样？我正在处理一本书长度的项目，每次添加或删除脚注时不必重新编号所有脚注会很方便。

r r-markdown

Tod*_*gel

2018 08-30

5
推荐指数

1
解决办法

562
查看次数

未来警告与seaborn中的distplot

每当我尝试使用distplot时seaborn,我都会显示此警告,而我似乎无法弄清楚我做错了什么,对不起,如果这很简单的话.

警告:

FutureWarning:不推荐使用非元组序列进行多维索引; 用arr[tuple(seq)]而不是arr[seq].将来,这将被解释为数组索引 arr[np.array(seq)],这将导致错误或不同的结果.return np.add.reduce(sorted [indexer]*weights,axis = axis)/ sumval

这是一个可重复的例子:

import numpy as np 
import pandas as pd 
import random

import seaborn as sns

kde_data = np.random.normal(loc=0.0, scale=1, size=100) # fake data
kde_data = pd.DataFrame(kde_data)
kde_data.columns = ["value"]
#kde_data.head()

Run Code Online (Sandbox Code Playgroud)

现在,情节是正确的,但我继续得到warning上述并使用arr[tuple(seq)]而arr[seq]不是帮助我.

sns.distplot(kde_data.value, hist=False, kde=True)

Run Code Online (Sandbox Code Playgroud)

我正在研究Jupyter,这是模块版本:

seaborn==0.9.0
scipy==1.1.0
pandas==0.23.0
numpy==1.15.4

Run Code Online (Sandbox Code Playgroud)

python plot warnings seaborn

RLa*_*ave

2018 12-17

5
推荐指数

1
解决办法

1299
查看次数

dplyr::end_with 和区分大小写

我正在尝试选择以大写结尾的所有变量"T"。

这是一个例子。

df <- data.frame(xt = c(1, 2, 3, 4, 5),
                 yT = c('a', 'b', 'c', 'd', 'e'),
                 zT = c(1, 1, 0, 0, 1))`

df %>% select(ends_with("T"))

Run Code Online (Sandbox Code Playgroud)

结果：

我的问题是如何区分ends_with大小写。

r dplyr

ron*_*zen

2019 02-11

5
推荐指数

1
解决办法

1736
查看次数

R中的波浪号(〜)运算符

根据R文档:〜运算符用于公式中以分离公式的右侧和左侧.右侧是自变量,左侧是因变量.我知道什么时候〜用在lm()包中.然而,以下是什么意思？

x~ 1

Run Code Online (Sandbox Code Playgroud)

右边是1.它是什么意思？可以是任何其他数字而不是1吗？

r formula tilde

use*_*419

2018 12-17

4
推荐指数

1
解决办法

1095
查看次数

如何基于多对一关系过滤 Highchart 图数据？

我有这个Django应用程序，我使用 Highchart 显示一些数据（这里只是一个例子）。

我有两个单独的视图，一个视图在Product表上执行过滤器（除其他外），另一个视图从History表构建 Json以“传递”到绘图的 AJAX 函数（实际数据非常重）。

数据基于History我拥有的表格product_id, year, quantity（我想显示随时间变化的数量）。

在我的模型我也有一个表Products与products, category（每个产品都有一个类别，多个产品可以共享相同的类别）。

这两个表与字段是一对多的关系product。

在我的模板中，我希望用户能够products按category字段过滤（即：过滤类别为“A”的产品），并且此过滤器还应更新图表（即：我只想查看“A”类产品）。

在我的代码下面，我尝试了很多尝试，但到目前为止都没有奏效。

请让我知道代码是否包含您需要的所有信息，我已尝试仅获取必要信息。

模型.py

class Products(models.Model):
    product = models.TextField(primary_key=True)
    category = models.TextField(blank=True,null=True)
    
    # ...
    
class HistoryProducts(models.Model):
    product_id = models.ForeignKey(Products)
    year = models.TextField(blank=True, null=True)
    quantity = models.DecimalFeld(..)
    
    # ...

Run Code Online (Sandbox Code Playgroud)

过滤器.py

import django_filters
class ProductsFilter(django_filters.FilterSet):
    category_contains = CharFilter(field_name='category', lookup_expr='icontains') 
    class Meta:
         model = Products
         fields = ['category']

Run Code Online (Sandbox Code Playgroud)

视图.py

def …

Run Code Online (Sandbox Code Playgroud)

javascript python django jquery

RLa*_*ave

2020 07-02

4
推荐指数

1
解决办法

366
查看次数

如何自定义包“randomForest”生成的重要性图

重要性图：

我想将 y 轴文本向右对齐，并且还想根据不同的变量组为变量着色。例如柠檬烯和瓦伦烷，a-Selinene 和 g-Selinen 分别在同一组中。

但是我在包 "randomForest" 中找不到任何用于自定义绘图的代码。您对定制有什么建议吗？谢谢！

r random-forest

Yua*_*guo

2018 09-06

2
推荐指数

1
解决办法

6742
查看次数

为什么表达式"1"== 1评估为TRUE？

"1"是字符值,其他1是数字.甚至,当我尝试执行下面的行时,它给了我真实.

as.character("0")==as.numeric(0)

Run Code Online (Sandbox Code Playgroud)

任何人都可以帮助我理解,为什么？

Rus*_*tel

2019 02-15

2
推荐指数

1
解决办法

71
查看次数

R中的乘法

我有一个庞大的数据集.数据涵盖大约4000个地区.

我需要像这样进行乘法运算:每行中的每个数字应首先乘以相应的列名/值(0或...).然后,应将这些结果数加起来并除以该行中的总数(totaln).

例如,数据是这样的:

region    totan   0    1    2    3    4    5    6    7     .....
1         1346    5    7    3    9    23   24   34   54    .....
2         1256    7    8    4    10   34   2    14   30    .....
3         1125    83   43   23   11   16   4    67   21    .....
4         3211    43   21   67   12   13   12   98   12    .....
5         1111    21   8    9     3   23   13   11    0    .....
....      ....    ..   ..   ..   ..   ..   ..   ..   ..    ..... …

Run Code Online (Sandbox Code Playgroud)

r multiplication

Esh*_*mel

2018 09-13

0
推荐指数

1
解决办法

255
查看次数