如何使用randomForest具有观察权重的R 包?我知道这个包里没有这样的选择.我有两个问题:
使用randomForest包有没有解决这个问题的方法?此刻我正在从权重数据中抽取样本,因此我至少可以模拟它:
m = dim(data)[1]
sample(data, m, replace=TRUE, prob=weights)
Run Code Online (Sandbox Code Playgroud)
它有其他(更好的)解决方案吗?
是否有任何替代randomForest方案.我找到了party包(cforest),但它在内存管理方面很糟糕(或者我不能像使用randomForest包那样使用它).我有大约200k观测值和30-40个变量.
编辑:
很抱歉没有澄清细节.我正在使用randomForest包来回归问题(不是分类).这是一个时间序列,每个观察都有它的重量.稍后,此权重用于确定测试观察的模型性能.y变量是连续的.
我想知道为什么这个框架(QCodo)几乎被遗忘并且完全不受欢迎.
几年前我开始使用它,这是唯一能让我使用PHP的东西.是的...它的发展陷入困境(这就是为什么现在有更多活跃的分支Qcubed)但它仍然是非常好的软件.
它的主要优点:
从那时起,我想成为时尚和检查Django但我不能写正常的基于请求的Web应用程序(它只是感觉不对).
不信?chess.com是用它写的,当然还有很多其他的.
我的两个问题是:
谢谢
您好,我想知道是否有任何已知的方法可以消除数学公式中不必要的括号。我问这个问题的原因是我必须最小化这样的公式长度
if((-if(([V].[6432])=0;0;(([V].[6432])-([V].[6445]))*(((([V].[6443]))/1000*([V].[6448])
+(([V].[6443]))*([V].[6449])+([V].[6450]))*(1-([V].[6446])))))=0;([V].[6428])*
((((([V].[6443]))/1000*([V].[6445])*([V].[6448])+(([V].[6443]))*([V].[6445])*
([V].[6449])+([V].[6445])*([V].[6450])))*(1-([V].[6446])));
Run Code Online (Sandbox Code Playgroud)
它基本上是 sql select 语句的一部分。它不能超过 255 个字符,而且我无法修改生成此公式的代码(基本上是一个黑盒子;))如您所见,许多括号都是无用的。更不用说以下事实:
((a) * (b)) + (c) = a * b + c
Run Code Online (Sandbox Code Playgroud)
所以我想保持括号、乘/除、加/减的运算顺序。
我用 VB 工作,但任何语言的解决方案都可以。
我发现了一个相反的问题(在表达式中添加括号)问题。
我真的认为这可以在不进行大量解析的情况下完成。但似乎某些解析器将遍历表达式并将其保存在表达式树中是不可避免的。
我很擅长解析(显然).我正在使用LEPL库来解析一些标记语言.
我对这段代码有疑问(为了清楚起见,我省略了细节).
from lepl import *
a = Literal('a')[0:,...] # 0 or more, join the result
b = Literal('b')
c = (a | b)[0:]
print c.parse("abaabaaab")
Run Code Online (Sandbox Code Playgroud)
最后一行应该给我['a','b','aa','b','aaa','b']
没有错误,但它挂起(无限递归可能?).有人能指出我正确的方向吗?
我可以这样做
from lepl import *
a = Literal('a')
b = Literal('b')
c = (a | b)[0:]
print c.parse("abaabaaab")
Run Code Online (Sandbox Code Playgroud)
但是a不会被分组.
algorithm ×1
expression ×1
frameworks ×1
lepl ×1
math ×1
orm ×1
parsing ×1
php ×1
python ×1
r ×1